OpenAI推出“Apps in ChatGPT”平台及开发者SDK OpenAI近日发布了“Apps in ChatGPT”,将ChatGPT从单纯的聊天工具升级为一个可运行应用的平台。用户现在可以直接在对话界面中调用外部应用,例如利用Zillow查找房产、通过Spotify创建歌单或在Coursera上学习课程,全程无需切换到其他网站或应用。与此同时,OpenAI还面向开发者发布了Apps SDK,允许开发者构建“ChatGPT内的App”,自定义界面并接入自己的后端API(如CRM、数据库、SaaS系统),从而将服务无缝触达数亿ChatGPT用户,开启了一个全新的AI生态入口。 NVIDIA、AMD与OpenAI之间AI交易 …
阅读更多OpenAI发布GPT-5 Pro、Sora 2及Pro API,并公布详细定价-歸藏(guizang.ai) OpenAI已正式推出GPT-5 Pro、Sora 2及Sora 2 Pro API服务。其中,GPT-5 Pro的百万Token输出价格高达120美元。Sora 2的视频生成服务定价为每秒0.1美元,而Sora 2 Pro则为每秒0.3美元。这些新工具,特别是Sora 2,被认为能够将简单的自拍和文字描述转化为电影级别的视频内容,预示着AI创作者时代的到来。同时,业界也在探讨其巨大的经济潜力,例如通过“GDP测试”评估AI代理的经济贡献,以及Sora 2可能为普通用户带来的百万年收入可能性。 AI Token使用量惊 …
阅读更多OpenAI Sora 推出IP版权精细控制与商业化分成模式-Sam Altman OpenAI 正为视频生成模型 Sora 推出两项重要调整。首先,OpenAI 将允许IP版权方对人物角色的创作提供更细粒度的控制,版权方可以精细设定允许/不允许、允许的场景及可能的限制,甚至放开大尺度创作,以促进“互动式粉丝创作”并吸引更多版权方参与。其次,鉴于用户创作量远超预期导致成本上升,OpenAI 计划探索商业化路径,推出收入分享模式,如果用户创作的视频涉及版权方的角色,OpenAI 将与版权方分享相应的收入。Sam Altman 强调团队将像ChatGPT早期一样进行快速迭代,并特别提及日本内容生态的强大创意表现力,暗示日本动漫/角色可 …
阅读更多以下是过去4小时全球AI领域的动态摘要: ChatGPT Pro用户开始灰度测试Sora 2视频生成功能-宝玉 有消息指出,部分ChatGPT Pro用户已开始获得Sora 2视频生成功能的灰度测试权限。目前该功能允许用户生成长达15秒的视频内容,不过生成结果仍处于**“灰度”**或测试阶段。这一进展预示着OpenAI在文本到视频生成技术方面的持续推进,并将高端视频生成能力逐渐开放给更多用户,尽管目前仍未全面上线。 关于AI Agent任务管理的命令行工具讨论-宝玉 有开发者讨论了类似AWS CLI的命令行工具在远程管理云端AI Agent任务中的应用。这类工具,例如Jules,能让开发者通过命令行界面高效管理云端运行的代码和任务, …
阅读更多过去4小时全球AI动态摘要 OpenAI 发布全新多模态生成模型 Sora 2,引领视频生成新时代 OpenAI 正式发布了其多模态生成模型 Sora 2,被誉为视频领域的“GPT-3.5 时刻”。Sora 2 不仅能生成高质量视频,还能同步生成语音和环境音效,并首次支持将用户“插入”视频成为主角。模型亮点包括支持多个镜头的连续生成、更物理真实与可控的世界状态、真人的Cameo登场、以及写实、动漫、电影等多种风格切换。同时,Sora 2 的新版 iOS App 已上线,提供 remix、个性化推荐和青少年保护等功能,目前限美国/加拿大 iOS 用户试用,未来还将开放 API 接入。市场普遍认为,Sora 2 有潜力改变现有视频内容生 …
阅读更多Anthropic的战略方向与Sonnet 4.5的上下文管理能力-宝玉 有观点认为,Anthropic在编程领域虽然取得过成绩,但可能为OpenAI和Google趟了路,目前在编程和Agent方面被追赶甚至超越,其他领域缺乏突出表现,并预测Gemini 3.0发布后可能进一步超越。与此同时,Anthropic新推出的Sonnet 4.5模型在上下文压缩方面展现出显著进步,其**“状态管理”能力**(即模型能有效“记笔记”以保存关键任务信息)被用户称赞,认为这有助于模型在长对话中保持性能,甚至超越了GPT-5在这一方面的表现。 Shopify将整合GPT实现商家商品搜索-歸藏(guizang.ai) Shopify宣布将整合GPT …
阅读更多在过去四小时内,AI领域迎来多项重要进展,OpenAI 推出了直接集成购物功能的 ChatGPT Merchants,将电商带入对话界面。同时,Anthropic 发布了其新一代模型 Claude Sonnet 4.5,并推出了实验性的实时界面生成功能 “Imagine with Claude”,进一步提升了其在编程和交互方面的能力。此外,Replit 平台的 Agent 3 也创下了新的运行记录。 OpenAI 推出 ChatGPT Merchants 功能,将购物集成至对话界面 - 小互 OpenAI 正式推出 ChatGPT Merchants 功能,将购物体验直接整合进 ChatGPT 的对话窗口,实现“边问边买”。用户现在 …
阅读更多DeepSeek发布实验性模型V3.2-Exp,大幅提升长文本推理效率并降低成本-小互 DeepSeek发布了其最新实验性语言模型 DeepSeek-V3.2-Exp,该模型在推理效率和计算成本方面实现了显著提升。V3.2-Exp在整体性能上与V3.1-Terminus持平,但长文本推理效率提高了约一倍,使得其 API价格大幅下降50%。这一突破主要得益于其引入的 稀疏注意力(DSA)机制,该机制能够智能地聚焦文本中的关键部分,从而在不影响输出质量的前提下,显著加快处理速度并减少显存占用,特别适合处理 超过32K tokens 的长文档和对话场景。 Merve Noyan公开分享多模态AI幻灯片,涵盖趋势、模型与工具-merve …
阅读更多Karen Hao在慕尼黑增加一场免费活动 知名作家Karen Hao宣布,除了原定的10月24日售票活动外,她将于10月23日在慕尼黑新增一场免费活动。此次活动由Sheila Beladinejad和Women in AI组织并提供场地资源。此举为更多对AI领域感兴趣的人提供了参与和交流的机会,体现了AI社区的积极互动与知识共享。 FactoryAI CLI新增Gemini支持,效率显著提升 用户@donvito(经Ben Tossell转发)对全新的FactoryAI CLI印象深刻。该工具仅用Sonnet 4就在15分钟内为**@aibackends添加了Gemini支持**,并实现了实时同步。这表明新的CLI工具在集成和开 …
阅读更多腾讯开源生图模型 3.0 亮相,具备强悍文字生成与世界知识理解能力-歸藏(guizang.ai) 腾讯最新开源的生图模型 3.0,参数高达 80B,在美学表现、文字生成与世界知识理解方面取得了显著提升。该模型能够生成包括中文在内的较长文字,支持复杂排版和艺术字体设计,甚至能图解中学几何题,媲美头部图像模型如Banana。虽然目前尚不支持图像编辑功能,但有消息称该能力有望在国庆后上线。其强大的世界知识和推理能力,结合微调潜力,预示着广泛的应用前景。 Google DeepMind Veo 3 达到视觉AI的“GPT-3”时刻-小互 Google DeepMind的研究揭示,Veo 3 在视觉AI领域可能迎来了“GPT-3”时刻。该模 …
阅读更多