2025.09.30.12 过去4小时全球AI发生了什么?
在过去四小时内,AI领域迎来多项重要进展,OpenAI 推出了直接集成购物功能的 ChatGPT Merchants,将电商带入对话界面。同时,Anthropic 发布了其新一代模型 Claude Sonnet 4.5,并推出了实验性的实时界面生成功能 “Imagine with Claude”,进一步提升了其在编程和交互方面的能力。此外,Replit 平台的 Agent 3 也创下了新的运行记录。
OpenAI 推出 ChatGPT Merchants 功能,将购物集成至对话界面 - 小互
OpenAI 正式推出 ChatGPT Merchants 功能,将购物体验直接整合进 ChatGPT 的对话窗口,实现“边问边买”。用户现在可以直接在对话中发现商品,并利用“即时结账(Instant Checkout)”功能完成购买。首批接入平台包括 Etsy 和 Shopify 的商家,支付通过 Stripe 的协议完成,支持信用卡、Apple Pay、Google Pay或Stripe Link。OpenAI 计划逐步开放“智能体电商协议(Agentic Commerce Protocol, ACP)”,未来将有更多商家、品牌和零售平台通过标准化的商品目录与 ChatGPT 连接,以获取新的流量入口和更高的转化率。用户还可在 ChatGPT 内查看订单状态并跳转至商家网站进行追踪。此举预示着 ChatGPT 正朝着“超级应用”的方向发展,为商家提供了新的获客渠道。
Anthropic 发布 Claude Sonnet 4.5,性能超越 Opus 4.1 且更具性价比 - 歸藏(guizang.ai)
Anthropic 正式发布了 Claude Sonnet 4.5,据称该模型在价格比 Opus 4.1 便宜 5 倍的情况下,几乎所有测试基准都超越了 Opus 4.1。Sonnet 4.5 显著提升了在智能体编程、计算机使用、数学、研究生水平推理和金融分析等方面的能力,在 SWE-bench Verified 软件工程测试中达到 82% 的准确率,并且能够连续工作长达 30 小时直至任务完成。同时,Claude Code 也进行了升级,增加了新的终端界面、VS Code 插件和“checkpoints”功能,方便用户安全运行大型任务并回滚代码。API 方面也增加了上下文编辑能力和记忆工具。此外,Anthropic 还推出了实验性项目 “Imagine with Claude”,为 MAX 用户提供一个类似电脑桌面的交互界面,能够根据用户要求实时生成前端 UI 和功能。Claude Sonnet 4.5 已在 Claude 开发者平台、Amazon Bedrock 和 Google Cloud Vertex AI 上线。
Replit Agent 3 创造新的 13 小时运行记录 - Amjad Masad
Replit 平台的 Agent 3 创造了一项新的运行记录,成功运行了 13 小时。Amjad Masad 鼓励社区成员继续挑战,目标是实现 24 小时运行。目前 Replit 正在举办一项比赛,邀请用户在太平洋时间周五午夜前提交自己的运行记录,最长运行时间将赢得 1,000 美元的 Replit 积分。此活动旨在推动 Agent 技术的极限,并鼓励开发者进行创新尝试。