2025.09.30.20 过去4小时全球AI发生了什么?
智谱AI发布GLM-4.6,国产最强Coding模型比肩Claude Sonnet 4-orange.ai
智谱AI于国庆前夕发布了其最新一代通用AI模型 GLM-4.6,被誉为目前国内最强的Coding模型。该模型在七个权威基准测试中,整体性能表现与 Claude Sonnet 4 基本持平,并超越了前一天发布的 DeepSeek-V3.2-Exp。GLM-4.6的代码能力提升了 27%,上下文窗口扩展至 200K,推理和写作能力也有所增强,并全面适配国产芯片。尤其在前端美学方面,GLM-4.6表现出色,甚至在绘制宝可梦SVG方面超越了Claude 4。此外,Anthropic也发布了地表最强的编码模型 Claude 4.5。作者预告将在国庆期间发布 Claude Code 的保姆级新手入门教程。
OpenAI联合Stripe推出Instant Checkout和Agentic Commerce Protocol-小互
OpenAI与支付巨头Stripe合作,宣布推出集成在 ChatGPT 中的 Instant Checkout(即时结账) 功能。该功能允许用户直接在聊天界面内搜索产品并完成购买,无需跳转外部网页或切换平台。这项创新体验的核心是双方共同制定并开源的底层标准协议——Agentic Commerce Protocol (ACP)。ACP是一个电商开放标准,旨在通过结构化对话,让AI代理(如ChatGPT)与商家系统无缝协作,完成从下单、支付到履约的全流程。对于已使用Stripe的商家,仅需“一行代码”即可启用Agentic Payment,而其他支付平台的商家也可通过Stripe的API或OpenAI定义的Delegated Payment Spec接入,无需重构现有支付系统,大大简化了AI电商的整合难度。
Racine发布CU-1:新型GUI交互模型,显著超越OmniParser-merve
Racine团队近日发布了其新型GUI交互模型 CU-1,该模型专注于精确识别用户界面中的点击位置。根据WebClick基准测试结果显示,CU-1取得了 67.5% 的准确率,远超现有模型如OmniParser的40.7%。这一进步为自动化UI操作和更智能的用户界面交互带来了显著提升,并提供了免费许可。
Replit Deployments:两年深耕,打造强大开发部署平台-Amjad Masad
Replit的CEO Amjad Masad强调,Replit Deployments 经过两年多的持续开发,已经成为一个非常健壮的平台,并且未来还将推出更多新功能。他指出,许多人可能将Replit视为一个“轻松编码”的平台,但实际上它是一个成熟的 集成开发环境(IDE),允许开发者从零开始编写代码并部署应用程序。这表明Replit正在不断强化其作为全面开发和部署解决方案的定位。
Cursor.ai推出浏览器控制Agent,支持截图和UI调试-orange.ai
AI编码助手Cursor现在新增了 浏览器控制 能力。其智能体(Agent)能够执行截图、改进用户界面(UI)以及调试客户端问题。这一早期预览版功能为开发者提供了更强大的自动化和问题解决工具,允许AI直接与浏览器进行交互,从而提升开发效率和应用质量。
美国国家经济研究局(NBER)已发布其“变革性AI经济学研讨会”的视频录音。此次研讨会汇集了全球顶尖研究人员,探讨了AI技术对经济产生的深远影响。这些录音的公开,为研究者和公众提供了深入了解AI经济学前沿洞察的机会。