Google发布Gemini 3 Flash模型:性能超越Pro版,速度与效率显著提升-小互 Google正式发布了Gemini 3 Flash模型,该模型在保持Pro级智能的同时,实现了Flash级速度,性能超越了Gemini 2.5 Pro并达到3倍速度,而成本仅为Pro版的零头。新模型具备博士级逻辑与推理能力,能在处理复杂任务时“自我调节思考时间”,平均可减少30%的token使用量。Gemini 3 Flash在MMMU-Pro多模态理解基准测试以及SWE-bench verified和ARC-AGI-2等测试集中甚至超越了Gemini 3 Pro。该模型现已作为Gemini App和AI Mode in Search的默 …
阅读更多OpenAI 推出全新 AI 浏览器 ChatGPT Atlas for macOS - Sam Altman & 小互 OpenAI 正式发布其首款 AI 优先网络浏览器 ChatGPT Atlas,并率先登陆 macOS 平台。Atlas 将 ChatGPT 从一个独立的网页或应用,转变为一个随处可用的认知层。它能够在用户浏览网页时,实时地理解、总结、提供建议或执行操作任务。Atlas 深度整合了 ChatGPT 的应用生态系统,通过开放 Apps SDK,允许第三方服务直接嵌入。用户可以在对话中直接操作应用,例如 Spotify 或 Zillow,这意味着 ChatGPT 不仅是一个浏览器助手,更是一个跨平台的“服务协调中 …
阅读更多以下是过去四小时内全球AI领域的重要动态: Gary Marcus 反思LLM发展困境及AGI预期 - Gary Marcus AI研究员Gary Marcus近期总结了多项对大型语言模型(LLM)实现通用人工智能(AGI)前景构成打击的进展。他引用了苹果和亚利桑那州立大学(ASU)等机构的论文,证实LLM仍然无法解决分布偏移问题。此外,他指出GPT-5的表现未能达到预期,图灵奖得主Rich Sutton也认同他对LLM的批评。值得关注的是,Andrej Karpathy表示当前AI代理远未成熟,无法胜任人类同事或实习生角色,并预测AGI的实现仍需十年之久。DeepMind的Demis Hassabis也据称驳斥了OpenAI关 …
阅读更多