以下是过去4小时全球AI领域的重点新闻回顾: Google 推出「Grounding with Google Maps」功能,让Gemini拥有地理空间理解能力-小互 Google 重磅发布「Grounding with Google Maps」功能,将 Gemini 大模型深度整合到 Google Maps 中。这项更新使 Gemini 能够直接访问 Google Maps 拥有的超过2.5亿个实时地理数据,赋予 AI 模型强大的“地理空间理解与推理能力”。现在,AI 不仅能理解文本,还能“理解地理空间”,这意味着它能够回答关于世界各地地点“是什么、在哪儿、有什么、什么时候开门、如何订票、如何到达”等一系列复杂问题。 …
阅读更多2025 人工智能现状报告:OpenAI保持领先,中国AI实力崛起-小互 《2025年人工智能现状报告》揭示,OpenAI 在前沿AI领域仍维持“微弱领先”地位,但竞争态势日益激烈。报告指出,Meta 在开源AI领域的领导力正逐渐削弱,而中国的 DeepSeek、Qwen(通义)、Kimi 等模型在推理和编程任务上已展现出接近 GPT-5 的性能,使其成为“可信赖的全球第二极”。此外,报告强调AI正经历从单纯的“生成内容”到“执行任务、规划目标、验证逻辑”的转型,模型已能分解复杂任务、逐步验证逻辑并自我修正,这被视为“可解释的通用智能雏形”。 Google 推出 Gemini Enterprise:赋能企业级AI助手与自动化- …
阅读更多ServiceNowRSRCH 发布 Apriel-1.5 推理视觉语言模型-merve ServiceNowRSRCH 近期推出了一款名为 Apriel-1.5 的全新推理视觉语言模型,展示了其强大的跨语言理解和推理能力。该模型在一次测试中成功地识别了法文药物标签中的药物相互作用,并用英文给出了结果。此外,它还能对矿物质进行比较,并生成准确的查找表,凸显了其在处理复杂信息和生成结构化数据方面的卓越表现。
阅读更多以下是过去四小时内全球AI领域的主要动态: DeepSeek模型与DS应用差异及用户期望解析-宝玉 宝玉澄清了DeepSeek模型与DS应用之间的区别,指出模型权重是固定的,而DS应用调用搜索引擎的搜索结果可能受到SEO污染影响,这与模型本身无关。同时,许多用户对DeepSeek的不满并非源于模型性能下降,而是因为用户期望值随时间推移而提高,而DeepSeek R1已是近一年前的模型,未能满足当前更高的标准。 Codex专业用户Token使用状态与限制解析-宝玉 宝玉分享了在Codex中通过输入/status命令即可查看Token使用状态的功能。他提到,专业用户虽然有Token用量限制,但在正常使用强度下通常不易达到上限。以他个人为 …
阅读更多Anthropic发布Claude Sonnet 4.5,编程能力和智能体特性显著提升-宝玉 Anthropic最新推出的Claude Sonnet 4.5模型在编程能力和智能体任务处理方面实现了重大突破。第三方评测显示,Sonnet 4.5速度比Opus 4.1快至少50%,且具备更强的可控性、超长上下文处理能力以及更高的稳定性。它在SWE-bench基准测试中刷新了业界最高水平,并引入了全新的记忆工具(Beta版)API。此外,Sonnet 4.5在自主运行时间上可超过30小时,且在OSWorld计算机使用基准测试中表现出色,沟通风格也更为精炼自然。 Reachy Mini机器人集成OpenAI GPT-4o,实现多模态交互新 …
阅读更多Hyper3D Rodin Gen-2:一款可“无限炸裂”的SOTA 3D模型-orange.ai 一款名为 Hyper3D Rodin Gen-2 的图生3D模型在云栖大会上亮相,展示了其独特的“组件分解”能力,支持3D模型的无限炸裂式拆解,将复杂模型分解为简单组件。这项技术显著提升了3D模型的精度和可用性,尤其适用于精细化3D打印、高精度游戏、影视制作及工业设计等领域。该模型被认为是当前3D模型效果的SOTA(State-Of-The-Art)。用户可通过提供的链接尝试该模型。 商业本质:AI作为扩展与利用的双重性-向阳乔木 有观点指出,一切商业活动都围绕着利用或解除人类的各种限制和短板。技术进步如显微镜、望远镜、汽车、飞机和 …
阅读更多FactoryAI 的 Droid CLI 赋能 GML 4.5 与 GPT-5 结合 Ben Tossell 转发消息称,FactoryAI 的 Droid 命令行工具现已支持运行 Zai.org 的 GML 4.5 模型(被视为 Sonnet 4 的替代方案)。用户反馈 Droid 在代码生成方面表现出色,甚至超越了 Claude Code、Amp、Warp、Cline 和 Codex 等工具。这一进展预示着 GML 4.5 与 GPT-5 高级功能的结合,有望在代码生成和 AI 开发领域提供强大的协同效应,为开发者带来更高效、更强大的编程体验。 OpenAI 被指秘密部署 GPT-5-Chat-Safety 模型 有消息指 …
阅读更多谷歌发布具身智能模型 Gemini Robotics 1.5 - 歸藏(guizang.ai) 谷歌近日推出了专门用于具身智能的 Gemini Robotics 1.5 模型系列,其中包含 Gemini Robotics 1.5 和 Gemini Robotics-ER 1.5 两款协同模型。Gemini Robotics 1.5 作为视觉-语言-动作 (VLA) 模型,负责将高层指令转化为机器人精确的运动指令,并通过思考过程提高透明度,加速跨形态技能学习。Gemini Robotics-ER 1.5 则作为视觉-语言模型 (VLM),充当机器人的高级大脑,能够进行物理世界推理、原生调用数字工具并制定详细的多步骤计划。这两款模型 …
阅读更多以下是过去4小时全球AI领域的重要动态: AI对放射科医生工作影响的深度分析-Andrej Karpathy Andrej Karpathy分享了一篇关于“AI不会取代放射科医生”的文章,指出对AI在就业市场影响的许多预测都过于天真。文章以放射科为例,详细阐述了AI不简单替代工作的复杂原因,包括基准测试不足以反映实际场景、工作本身的多面性、部署面临的监管、保险和责任问题,以及耶冯斯悖论(AI提升效率反而可能增加需求)。他建议,AI短期内更可能改变那些重复性高、任务独立、上下文需求少、错误成本低的例行性工作,且通常作为工具使工作性质发生重构。 Moondream3模型部署:实现物体检测、跟踪、提问和图像字幕-merve Merve宣 …
阅读更多开放权重是多任务、多领域、多语言的未来趋势 - clem 🤗 Hugging Face的联合创始人Clement Delangue强调,**开放权重(open weights)**模型是未来许多AI任务、领域和语言的关键前沿。他指出,通过强化学习(RL)根据特定约束条件对模型进行专业化,开放权重模型的优势将更加显著。这表明了对开源AI社区和定制化模型潜力的坚定信心,预示着AI技术将以更灵活和适应性强的方式发展。 Groq 模型现已通过 Hugging Face 直接在 VS Code 中访问 - clem 🤗 (via GroqInc) Groq公司宣布,其模型现在可以通过Hugging Face直接在Visual Studio …
阅读更多