2025.09.26.04 过去4小时全球AI发生了什么?
Google DeepMind发布Gemini Robotics 1.5模型及Gemini Live更新-Demis Hassabis
Google DeepMind 宣布推出 Gemini Robotics 1.5 模型,该模型旨在利用多模态Gemini模型作为基础,使其能够更好地理解和推理物理世界,预示着机器人技术在未来将扮演重要角色。此外,Demis Hassabis还转发了关于最新 Gemini Live 模型的更新,强调其在Gemini原有优势基础上的显著性能提升。这些进展共同展现了Google DeepMind在多模态AI和机器人领域的前沿探索。
Factory AI的Droids在Terminal-Bench排名第一,展现类AGI能力-Ben Tossell
Factory AI的 Droids代理在 Terminal-Bench 上荣登榜首,其卓越表现让用户感受到“AGI已然实现”,并带来了“30-40%”的显著性能提升。有评论指出,Factory AI的团队甚至不再需要人工编写代码,暗示了AI代理在软件开发中日益增强的自主性。这些反馈共同描绘了Droids在AI智能体领域取得的突破性进展,以及其对未来开发模式的潜在影响。
AI未能取代放射科医生:一项深度分析揭示AI局限性与人类医生价值-宝玉
尽管杰弗里·辛顿等AI专家曾预测AI将很快取代放射科医生,但十年后的现实恰恰相反:放射科医生的岗位和薪资均持续增长。分析指出,现有的 AI模型虽在特定影像识别任务中表现出色,但其 基准测试局限、缺乏 综合判断能力以及在 现实环境中的适用性不足是其无法完全替代人类医生的主要原因。医疗领域的监管、经济因素和“杰文斯悖论”也延缓了AI的实际部署,强调了人类直觉、经验和同情心在复杂医学诊断中的不可替代性。
Hugging Face推理平台现已支持前沿视觉语言模型Qwen3-VL-merve
由Novita Labs提供支持的 Hugging Face Inference Providers 平台,现在正式支持 Qwen3-VL 模型。Qwen3-VL被描述为一款“前沿视觉语言模型”,其集成到Hugging Face的推理服务中,将为开发者和研究人员提供更便捷的访问途径,以利用其强大的视觉理解能力,进一步推动多模态AI应用的发展和探索。
NVIDIA Cosmos Reason在Hugging Face上下载量突破100万-clem 🤗
NVIDIA的 Cosmos Reason 项目在 Hugging Face 上的下载量已突破 100万,这一里程碑标志着其在开发者社区中的广泛接受和强大影响力。Hugging Face的联合创始人Clement Delangue转发了NVIDIA AI Dev的庆祝推文,强调了开发者社区对这一工具的认可,也预示着NVIDIA在AI推理和开发工具方面的持续成功。
Hugging Face发布一系列微型任务专用模型-clem 🤗
Hugging Face宣布发布一系列 微型任务专用模型,这些模型专为执行特定任务而设计,例如 数据提取、翻译、RAG(检索增强生成) 和 工具使用。这一举措旨在为开发者提供更灵活、高效的AI工具,以满足不同场景下的定制化需求,避免了使用大型通用模型可能带来的资源消耗和复杂性,推动了AI模型部署的精细化和效率提升。
Gauss AI在数学领域取得突破,解决18个月难题-Peter H. Diamandis, MD
Gauss AI 在数学领域取得了一项重大突破,成功解决了菲尔兹奖得主特伦斯·陶(Terence Tao)提出的一个专家们历经 18个月 仍未攻克的挑战,而Gauss AI仅用 3周 便给出了答案。这一成就凸显了AI在加速科学发现和增强人类智慧方面的巨大潜力,预示着AI将成为未来研究和创新不可或缺的强大工具。
Replit Agent通过Figma链接简化AI视觉修改流程-Amjad Masad
Replit Agent 现已实现与 Figma 的无缝集成,极大地简化了向AI描述视觉修改的复杂性和成本。开发者现在只需链接Figma文件,Replit Agent便能理解并执行相应的更改。这项功能有望提高开发效率,减少沟通障碍,使得AI在设计和开发工作流中的协作更加直观和高效。
Adobe Photoshop集成FLUX Kontext Pro模型-歸藏(guizang.ai)
据报道,“黑森林” 已与 Adobe 合作,使得 FLUX Kontext Pro 模型 能够在 Photoshop 中直接使用。这一集成意味着设计师和创意专业人士将能在熟悉的Adobe环境中利用先进的AI模型进行图像处理和内容创作,极大地扩展了Photoshop的功能,并加速了AI在创意产业中的应用与普及。
研究显示80%的ChatGPT使用场景为个人生活辅助而非编码-Peter H. Diamandis, MD
一项针对 150万个ChatGPT对话 的研究揭示,80% 的AI使用并非用于编码,而是集中在 个人生活辅助 方面,如寻求指导、获取信息和写作。这一发现表明,AI正迅速成为人类的日常助手,其应用范围远超职业工作,渗透到个人生活的方方面面,且这种趋势没有放缓的迹象。
Vercel AI SDK V5推动AI应用生态系统蓬勃发展-宝玉
Vercel AI SDK 在发布 V5版本 后,已逐步培养出成熟的生态系统,成为构建 AI应用 的理想时机。社区贡献了大量基于AI SDK的优秀开源项目和衍生库,为开发者提供了丰富的工具和资源。这一发展表明,AI开发工具链的日益完善正在降低AI应用的开发门槛,激发了更广泛的创新和应用场景的涌现。
Reddit热门提示揭示如何查看OpenAI存储的用户记忆-宝玉
Reddit上出现了一个热门提示(prompt),指导用户如何在新的聊天中通过特定指令,查看 OpenAI 对其会话内容的 “已保存记忆”。该提示要求AI将所有记忆内容以代码块形式完整复制,并确保包含“title”和“content”。这一发现引发了用户对AI如何存储和管理个人数据、以及其隐私安全性的关注,也提供了一个了解AI记忆机制的窗口。
Stability AI的CEO Emad表示,AI在多个任务领域达到 专家级 且具有 经济价值 的 工作能力临界点 正在日益临近。他指出,在GAIA等在线任务基准测试中也看到了类似的趋势。Emad认为明年将是真正的转折点,届时AI的性能将彻底颠覆行业内的“常规”表现,预示着AI将对经济和劳动力市场带来深远影响。