以下是过去一段时间全球AI领域的重要动态,根据提供的X/Twitter数据整理。请注意,虽然标题提及“过去4小时”,但部分内容的时间戳显示其发布时间早于此。 DeepSeek-Math-V2 开源:超越GPT-5与Gemini,实现IMO金牌水平 - 小互 DeepSeek 开源了数学推理大模型 DeepSeek-Math-V2,其在答案准确率和推理严谨性方面表现出色,超越了GPT-5-Thinking和Gemini 2.5 Pro。该模型核心创新在于“生成+验证+复审”的自我验证系统,能自动生成数学证明并自行检查和修正错误。在IMO 2025、CMO 2024和Putnam 2024等高难度数学竞赛 …
阅读更多DeepSeek 开源数学推理大模型 DeepSeek-Math-V2,超越 Gemini 获得 IMO 金牌-小互 DeepSeek发布了开源数学推理大模型 DeepSeek-Math-V2,其核心创新在于一个“生成+验证+复审”的自我验证系统。该模型在国际数学奥赛(IMO 2025)中解出6题中的5题,达到金牌水平,在中国数学奥赛(CMO 2024)和普特南数学竞赛(Putnam 2024)中也表现优异。它全面超越了 GPT-5-Thinking 和 Gemini 2.5 Pro,展现出高准确率和严谨的推理能力,能够自动生成数学证明并自行检查和修正错误。 神秘视频模型 Whisper Thunder (aka) David 登 …
阅读更多Ilya Sutskever澄清AI扩展定律的局限性 - 宝玉 OpenAI联合创始人Ilya Sutskever对其早前访谈内容进行澄清和补充,指出当前通过堆叠算力、数据和训练环境的AI扩展方法仍能带来进步,模型会持续变强,但这种路径缺乏“真正的泛化能力”和“高效学习”。他强调,有些“重要的东西”是单纯的规模化无法获得的,例如从少量经验中快速学习并在新场景下稳定可靠的能力,以及人类学习效率远超当前AI的效率。 报告显示AI企业采用率趋于平缓 - 宝玉 一份来自Apollo Academy的报告《AI 采用率开始趋于平缓》指出,企业对AI的采用速度并未呈现指数级增长,甚至在美国大型企业中出现了停滞甚至下滑的迹象。该报告引用了美国人 …
阅读更多以下是过去4小时全球AI领域的最新动态: DeepSeek开源数学推理大模型DeepSeek-Math-V2,超越GPT-5与Gemini获IMO金牌水平-小互 DeepSeek发布并开源了其数学推理大模型DeepSeek-Math-V2,该模型在国际数学奥林匹克(IMO)竞赛中展现出金牌水平,成功解出6题中的5题,并在中国数学奥林匹克(CMO)及普特南(Putnam)大学数学竞赛中表现出色。DeepSeek-Math-V2的核心创新在于其“生成 + 验证 + 复审”的自我验证系统,能自动生成数学证明、自行检查逻辑严谨性并修正错误。在五大数学领域,它全面超越了GPT-5-Thinking和Gemini 2.5 Pro,以高准确率、严 …
阅读更多Deepmind 拿下 buildwith.ai 域名并指向 AI Studio Build 模式 - 歸藏(guizang.ai) Deepmind 已经获取了 buildwith.ai 域名,并将其重定向至其 AI Studio 的 Build 模式。此举可能预示着 Deepmind 在 AI 开发工具和平台领域的新动向,旨在简化或强化用户构建和部署 AI 解决方案的体验,进一步整合其生态系统。 Hugging Face PRO 订阅提供每日 500 次 Z-Image-Turbo 生成 - merve Hugging Face PRO 订阅服务以每月 9 美元的价格,提供每日约 500 次 Z-Image-Turbo 图像生 …
阅读更多今日全球AI领域风起云涌,巨头间的竞争进入白热化。谷歌凭借其全栈优势对OpenAI和英伟达发起挑战,而OpenAI则被传将以自研搜索产品直捣谷歌腹地。同时,模型能力持续精进,DeepSeek在数学推理领域取得突破,与国际巨头并驾齐驱。AI Agent技术正从概念走向实用,微软推出小型化Agent模型。在国家层面,韩国的大规模GPU部署计划和中国对具身智能的政策引导,预示着AI基础设施和产业规范化已成为新的战略高地。 谷歌隐忍三年“杀红了眼”,爆锤英伟达、OpenAI 凭借新一代 Gemini 3 模型和自研的 TPU 芯片,谷歌正向AI领域的领先者英伟达和OpenAI发起猛烈攻势。Gemini 3在推理和编程方面展现出卓越性能,而谷 …
阅读更多Deepmind 获得 AI Studio 域名,指向其Build模式 - 歸藏(guizang.ai) Deepmind 已成功获取 aistudio.ai 域名,该域名目前直接跳转至其 AI Studio 的 Build 模式。此举可能旨在整合和简化用户访问其 AI 开发工具的路径,为开发者提供更直接、更集中的AI模型构建与实验环境。 Ben Tossell 推出 Droid Token 赠送活动及功能更新 - Ben Tossell Ben Tossell 宣布一项 Droid Token 赠送活动,将向首批提交 Droid 构建项目仓库的100名用户每人赠送1000万代币,总计10亿代币。同时,Droid 工具也迎来多项更 …
阅读更多Deepmind 拿下了 AI.com 的域名跳转到了 AI Studio 的 Build 模式上面 - 歸藏(guizang.ai) Deepmind 已成功收购并启用 AI.com 域名,该域名目前直接跳转至 Google AI Studio 的 Build 模式。此举可能预示着Google进一步整合其AI生态系统,并推广其AI开发平台,方便开发者和用户更直接地访问和利用Google的AI工具和服务。 Peter H. Diamandis, MD 提醒警惕AI诈骗,并公布全球诈骗损失数据 Peter Diamandis博士发出警告,敦促人们在AI时代保护自己,特别是在感恩节期间与家人交流时,应设置特殊的私密密码以验证可疑的深度 …
阅读更多Google AI负责人Jeff Dean揭示AI指数级增长奥秘-向阳乔木 Google AI负责人Jeff Dean在斯坦福的分享中指出,当前AI的强大是过去十五年技术叠加的产物,而非单一突破。他回顾了AI发展中的关键里程碑,包括2012年Google Brain项目实现无监督学习识别猫,以及Word2Vec让机器理解语言语义。算力方面,Google于2015年推出TPU专用芯片,性能比CPU和GPU快15-30倍,能效高30-80倍,并持续迭代。2017年的Transformer架构大幅提升了模型效率与准确率,成为现代大模型的基础。Jeff Dean强调,AI进步是指数级的,例如Google的模型两年内从15%的初中数学题准确 …
阅读更多Google AI负责人Jeff Dean分享AI快速发展历程-向阳乔木 Google AI负责人Jeff Dean在一场分享中回顾了AI从2012年到2024年的指数级发展。他指出,AI的强大是过去十五年技术叠加的产物,包括2012年Google Brain的无监督学习(识别猫)、Word2Vec提升语言理解、2015年TPU(Tensor Processing Unit)解决算力危机(比CPU/GPU快15-30倍,能效高30-80倍),以及2017年Transformer架构的诞生。Dean还介绍了稀疏模型、蒸馏和思维链等训练技巧。他强调,AI从2022年解决初中数学题(15%准确率)到2024年Gemini 2.5 Pro …
阅读更多