2025.09.11.12 过去4小时全球AI发生了什么?

  1. 小道消息:Gemini 3 Flash 能力超过 Gemini 2.5 Pro,本月不会发布 Gemini 3,但是很快了。-宝玉

    小道消息称,谷歌的 Gemini 3 Flash 模型能力已超越当前的 Gemini 2.5 Pro。尽管本月不会正式发布 Gemini 3 系列,但其发布时间已非常临近,预示着谷歌在大型语言模型领域的又一次显著进展。这一消息引发了业界对新一代Gemini模型性能的广泛期待和关注。

  2. 知名主持人塔克·卡尔森当面追问Sam Altman OpenAI前工程师离奇死亡事件-宝玉

    知名主持人塔克·卡尔森在对OpenAI首席执行官山姆·奥特曼的访谈中,当面就 OpenAI前工程师苏奇尔·巴拉吉的离奇死亡事件 提出质疑,引发广泛关注。巴拉吉于2024年11月在家中身亡,警方初步结论为自杀,但家属对诸多疑点表示质疑,包括监控被切断、现场血迹分布异常、不明假发及死者生前行为不符自杀倾向等。卡尔森认为这些疑点“令人极度不安”,并质疑旧金山警方草率结案。奥特曼在访谈中显得明显不适和紧张,坚称根据法医报告认为是自杀,但承认最初也觉得可疑,并对家属的悲痛表示理解。此事件再次引发公众对调查透明度的讨论。

  3. OpenAI前CTO Mira Murati新公司发布重磅研究,战胜LLM推理非确定性-歸藏(guizang.ai)

    OpenAI前CTO米拉·穆拉蒂(Mira Murati)的新公司 Thinking Machines 发布了一项重磅研究,旨在解决大语言模型(LLM)推理中的 非确定性问题。研究指出,即使在参数设定为温度0(最高确定性)时,Qwen模型在对同一问题进行1000次提问后,仍能产生80种不同的答案,最常见答案仅出现78次。这种非确定性严重影响了强化学习(RL)的“策略内”训练,可能导致奖励崩溃。该研究强调了科学研究中可重复性的重要性,并提出了实现采样器与训练器“逐位相同”结果的方法,以确保KL散度为零,从而提升模型训练的稳定性和效果。

  4. ChatGPT推出开发者模式:支持自定义连接器与写入操作-小互

    ChatGPT 正式推出了 开发者模式,为Pro和Plus账户用户提供更高级的自定义和集成能力。通过此模式,用户可以创建 自定义连接器,并与任意管理与控制平台(MCP)进行集成。这意味着开发者不仅限于搜索或抓取数据,还能执行修改和写入操作。这一功能旨在帮助开发者通过ChatGPT直接处理各种自动化任务,从而实现更灵活的集成和简化的工作流程。用户可在设置菜单中的“连接器”->“高级”->“开发者模式”中启用此功能。

  5. 研究显示AI正影响日常词汇使用,AI偏好词汇激增-Peter H. Diamandis, MD

    一项来自佛罗里达州立大学(@FSU)的研究发现,AI偏好的词汇在日常对话中出现频率显著增加,尤其是在播客和个人交流中。研究指出,诸如“细致(Meticulous)”、“深入探讨(Delve)”和“夸耀(Boast)”等词汇,正逐渐融入人们的日常用语。这表明人工智能不仅在技术层面改变了我们的工作方式,也在潜移默化地影响着人类语言的演变和日常交流习惯。

  6. Varun Raghu批判“凭感觉编程”:AI编程工具是快速致富的骗局-宝玉

    作者Varun Raghu撰文强烈批判 “凭感觉编程”(Vibe Coding) 以及当前市场上的 AI编程工具,认为它们正在兜售一种“快速致富”的幻觉。他指出,这些工具声称仅需几句提示词就能创建十亿美元公司,是彻头彻尾的骗局。Raghu强调,编程的真正价值在于学习、思考和解决问题的过程,而非仅仅获得一个最终产品。他发现过度依赖AI会剥夺这种学习机会,最终导致技能停滞不前。因此,他决定放弃“凭感觉编程”,回归到亲自动手、慢节奏但更能提升自身能力的编码方式,并表示AI目前仅作为加速其既有技能的工具。

  7. Replit:AI Agent任务扩展速度远超METR论文预测-Amjad Masad

    Replit公司首席执行官Amjad Masad指出,METR论文提出的“AI可执行任务时长每7个月翻一番”的说法,严重低估了Replit在AI Agent领域所观察到的扩展速度。他认为,虽然该论断可能适用于单一模型类别,但Replit作为一个Agent研究实验室,通过构建 多Agent架构 并整合来自不同提供商的多种模型,能够挖掘出AI在各类任务中的潜在能力,从而实现更快速、更显著的任务规模扩展。这表明Replit在AI Agent技术应用上正取得突破性进展。

  8. Replit将AI研究比作精英运动队:耐力与突破并进-Amjad Masad

    Replit的Amjad Masad将公司在 AI研究 上的努力比作一支 精英运动队。他指出,在Agent领域,每一项新的突破都比上一次更具挑战性,但团队的耐力也在不断增强和累积。这反映出Replit在面对AI Agent复杂性时,采取了持续投入和迭代优化的策略,以实现长期进步。此番言论揭示了Replit在AI前沿探索中,对毅力和创新能力的高度重视。

  9. 云服务爆炸性增长印证AI价值:质疑者或已迟钝-orange.ai

    观察人士指出,当前 云服务 领域正经历 爆炸性增长,这与人工智能(AI)的快速发展密不可分。这一现象表明,人工智能已成为推动云计算需求和技术创新的核心动力。对于那些仍在质疑AI价值的人士,评论认为他们可能过于迟钝,未能及时认识到AI在驱动经济和技术进步方面所展现出的巨大潜力。

  10. marswave入选2025 NVIDIA创业企业展示北京站-orange.ai

    marswave 公司荣幸宣布,其已成功入选 2025 NVIDIA 创业企业展示——北京站。该公司对NVIDIA初创加速计划的大力支持表示感谢,并将参加在外滩大会进行的展示。这标志着marswave在AI及相关技术领域的创新实力得到了行业巨头的认可,也为其未来发展提供了重要的展示和合作平台。