2025.12.19.04 过去4小时全球AI发生了什么?

以下是过去4小时全球AI领域的精选动态:

  1. FunctionGemma模型发布,主打函数调用功能

    osanseviero和merve等用户转发宣布了FunctionGemma模型的推出。这款270M参数的模型专门为函数调用设计,具备在手机、浏览器及其他设备上运行的能力。它旨在高效执行特定功能,有望在边缘计算和轻量级AI应用中发挥关键作用,为开发者提供更灵活的AI集成方案。

  2. Google Gemma 4即将发布?市场传闻不断

    据kimmonismus和testingcatalog等账号转发的消息,有强烈迹象表明Google可能在今天发布其Gemma 4模型。这些猜测源于Google的Gemma模型家族集合最近进行了更新,引发了社区对新一代Gemma模型性能和功能的期待,预计将进一步推动小型高效模型的创新。

  3. Nvidia推出NeMo Agent Toolkit新课程,提升AI Agent可靠性

    吴恩达宣布Nvidia推出新课程“Nvidia’s NeMo Agent Toolkit: Making Agents Reliable”,由NVIDIA的Pr_Brian教授。该课程旨在帮助开发者将AI Agent演示系统转化为可靠的生产级系统,利用Nvidia的开源NeMo Agent Toolkit (NAT) 提供可观测性、评估和部署的构建模块,解决Agent在实际应用中面临的稳定性挑战。

  4. Andrej Karpathy探讨LLM与人类“思想食粮”的认知差异

    知名AI研究员Andrej Karpathy提出“food for thought”(思想食粮)这一人类独有的认知能力,认为大型语言模型(LLM)目前缺乏等效机制。他将“思想食粮”定义为能够激发深入思考、提供新见解或挑战视角的“精神大餐”,并推测在LLM中可能表现为某种未被发现的内在奖励函数,强调这是LLM未来发展中一个引人入胜的研究方向。

  5. Amjad Masad:编码Agent需可逆基础设施,已构建快照引擎

    Amjad Masad指出,鉴于编码Agent可能犯错,它们必须在支持所有操作可逆的基础设施上运行。他透露,其团队为此目的构建了一个快照引擎,以确保在Agent出错时能够迅速回溯并纠正问题,这对于提高AI在软件开发流程中的实用性和安全性至关重要。

  6. AI加速PDCA循环,将试错速度提升十倍

    宝玉转发的观点强调,AI最大的价值并非替代人类思考,而是能够将试错速度提升十倍。通过加速PDCA(Plan-Do-Check-Act)循环,AI让个人和团队能够更快地迭代和调整,从而在计划阶段后迅速进行尝试、从失败中学习并进行优化,极大地提高了创新和成功的效率。

  7. Sam Altman:AI模型协助发现React漏洞,强调网络安全影响

    Sam Altman透露,上周有安全研究员利用其先前的AI模型发现了React中的一个漏洞,可能导致源代码泄露。他认为AI模型将对网络安全产生积极影响,并指出目前正处于AI技术改进带来“实际影响阶段”,预示着AI在安全领域应用的深度和广度将持续增加。

  8. Sam Altman宣布OpenAI将探索防御性网络安全信任访问计划

    Sam Altman表示,OpenAI正开始探索针对防御性网络安全工作的信任访问计划。这一举措表明OpenAI致力于将其AI能力应用于提升网络防御,并可能与特定组织或研究人员合作,共同开发和部署先进的安全解决方案,以应对日益复杂的网络威胁。

  9. Sam Altman宣布GPT-5.2-Codex今日发布并开放招聘

    Sam Altman宣布,专门为Agentic编码和终端使用训练的GPT-5.2-Codex模型于今日发布。他表示OpenAI团队在使用该模型方面取得了巨大成功,并正在积极招聘,目标是在明年将Codex的性能提升100倍,暗示了其在自动化编程领域的巨大潜力。

  10. II-Commons推出Gemini 3驱动的AI研究Agent

    Emad转发了ii_posts的消息,介绍了由Gemini 3驱动的II-Commons研究Agent。该工具旨在实现“思如泉涌般的研究”,允许用户通过一个Agent同时搜索arXiv和PubMed文献,并可在论文内部进行交互式聊天,极大地简化了学术研究和信息获取流程。