2025.12.19.12 过去4小时全球AI发生了什么？

Dec 19, 2025 · 1 分钟阅读 ·

分享到:

OpenAI发布GPT-5.2-Codex，编程代理能力显著提升
OpenAI首席执行官Sam Altman宣布，专门针对代理编程和终端使用训练的GPT-5.2-Codex正式发布，并已在OpenAI内部取得巨大成功。Django框架联合创始人Simon Willison的一个案例展示了其强大能力：他仅用8条提示词，就将一个Python库JustHTML成功移植为纯JavaScript库，通过9200多个html5lib-tests用例，最终生成约9000行代码，历经43次提交。这一成功案例突显了AI代理在语言翻译、拥有完整测试集、架构已设计好以及由高手操作等“舒适区”的巨大潜力。Simon将此过程称为“设计智能体闭环”，通过GitHub Actions实现代码-测试-报错-修正的自动化循环。同时，Sam Altman提到上周有安全研究员利用先前的模型发现并披露了React的一个漏洞，并表示这些模型将对网络安全带来净收益，OpenAI正开始探索防御性网络安全的可信访问计划，并正在招聘人才以期望明年将Codex能力提升100倍。
Google发布Gemma系列新模型，涵盖FunctionGemma和T5Gemma 2
Google推出了其Gemma模型家族的新成员。其中包括FunctionGemma，一个270M参数的轻量级模型，专门为函数调用设计，可在手机、浏览器等设备上运行。此外，还发布了新一代编码器-解码器模型T5Gemma 2，它建立在Gemma 3之上。Google还发布了长上下文、小尺寸（270M）的视觉语言模型，以及1B和4B参数的变体。这些发布表明Google正积极拓展其模型生态系统，提供更多针对特定任务优化的AI模型，并强调模型在不同平台上的部署能力和多功能性。
Nvidia推出NeMo Agent Toolkit课程，旨在提升AI代理可靠性
Nvidia发布了一门新课程：Nvidia的NeMo Agent Toolkit (NAT)：使代理可靠，旨在解决团队在将AI代理从演示阶段过渡到可靠生产系统时面临的挑战。该课程由NVIDIA的Pr_Brian主讲，教授如何使用Nvidia的开源NeMo Agent Toolkit将代理工作流固化为可靠系统。NAT提供可观察性（执行跟踪）、系统评估（使用黄金标准数据集）和部署（认证、速率限制和专业Web界面）的构建模块。它支持通过配置驱动的工作流、REST API和最少代码来构建代理，并可通过CI/CD集成简化故障排除和优化代理性能，最终目标是帮助开发者部署多代理系统并协同处理复杂任务。
Replit通过AI赋能开发与销售团队，并强调编码代理基础设施建设
Replit的Amjad Masad指出，AI正在改变传统工作模式，销售人员开始像软件工程师一样工作，利用AI收集需求、解决代码问题并响应Bug和反馈。通过AI代理和模型组合，非技术团队也能直接向代码库推送代码，从而显著提升了市场团队（GTM）的效率，使其规模比典型SaaS初创公司小五倍。他同时强调，由于编码代理不可避免地会犯错，它们必须运行在支持所有操作可逆的基础设施上，为此Replit已构建了一个快照引擎。此外，ChatGPT也被展示出能根据自身知识，利用Replit平台创建网站，进一步突显AI在软件开发领域的应用潜力。
AI加速创新并实现曾经的“不可能”
Peter Diamandis反思了AI在过去十年间带来的巨大变革，指出仅仅十年前，用自然语言描述一个应用程序或图片并让AI实际构建代码或绘制图像是不可想象的，而如今这已是数百万人每天都在做的日常。他认为这表明AI技术已将曾经的“不可能”变为现实，并大幅降低了技术门槛。Orange AI也持类似观点，强调AI的核心价值在于将试错速度提升十倍，通过PDCA（计划-执行-检查-调整）循环加速迭代。AI浪潮进入第四年，市场速度今非昔比，任何小的产品市场契合点（PMF）一旦验证，很快就会集成到成熟的AI产品中，甚至Figma等工具也在加速整合AI功能，让过去繁琐的任务变得优雅。
Andrej Karpathy探讨LLM与人类认知中的“思考的食粮”
知名AI研究员Andrej Karpathy对人类“Food for thought”（思考的食粮）这一具体而神秘的认知能力表达了浓厚兴趣，并指出当前大语言模型（LLM）尚无与之对应的等价物。他将“思考的食粮”定义为“值得思考或考虑的事物，如滋养心灵的思想、见解或需要深入反思的问题，作为智力刺激”。在LLM的语境下，他设想其可能是一系列token，当作为思维链（Chain of Thought）提示时，产生的样本通过某种未被发现的内在奖励函数变得有益。
II-Commons平台利用Gemini 3加速科研进程
II-Commons平台宣布，其服务现已由Gemini 3驱动，旨在以“思维速度”加速科学研究。该平台通过集成一个AI代理，使用户能够同时搜索arXiv和PubMed这两个重要的学术数据库。此外，用户还可以在PDF文档内部进行聊天交互，这将极大地提升科研人员的信息检索、阅读理解和分析效率，从而加速知识发现和学术进展。
Meta AI在Transformers库中新增Pixio模型支持
与Meta AI合作，Transformers库已新增对Pixio模型的支持。Pixio模型在Masked Attention中提出了四项核心改变，这意味着其在处理图像或序列数据时，能以更有效的方式关注关键信息。这一集成将为研究人员和开发者提供更先进的工具，以探索和应用基于Transformer架构的视觉任务，进一步推动计算机视觉领域的发展。
Reachy Mini机器人活跃展示其应用潜力
Reachy Mini机器人持续在AI社区中保持活跃。用户分享了愉快的组装体验，并称赞其出色的套件和清晰的指南。此外，Reachy Mini还作为特别嘉宾现身Pollen Robotics的圣诞派对，并被设想用于开发圣诞颂歌迷你应用程序。这些互动和设想展示了Reachy Mini在教育、娱乐、人机交互以及创新应用开发方面的广泛潜力，进一步融入AI与机器人技术生态系统。