2025.12.19.12 过去4小时全球AI发生了什么?
OpenAI发布GPT-5.2-Codex,编程代理能力显著提升
OpenAI首席执行官Sam Altman宣布,专门针对代理编程和终端使用训练的GPT-5.2-Codex正式发布,并已在OpenAI内部取得巨大成功。Django框架联合创始人Simon Willison的一个案例展示了其强大能力:他仅用8条提示词,就将一个Python库JustHTML成功移植为纯JavaScript库,通过9200多个html5lib-tests用例,最终生成约9000行代码,历经43次提交。这一成功案例突显了AI代理在语言翻译、拥有完整测试集、架构已设计好以及由高手操作等“舒适区”的巨大潜力。Simon将此过程称为“设计智能体闭环”,通过GitHub Actions实现代码-测试-报错-修正的自动化循环。同时,Sam Altman提到上周有安全研究员利用先前的模型发现并披露了React的一个漏洞,并表示这些模型将对网络安全带来净收益,OpenAI正开始探索防御性网络安全的可信访问计划,并正在招聘人才以期望明年将Codex能力提升100倍。
Google发布Gemma系列新模型,涵盖FunctionGemma和T5Gemma 2
Google推出了其Gemma模型家族的新成员。其中包括FunctionGemma,一个270M参数的轻量级模型,专门为函数调用设计,可在手机、浏览器等设备上运行。此外,还发布了新一代编码器-解码器模型T5Gemma 2,它建立在Gemma 3之上。Google还发布了长上下文、小尺寸(270M)的视觉语言模型,以及1B和4B参数的变体。这些发布表明Google正积极拓展其模型生态系统,提供更多针对特定任务优化的AI模型,并强调模型在不同平台上的部署能力和多功能性。
Nvidia推出NeMo Agent Toolkit课程,旨在提升AI代理可靠性
Nvidia发布了一门新课程:Nvidia的NeMo Agent Toolkit (NAT):使代理可靠,旨在解决团队在将AI代理从演示阶段过渡到可靠生产系统时面临的挑战。该课程由NVIDIA的Pr_Brian主讲,教授如何使用Nvidia的开源NeMo Agent Toolkit将代理工作流固化为可靠系统。NAT提供可观察性(执行跟踪)、系统评估(使用黄金标准数据集)和部署(认证、速率限制和专业Web界面)的构建模块。它支持通过配置驱动的工作流、REST API和最少代码来构建代理,并可通过CI/CD集成简化故障排除和优化代理性能,最终目标是帮助开发者部署多代理系统并协同处理复杂任务。
Replit通过AI赋能开发与销售团队,并强调编码代理基础设施建设
Replit的Amjad Masad指出,AI正在改变传统工作模式,销售人员开始像软件工程师一样工作,利用AI收集需求、解决代码问题并响应Bug和反馈。通过AI代理和模型组合,非技术团队也能直接向代码库推送代码,从而显著提升了市场团队(GTM)的效率,使其规模比典型SaaS初创公司小五倍。他同时强调,由于编码代理不可避免地会犯错,它们必须运行在支持所有操作可逆的基础设施上,为此Replit已构建了一个快照引擎。此外,ChatGPT也被展示出能根据自身知识,利用Replit平台创建网站,进一步突显AI在软件开发领域的应用潜力。
Peter Diamandis反思了AI在过去十年间带来的巨大变革,指出仅仅十年前,用自然语言描述一个应用程序或图片并让AI实际构建代码或绘制图像是不可想象的,而如今这已是数百万人每天都在做的日常。他认为这表明AI技术已将曾经的“不可能”变为现实,并大幅降低了技术门槛。Orange AI也持类似观点,强调AI的核心价值在于将试错速度提升十倍,通过PDCA(计划-执行-检查-调整)循环加速迭代。AI浪潮进入第四年,市场速度今非昔比,任何小的产品市场契合点(PMF)一旦验证,很快就会集成到成熟的AI产品中,甚至Figma等工具也在加速整合AI功能,让过去繁琐的任务变得优雅。
Andrej Karpathy探讨LLM与人类认知中的“思考的食粮”
知名AI研究员Andrej Karpathy对人类“Food for thought”(思考的食粮)这一具体而神秘的认知能力表达了浓厚兴趣,并指出当前大语言模型(LLM)尚无与之对应的等价物。他将“思考的食粮”定义为“值得思考或考虑的事物,如滋养心灵的思想、见解或需要深入反思的问题,作为智力刺激”。在LLM的语境下,他设想其可能是一系列token,当作为思维链(Chain of Thought)提示时,产生的样本通过某种未被发现的内在奖励函数变得有益。
II-Commons平台宣布,其服务现已由Gemini 3驱动,旨在以“思维速度”加速科学研究。该平台通过集成一个AI代理,使用户能够同时搜索arXiv和PubMed这两个重要的学术数据库。此外,用户还可以在PDF文档内部进行聊天交互,这将极大地提升科研人员的信息检索、阅读理解和分析效率,从而加速知识发现和学术进展。
Meta AI在Transformers库中新增Pixio模型支持
与Meta AI合作,Transformers库已新增对Pixio模型的支持。Pixio模型在Masked Attention中提出了四项核心改变,这意味着其在处理图像或序列数据时,能以更有效的方式关注关键信息。这一集成将为研究人员和开发者提供更先进的工具,以探索和应用基于Transformer架构的视觉任务,进一步推动计算机视觉领域的发展。
Reachy Mini机器人持续在AI社区中保持活跃。用户分享了愉快的组装体验,并称赞其出色的套件和清晰的指南。此外,Reachy Mini还作为特别嘉宾现身Pollen Robotics的圣诞派对,并被设想用于开发圣诞颂歌迷你应用程序。这些互动和设想展示了Reachy Mini在教育、娱乐、人机交互以及创新应用开发方面的广泛潜力,进一步融入AI与机器人技术生态系统。