2025.12.18.20 过去4小时全球AI发生了什么?
OpenAI GPT-5.2 Codex发布,Agentic Coding能力显著提升-Sam Altman Sam Altman宣布推出GPT-5.2 Codex,该模型专为Agentic Coding和终端使用进行训练,并在OpenAI内部取得了巨大成功。Django框架联合创始人Simon Willison的案例进一步证明了其能力,他仅用8条提示词和GPT-5.2 Codex将一个纯Python库转换成约9000行JavaScript代码,并成功通过9200多个测试用例。这突出显示了AI代理在跨语言“翻译”、自动化测试以及在既定架构下“填空”的优势。Amjad Masad补充指出,编码代理会犯错,因此必须在支持操作可逆的基础设施上运行。
Google推出FunctionGemma及T5Gemma 2,扩展Gemma模型家族-mervenoyann Google发布了新的Gemma模型系列,其中包括FunctionGemma,一个拥有270M参数的紧凑型视觉语言模型,专为函数调用设计,并能在手机、浏览器等设备上运行。此外,还推出了1B和4B参数的变体。Demis Hassabis和Clement Delangue的推文也提到了基于Gemma 3构建的下一代编码-解码模型T5Gemma 2,预示着Google在开放模型生态系统方面的重大进展。
AI对网络安全的影响:发现React漏洞与防御性网络安全项目探索-Sam Altman Sam Altman指出,AI模型正对网络安全产生实际影响。上周,一位安全研究员利用OpenAI的旧模型发现了React中的一个潜在源代码泄露漏洞。他认为这些模型最终将有利于网络安全,并宣布OpenAI已开始探索针对防御性网络安全工作的信任访问计划,以更好地利用AI应对安全挑战。
Nvidia推出NeMo Agent Toolkit课程:提升AI代理可靠性-Andrew Ng Andrew Ng宣布Nvidia推出了新课程“Nvidia的NeMo Agent Toolkit:让代理可靠”。该课程旨在帮助团队将AI代理演示转化为可生产的可靠系统,利用Nvidia开源的NeMo Agent Toolkit (NAT) 提供可观测性、评估和部署的构建块。课程内容涵盖了构建配置驱动的代理工作流、通过跟踪实现可观测性、利用黄金标准数据集进行系统评估以及部署多代理系统等关键技能。
AI赋能加速试错,将PDCA循环效率提升十倍-宝玉 宝玉转发的观点强调,AI的最大价值并非取代人类思考,而是能够将试错速度提升十倍。通过遵循PDCA(计划-执行-检查-调整)的底层逻辑,AI能够帮助用户快速尝试、从失败中学习并迅速调整,从而在他人仍在纠结计划时,完成多次迭代,极大地加速了产品开发和问题解决过程。
AI能力突飞猛进,曾不可能的应用已成日常-Peter H. Diamandis, MD Peter Diamandis感叹AI技术的飞速发展。他指出,仅仅十年前,用自然语言描述一个应用程序或图像,并让AI实际构建代码或生成图片,曾是难以想象的。然而,如今这已成为数百万人的日常操作,无需三思,凸显了AI在过去十年中带来的革命性变革和普及化。
Andrej Karpathy探索LLM中的“精神食粮”概念-Andrej Karpathy Andrej Karpathy探讨了人类“精神食粮”(food for thought)这一具体而神秘的认知能力,思考LLM(大型语言模型)中是否存在类似的概念。他将“精神食粮”定义为“值得思考或考虑的事物,像一顿滋养心灵的思想盛宴”。对于LLM而言,他设想其等价物可能是一系列token,当作为思维链提示时,通过某种尚未发现的内在奖励函数,其样本能够提供“有益的关注”。
II-Commons研究代理由Gemini 3驱动,实现思维速度的研究-Emad Emad转发信息显示,II-Commons推出了一款由Gemini 3提供支持的研究代理,旨在实现“思维速度”的研究。该代理能够在一个界面中同时搜索arXiv和PubMed学术数据库,并支持用户在论文内部进行聊天和互动,极大地提高了研究效率和信息获取能力。
Flow Nano Banana Pro支持2K和4K图片下载-歸藏(guizang.ai) 归藏(guizang.ai)宣布,Flow产品中的Nano Banana Pro现在已支持下载2K和4K分辨率的图片。这一更新意味着用户可以获取更高清的图像资源,可能涉及到AI在图像生成或处理领域的能力提升。
ChatGPT与Replit集成,简化网站构建过程-Amjad Masad Amjad Masad展示了ChatGPT与Replit的集成应用,用户现在可以直接向ChatGPT发出指令,利用其现有知识通过Replit构建网站。这表明AI在简化开发流程、降低技术门槛方面取得了进展,使得非专业用户也能通过对话式AI快速创建应用。
Pollen Robotics的Reachy Mini机器人引发社区热情-clem 🤗 多条推文显示,Pollen Robotics推出的Reachy Mini机器人受到广泛关注。用户对组装Reachy Mini套件表示乐趣和流畅,并对其功能表达了浓厚兴趣,例如设想构建一个圣诞颂歌Reachy mini应用程序。这一现象表明小型化、易于组装的机器人套件正获得机器人爱好者和开发者社区的青睐。