OpenAI发布GPT-5.2-Codex,编程代理能力显著提升 OpenAI首席执行官Sam Altman宣布,专门针对代理编程和终端使用训练的GPT-5.2-Codex正式发布,并已在OpenAI内部取得巨大成功。Django框架联合创始人Simon Willison的一个案例展示了其强大能力:他仅用8条提示词,就将一个Python库JustHTML成功移植为纯JavaScript库,通过9200多个html5lib-tests用例,最终生成约9000行代码,历经43次提交。这一成功案例突显了AI代理在语言翻译、拥有完整测试集、架构已设计好以及由高手操作等“舒适区”的巨大潜力。Simon将此过程称为“设计智能体闭环”,通 …
阅读更多Google发布FunctionGemma、T5Gemma 2及Gemma 4系列模型-osanseviero Google发布了多个新的Gemma系列AI模型,其中包括FunctionGemma,一个参数量仅为270M的模型,专为函数调用设计,可在手机、浏览器等多种设备上运行。同时,新一代编码器-解码器模型T5Gemma 2也在Gemma 3的基础上推出,并且有迹象表明Google可能正准备发布Gemma 4,包含1B和4B等参数变体,预示着其Gemma模型家族的进一步扩展。 OpenAI发布GPT-5.2-Codex并加强网络安全关注-Sam Altman Sam Altman宣布OpenAI正式推出GPT-5.2-Codex …
阅读更多以下是过去4小时全球AI领域的精选动态: FunctionGemma模型发布,主打函数调用功能 osanseviero和merve等用户转发宣布了FunctionGemma模型的推出。这款270M参数的模型专门为函数调用设计,具备在手机、浏览器及其他设备上运行的能力。它旨在高效执行特定功能,有望在边缘计算和轻量级AI应用中发挥关键作用,为开发者提供更灵活的AI集成方案。 Google Gemma 4即将发布?市场传闻不断 据kimmonismus和testingcatalog等账号转发的消息,有强烈迹象表明Google可能在今天发布其Gemma 4模型。这些猜测源于Google的Gemma模型家族集合最近进行了更新,引发了社区对新一 …
阅读更多以下是过去一段时间全球AI领域的动态汇总: Google发布革命性Gemini 3 Flash模型,性能超越Pro版 Google重磅发布了其Gemini 3 Flash模型,该模型以“Pro级智能 × Flash级速度”为核心亮点,具备博士级逻辑与推理能力。在MMMU-Pro多模态理解基准测试中,Gemini 3 Flash表现惊人,甚至超越了Gemini 3 Pro。它相较于Gemini 2.5 Pro速度提升了3倍,成本仅为其零头,并且在完成同等任务时平均使用30%更少的tokens。该模型能根据问题复杂度“自己调节思考时间”,适用于实时交互式应用、快速编码与分析任务、高并发API请求及低延迟多模态AI应用,现已成 …
阅读更多过去4小时全球AI要闻回顾 Google 发布 Gemini 3 Flash 模型:Pro级智能,Flash级速度 Google 正式发布了 Gemini 3 Flash 模型,旨在以更快的速度提供前沿智能。该模型在保持Pro级别智能的同时,速度比 Gemini 2.5 Pro 快3倍,且成本更低。它具备根据问题复杂度**“自我调节思考时间”**的能力,简化问题秒答,复杂任务则会进行更深入的思考。在多模态理解基准测试(如 MMMU-Pro、swe-bench verified 和 arc-agi-2)中,Gemini 3 Flash 的表现甚至超越了 Gemini 3 Pro,并且完成同等任务时平均可节省 30% 的 tokens。 …
阅读更多Google发布Gemini 3 Flash模型:性能超越Pro版,速度与效率显著提升-小互 Google正式发布了Gemini 3 Flash模型,该模型在保持Pro级智能的同时,实现了Flash级速度,性能超越了Gemini 2.5 Pro并达到3倍速度,而成本仅为Pro版的零头。新模型具备博士级逻辑与推理能力,能在处理复杂任务时“自我调节思考时间”,平均可减少30%的token使用量。Gemini 3 Flash在MMMU-Pro多模态理解基准测试以及SWE-bench verified和ARC-AGI-2等测试集中甚至超越了Gemini 3 Pro。该模型现已作为Gemini App和AI Mode in Search的默 …
阅读更多以下是过去4小时内全球AI领域的重要动态: Google发布Gemini 3 Flash模型,性能与效率均实现突破-Demis Hassabis Google正式发布了Gemini 3 Flash模型,并已将其设为Gemini App和Search中AI模式的默认模型。该模型实现了Pro级智能与Flash级速度的结合,在MMMU-Pro多模态理解基准测试、swe-bench verified和arc-agi-2等多个测试集中,其性能甚至超越了Gemini 3 Pro,同时速度提升3倍,成本大幅降低。Gemini 3 Flash具备博士级逻辑与推理能力,能根据问题复杂度“自己调节思考时间”,并在完成同等任务时平均使用30%更少 …
阅读更多Google发布Gemini 3 Flash模型,性能超越Pro版且速度更快-小互 Google正式发布了 Gemini 3 Flash 模型,其性能在MMMU-Pro、SWE-Bench Verified和Arc-AGI-2等多模态理解基准测试中超越了Gemini 3 Pro,同时速度提升三倍,成本大幅降低。该模型具备博士级逻辑与推理能力,能根据问题复杂度动态调节思考时间,并平均减少30%的tokens使用。Gemini 3 Flash现已成为Gemini App和AI Mode in Search的默认模型,适用于实时交互式应用、快速编码、高并发API请求及低延迟多模态AI场景。 xAI Grok语音代理迅速移植到Reachy …
阅读更多过去4小时全球AI要闻回顾 谷歌发布突破性Gemini 3 Flash模型,性能超越Pro版 谷歌正式发布了其创新的 Gemini 3 Flash 模型,并将其设为Gemini App和搜索AI模式的默认模型。该模型实现了Pro级智能与Flash级速度的结合,在几乎所有基准测试中均超越了Gemini 2.5 Pro,并提供了三倍的速度提升和显著的成本降低。Gemini 3 Flash具备博士级逻辑与推理能力,可根据问题复杂度动态调整思考时间,并且在完成同等任务时平均使用30%更少的Token。令人瞩目的是,它在MMMU-Pro多模态理解、SWE-bench verified和ARC-AGI-2等基准测试中甚至超越了更强大 …
阅读更多以下是过去一段时间全球AI领域的重要动态汇总: OpenAI发布Images 1.5模型,提升图像生成能力-Sam Altman OpenAI正式发布了其最新的图像生成模型Images 1.5,现已在ChatGPT和API中上线。OpenAI首席执行官Sam Altman指出,新模型在图像质量、生成速度和编辑能力方面均有显著提升。此前,业界已有多方预测和讨论,例如归藏(guizang.ai)、小互和向阳乔木等都提到OpenAI即将发布新的图像模型,并预计将引发图像生成领域的新热潮。此模型有望在现有市场竞争中脱颖而出,推动图像创作的进一步发展。 Google联合创始人谢尔盖·布林斯坦福演讲:回顾历史,洞察AI未来- …
阅读更多