OpenAI发布GPT-5.2-Codex,编程代理能力显著提升 OpenAI首席执行官Sam Altman宣布,专门针对代理编程和终端使用训练的GPT-5.2-Codex正式发布,并已在OpenAI内部取得巨大成功。Django框架联合创始人Simon Willison的一个案例展示了其强大能力:他仅用8条提示词,就将一个Python库JustHTML成功移植为纯JavaScript库,通过9200多个html5lib-tests用例,最终生成约9000行代码,历经43次提交。这一成功案例突显了AI代理在语言翻译、拥有完整测试集、架构已设计好以及由高手操作等“舒适区”的巨大潜力。Simon将此过程称为“设计智能体闭环”,通 …
阅读更多Google发布Gemini 3 Flash模型,性能超越Pro版且速度更快-小互 Google正式发布了 Gemini 3 Flash 模型,其性能在MMMU-Pro、SWE-Bench Verified和Arc-AGI-2等多模态理解基准测试中超越了Gemini 3 Pro,同时速度提升三倍,成本大幅降低。该模型具备博士级逻辑与推理能力,能根据问题复杂度动态调节思考时间,并平均减少30%的tokens使用。Gemini 3 Flash现已成为Gemini App和AI Mode in Search的默认模型,适用于实时交互式应用、快速编码、高并发API请求及低延迟多模态AI场景。 xAI Grok语音代理迅速移植到Reachy …
阅读更多过去4小时全球AI要闻回顾 以下是过去一段时间全球AI领域的最新动态: OpenAI发布Images 1.5,提升图像生成与编辑能力-Sam Altman OpenAI首席执行官Sam Altman宣布,Images 1.5已在ChatGPT和API中正式上线。新版本在图像质量、生成速度和编辑功能方面均有显著提升,并提供了丰富的示例展示其能力。此次发布预计将进一步激发图像生成领域的热潮。 Google创始人谢尔盖·布林斯坦福大学演讲:回顾谷歌与AI的未来-向阳乔木 Google联合创始人谢尔盖·布林在斯坦福工程学院百年庆典上发表了深入演讲,回顾了Google的创立历程及其在AI时代的机遇与挑战。他坦承Google曾错 …
阅读更多以下是过去4小时内全球AI领域的重要动态: OpenAI 发布 Images 1.5,GPT-5.2 Pro 获赞“范式转变” - Sam Altman OpenAI 正式推出 Images 1.5,该模型已集成至 ChatGPT 和 API,显著提升了图像生成质量、速度,并引入了全新的编辑功能。此外,OpenAI CEO Sam Altman 转发用户评论,指出 GPT-5.2 Pro 在其应用中实现了“范式转变”,特别是在代数几何和数论研究等复杂领域展现出巨大实用性。Peter H. Diamandis也提及GPT-5.2有望自动化71%的知识工作,预示着其在企业生产力提升上的巨大潜力。 Google 创始人谢尔盖·布林在斯坦福 …
阅读更多NVIDIA发布Nemotron 3系列开源模型,性能与效率均实现突破 - nvidianewsroom NVIDIA推出了全新的Nemotron 3系列开放模型、数据和库,旨在提供透明高效的AI解决方案。该系列首款模型Nemotron 3 Nano (30B-3A) 是一款混合SSM模型,具备100万上下文长度,专为智能体应用设计。该模型在多个基准测试中表现领先,并实现了2.2至3.3倍的速度提升,超越了GPT-OSS和Qwen3-30B。此次发布还包含了训练数据集、强化学习环境及训练代码,并支持商业用途,预示着未来还将推出Super和Ultra版本。 IBM推出开源企业级智能体CUGA,赋能任务自动化 - merve IBM发 …
阅读更多以下是过去4小时全球AI领域的重要动态: OpenAI正式发布GPT-5.2模型,性能大幅提升并调整定价-Sam Altman OpenAI现已通过ChatGPT和API正式发布GPT-5.2模型,Sam Altman称其为目前最智能的通用模型,尤其擅长处理实际工作任务。GPT-5.2在性能上实现了显著飞跃,GDPval指标(衡量行业专家偏好模型输出的指标)得分高达70%,远超GPT-5的38%。在SWE-Bench Pro编码基准上取得55.6%,超越Claude Opus 4.5和Gemini 3 Pro。模型在长上下文推理能力上树立了新标杆,并在MRCR v2测试中实现接近100%的准确率,处理长达256k tokens。此 …
阅读更多Nano Banana Pro:多功能AI产品分析与可视化工具-歸藏(guizang.ai) Nano Banana Pro被预定为爆款AI工具,能够锐评世间万物,帮助用户进行商品购买决策,并生成具有高度话题性的可视化信息图表。其核心玩法包括两种:一种是采用“从夯到拉”的五级视觉等级系统,将调研到的产品分为“夯”、“顶级”、“人上人”、“NPC”和“拉完了”五个层级,并配以专属的视觉表现和短语;另一种是生成中文3D四象限决策矩阵海报,通过设定冲突的评价维度(如性能与价格、口味与健康),将产品归类到“神级/完美区”、“奢侈/刺客区”、“平民/性价比区”和“避雷/智商税区”。这些提示词设计精巧,能自动进行网络调研并结合数据可视化能力, …
阅读更多Anthropic报告:AI显著提升工程师效率,同时警示深度技能萎缩-Orange AI Orange AI分享了Anthropic关于AI如何重塑工程师的报告解读。报告指出,工程师使用AI后工作效率提升了50%,AI正成为全天候的合作者,将可验证、重复性的编码任务交给AI,使工程师能专注于高层次的策略、设计和判断。这种协作不仅显著提升了核心工作效率,还促成了27%此前不会启动的项目。然而,报告也警示,过度依赖AI可能导致工程师深度技术能力的萎缩,构成一个“待解的悖论”,因为有效监督AI恰恰需要深层专业知识。 GPT-5.2预计于12月9日发布,可能略有延后-歸藏(guizang.ai) 歸藏(guizang.ai)透 …
阅读更多过去4小时全球AI要闻速览 Google Gemini 3 Deep Think 预测2026年AI行业趋势-歸藏(guizang.ai) 谷歌发布了其最强模式Gemini 3驱动的Deep Think,并基于OpenRouter报告分析了2026年AI行业发展趋势。主要预测包括:推理成本将大幅降低,云厂商计费模式可能从“按Token收费”转向“按任务结果收费”;同时,基础设施将重构以服务“长程记忆”,推理平台将全面支持有状态架构,使AI Agent能保持数小时甚至数天的“工作记忆”和上下文环境。 阿里巴巴发布 Qwen3-TTS 语音合成模型-小互 阿里巴巴发布了Qwen3-TTS文本转语音模型,重点优化了语音的自然度、韵律控制与 …
阅读更多Google DeepMind发布Gemini 3 Deep Think并预测2026年AI趋势-歸藏(guizang.ai) Google DeepMind已向Google AI Ultra订阅者推出 Gemini 3 Deep Think,该模型融合了IMO和ICPC获奖技术,擅长解决高度复杂的数学和科学问题。基于此模型对2026年AI行业趋势的分析显示,推理成本将趋向“白菜价”,导致云厂商商业模式从“按Token收费”转向“按任务结果收费”。此外,AI基础设施将重构以支持**“长程记忆”服务**,推理平台将支持有状态架构,允许AI Agent在云端保持数小时甚至数天的“工作记忆”和上下文环境,无需每次重复上传数据。 AI在未 …
阅读更多