Andrej Karpathy 发布 2025 年 LLM 年度回顾,揭示六大范式转变 - 宝玉 OpenAI 联合创始人 Andrej Karpathy 发布了其 2025 年大型语言模型(LLM)年度回顾。他指出六大核心变化:RLVR 成为新的训练阶段,让模型通过可验证奖励自主学习推理;LLM 智能展现出**“参差不齐”的特性(Ghosts vs. Animals),在可验证领域表现出色,但常识和创意方面仍显不足,并导致基准测试失效;LLM 应用层浮出水面,以 Cursor 为代表,通过上下文工程、多模型编排和特定界面服务垂直领域;AI 智能体向本地化部署发展,如 Claude Code 在开发者电脑上运行;Vibe …
阅读更多OpenAI GPT-5.2 Codex发布,Agentic Coding能力显著提升-Sam Altman Sam Altman宣布推出GPT-5.2 Codex,该模型专为Agentic Coding和终端使用进行训练,并在OpenAI内部取得了巨大成功。Django框架联合创始人Simon Willison的案例进一步证明了其能力,他仅用8条提示词和GPT-5.2 Codex将一个纯Python库转换成约9000行JavaScript代码,并成功通过9200多个测试用例。这突出显示了AI代理在跨语言“翻译”、自动化测试以及在既定架构下“填空”的优势。Amjad Masad补充指出,编码代理会犯错,因此必须在支持操作可逆的基础 …
阅读更多OpenAI推出GPT-5.2-Codex,Coding Agent能力凸显-Sam Altman OpenAI首席执行官Sam Altman宣布发布GPT-5.2-Codex,该模型专为Agentic编码和终端使用进行训练。Django框架联合创始人Simon Willison利用Codex CLI + GPT-5.2,成功将一个9000行Python库移植到JavaScript,仅使用了约8条提示词。Willison分析称,Coding Agent的“舒适区”在于语言翻译、拥有完整测试集、预设架构,并通过专家操作形成“智能体闭环”,从而高效完成复杂任务。 Google发布FunctionGemma与T5Gemma …
阅读更多以下是过去4小时内全球AI领域的重要动态: Google发布Gemini 3 Flash模型,性能与效率均实现突破-Demis Hassabis Google正式发布了Gemini 3 Flash模型,并已将其设为Gemini App和Search中AI模式的默认模型。该模型实现了Pro级智能与Flash级速度的结合,在MMMU-Pro多模态理解基准测试、swe-bench verified和arc-agi-2等多个测试集中,其性能甚至超越了Gemini 3 Pro,同时速度提升3倍,成本大幅降低。Gemini 3 Flash具备博士级逻辑与推理能力,能根据问题复杂度“自己调节思考时间”,并在完成同等任务时平均使用30%更少 …
阅读更多在过去的四小时内,AI领域迎来了一系列重要进展和发布。OpenAI 推出了其最新的GPT-5.2模型,显著提升了多项性能指标,并预告了“成人模式”的到来。同时,OpenAI与迪士尼达成了里程碑式的合作,允许Sora使用迪士尼的200多个标志性IP进行AI视频创作。此外,Hugging Face平台上一款文本生成模型Rnj-1-Instruct登顶趋势榜,Google DeepMind展示了其Gemini Deep Research智能体,并有新的工具和平台用于AI模型训练和机器人应用开发。 以下是详细新闻: OpenAI 发布 GPT-5.2,成人模式明年第一季度推出 - 宝玉 OpenAI 正式发布了其最新模型 GPT-5.2,旨 …
阅读更多Nano Banana Pro推出论文/作业涂鸦批注功能-歸藏(guizang.ai) Nano Banana Pro推出了一项创新功能,允许用户通过手写中文批注、涂鸦和剪贴画来注释论文或作业。这项功能旨在帮助用户更直观地理解复杂的学术内容,尤其适合大学水平的学生,通过个性化的视觉批注来阐释原理和细节。 fal启动欧洲创业项目,旨在帮助雄心勃勃的开发者-Emad fal公司在欧洲推出了其首个创业项目,旨在支持有雄心壮志的创业者和开发者。此举表明AI领域对欧洲创新生态系统的重视,以及对新兴AI技术和应用的持续投入。 Nano Banana Pro生成电影级跨时代场景融合图像-宝玉 Nano Banana Pro展示了一项强大的图像生 …
阅读更多以下是根据过去一段时间的X/Twitter数据整理的全球AI领域动态: Nano Banana Pro:多功能AI工具实现创意与决策可视化 - 歸藏(guizang.ai) Nano Banana Pro 作为一个综合性AI工具,展示了其在数据可视化和创意内容生成方面的强大能力。它能够通过实时网络搜索和顶尖设计能力,对任何领域进行“从夯到拉”的五级评价,并以“Bento Grid”信息图表形式呈现,例如对2025中国新能源汽车或无畏契约皮肤的锐评。此外,该工具还能生成3D四象限决策矩阵图,帮助用户进行商品购买决策,其风格酷似“大富翁”棋盘地图。在创意图像方面,Nano Banana Pro 可生成日式侘寂风格配图,以及将同一场景(如 …
阅读更多编者按: 本报告整理了过去一段时间全球AI领域的热点动态。请注意,根据提供的数据,所有内容均发布于格林尼治时间2025年12月7日16:00(北京时间2025年12月8日00:00),因此严格意义上不属于报告所限定的“过去4小时”时间窗内。然而,为了向您提供最新可用的AI趋势信息,我们将这些重要更新进行了梳理。 Nano Banana Pro多功能AI提示词及应用揭示-歸藏(guizang.ai) & 向阳乔木 & 宝玉 & Orange AI Nano Banana Pro被展示为一款功能强大的AI工具,其多样化的提示词能够帮助用户生成各种创意内容和数据可视化。核心应用包括:“夯到拉”产品评价图表,通过网络调研生成3D四象限决策矩 …
阅读更多Nano Banana Pro 推出多功能AI提示词模板,赋能万物锐评与可视化-歸藏(guizang.ai) 歸藏(guizang.ai) 近期发布了一系列围绕 “Nano Banana Pro” 的强大提示词模板,旨在帮助用户对世间万物进行锐评并生成高度可视化的信息图表。这些模板包括:基于实时网络搜索生成“从夯到拉”的五级产品评价榜单,采用“Bento Grid”布局;用于商品购买决策的3D四象限决策矩阵海报;以及以可爱黏土风格展示任何爱好或职业进阶之路的地图海报。该工具强调AI生成的意外话题度和美观性,并能针对特定领域如《无畏契约》皮肤进行锐评。 Andrej Karpathy:将LLM视为模拟器而非实体-Andrej …
阅读更多Anthropic报告:AI显著提升工程师效率,同时警示深度技能萎缩-Orange AI Orange AI分享了Anthropic关于AI如何重塑工程师的报告解读。报告指出,工程师使用AI后工作效率提升了50%,AI正成为全天候的合作者,将可验证、重复性的编码任务交给AI,使工程师能专注于高层次的策略、设计和判断。这种协作不仅显著提升了核心工作效率,还促成了27%此前不会启动的项目。然而,报告也警示,过度依赖AI可能导致工程师深度技术能力的萎缩,构成一个“待解的悖论”,因为有效监督AI恰恰需要深层专业知识。 GPT-5.2预计于12月9日发布,可能略有延后-歸藏(guizang.ai) 歸藏(guizang.ai)透 …
阅读更多