Andrej Karpathy 2025 年 LLM 回顾:六大变革 Andrej Karpathy 在其2025年LLM回顾中指出六大变革:**可验证奖励强化学习(RLVR)**成为训练大模型的新范式,算力更多用于强化学习而非预训练,使得模型能自主摸索推理策略;他将大模型智能比喻为“召唤幽灵”,强调其能力分布不均,并对基准测试的信任度降低;Cursor展现了LLM应用层的潜力,将基础模型转化为特定领域专业团队;Claude Code作为首个可信智能体,通过命令行工具在本地运行,改变了AI的交互范式;Vibe Coding使编程大众化,任何人都能通过自然语言创建复杂程序;Nano Banana被认为是大模型的GUI,预示着AI交互 …
阅读更多Redis 之父 Salvatore Sanfilippo 发布 2025 年终 AI 反思:LLM 能力超预期,强化学习开启新可能 Redis 创始人 Salvatore Sanfilippo 分享了对 2025 年 AI 发展的八点洞察。他指出,大语言模型(LLM)的“随机鹦鹉”说法已过时,模型在各类考试中表现优异并形成内部概念表征。思维链(CoT)被低估,它通过内部表征采样和强化学习来优化推理过程。算力扩张瓶颈被可验证奖励的强化学习打破,使模型能自我提升。程序员对 AI 辅助编程的态度已从怀疑转变为接受,并出现“AI 同事”和“AI 智能体”两种主要使用模式。Sanfilippo认为Transformer架构仍有潜力, …
阅读更多Andrej Karpathy 2025年度LLM回顾:训练范式升级与AI GUI时代 OpenAI联合创始人Andrej Karpathy发布2025年LLM年度回顾,指出六大变化。训练范式新增“可验证奖励强化学习(RLVR)”,使模型在有标准答案的环境中自发习得推理策略,大幅提升推理能力,并改变算力分配。AI智能展现“参差不齐”特性,基准测试面临挑战。LLM应用层兴起,如Cursor,专注于上下文工程、多模型编排及专业界面。Claude Code展示本地AI智能体潜力,预示AI“住进”电脑。Vibe Coding让非专业人士也能编程,代码变得廉价即用。Google Gemini Nano Banana预示大模型“图形界面时代” …
阅读更多OpenAI推出GPT-5.2-Codex,Coding Agent能力凸显-Sam Altman OpenAI首席执行官Sam Altman宣布发布GPT-5.2-Codex,该模型专为Agentic编码和终端使用进行训练。Django框架联合创始人Simon Willison利用Codex CLI + GPT-5.2,成功将一个9000行Python库移植到JavaScript,仅使用了约8条提示词。Willison分析称,Coding Agent的“舒适区”在于语言翻译、拥有完整测试集、预设架构,并通过专家操作形成“智能体闭环”,从而高效完成复杂任务。 Google发布FunctionGemma与T5Gemma …
阅读更多以下是过去一段时间全球AI领域的重点新闻和进展: 谷歌Gemini 3 Deep Think的预测及2026年AI行业趋势分析-歸藏(guizang.ai) 谷歌发布了由Gemini 3驱动的Deep Think模型,并基于OpenRouter的报告分析了2026年AI行业发展趋势。预测指出,推理成本将大幅降低,云厂商的商业模式可能从“按Token收费”转向“按任务结果收费”,企业将更愿意为实际解决问题的成果付费。此外,AI基础设施将重构,全面支持有状态架构,使AI Agent能保持数小时甚至数天的“工作记忆”和上下文环境,无需重复上传数据,从而提升Agent的实用性和效率。 阿里巴巴发布Qwen3-TTS语音合成模型-小互 阿里巴 …
阅读更多以下是过去4小时全球AI领域的精选动态: Andrew Ng:西方世界对AI缺乏信任 Edelman和Pew Research的报告显示,美国及大部分欧洲和西方国家民众对AI持不信任态度,缺乏热情。相比之下,中国对AI的接受度更高。这种普遍的不信任阻碍了AI的普及和重要项目的推进,例如导致谷歌在印第安纳州的数据中心计划受阻,并增加了阻碍AI发展的立法风险。吴恩达呼吁AI社区应坦诚面对AI的益处与潜在危害,积极解决问题,并纠正媒体对AI危险性的过度炒作,以重建公众信任。 OpenAI推出AI“告解室”机制,提升模型诚实度 OpenAI最新研究引入了名为“confessions”(告解)的方法,旨在让AI诚实反馈其回答中是否存在偷懒、作 …
阅读更多以下是过去一段时间全球AI领域的重要动态: Runway 发布 Gen-4.5 视频生成模型,注重物理与视觉精度 - 歸藏(guizang.ai) Runway 推出了其最新视频生成模型 Gen-4.5。虽然该版本未带来范式革新,但其在多方面进行了显著升级,包括提升了物理与视觉精度,能够处理更复杂场景与详细构图。模型在物理准确性方面有所增强,并能生成更富有表现力的角色。此外,Gen-4.5 也优化了风格化与风格一致性,使其在生成电影感与真实日常场景时表现更佳。 国产AI视频生成应用内测,音画同步但风格抽象 - 向阳乔木 一项国产AI视频生成应用目前正在进行内测。该应用声称能够实现音画同步,这是一项重要的技术突破。然而,测试用户反馈其 …
阅读更多过去4小时全球AI要闻回顾 Runway 发布 Gen-4.5 视频生成模型:多维度升级,控制更灵活 Runway 发布了其最新的 Gen-4.5 视频生成模型,尽管未带来范式上的革新,但在多方面进行了显著升级。新模型提升了物理与视觉精度,能够处理更复杂场景与详细构图,增强了物理准确性,并能生成富有表现力的角色。同时,Gen-4.5 在风格化与风格一致性方面也有进步,能创造出更具电影感和真实日常场景的视频。此外,模型还全面升级了控制方式,除了文字生成视频 (Text to Video),还支持图片转视频、关键帧控制及视频转视频编辑,使创作流程更加灵活,接近专业视频剪辑软件的体验。 DeepSeek V3.2 正式发布: …
阅读更多以下是过去4小时内全球AI领域的重要动态: 微软CEO萨蒂亚·纳德拉:AI发展面临电力和数据中心机架短缺挑战-小互 微软CEO萨蒂亚·纳德拉指出,当前AI发展面临的主要瓶颈并非GPU或AI芯片供应短缺,而是缺乏足够的电力和可用的数据中心机架来运行这些高性能计算设备。他强调,数据中心必须靠近电源设施,而全球范围内的电力供应和基础设施审批速度难以跟上AI指数级增长的需求,这导致了算力投资的潜在浪费。微软自身也已遭遇“电力和基础设施短缺好几个季度”,预示着能源和核电等相关领域可能成为新的投资焦点。 拾象对2025 AGI主线思考:AI Agent能力每7个月翻倍,垂直Agent成硅谷热点-向阳乔木 一份来自拾象关于2025年通用人工智 …
阅读更多Ben Tossell的专家平台新增机构身份选项-Ben Tossell Ben Tossell宣布,其专家平台experts.bensbites.com已新增允许用户指定自己是否属于某个代理机构的功能。尽管用户仍需通过个人账户注册,但这一更新为代理机构成员提供了更明确的身份标识,有助于完善平台上的专家信息和合作模式。 AI未来预测与个人发展建议-向阳乔木 一位作者分享了对AI未来的一些**“疯狂”预测和个人发展建议**。预测中提及了培养讲故事能力、提升品味、真人出镜建立信任等已形成共识的方向,但部分观点仍待验证。作者建议当下可着手培养品味与讲故事能力,学习编排组合AI工具并掌控AI Agent,建立人机协作的作品集,并积极探 …
阅读更多