Andrej Karpathy 2025年度LLM回顾:训练范式升级与AI GUI时代 OpenAI联合创始人Andrej Karpathy发布2025年LLM年度回顾,指出六大变化。训练范式新增“可验证奖励强化学习(RLVR)”,使模型在有标准答案的环境中自发习得推理策略,大幅提升推理能力,并改变算力分配。AI智能展现“参差不齐”特性,基准测试面临挑战。LLM应用层兴起,如Cursor,专注于上下文工程、多模型编排及专业界面。Claude Code展示本地AI智能体潜力,预示AI“住进”电脑。Vibe Coding让非专业人士也能编程,代码变得廉价即用。Google Gemini Nano Banana预示大模型“图形界面时代” …
阅读更多OpenAI推出GPT-5.2-Codex,Coding Agent能力凸显-Sam Altman OpenAI首席执行官Sam Altman宣布发布GPT-5.2-Codex,该模型专为Agentic编码和终端使用进行训练。Django框架联合创始人Simon Willison利用Codex CLI + GPT-5.2,成功将一个9000行Python库移植到JavaScript,仅使用了约8条提示词。Willison分析称,Coding Agent的“舒适区”在于语言翻译、拥有完整测试集、预设架构,并通过专家操作形成“智能体闭环”,从而高效完成复杂任务。 Google发布FunctionGemma与T5Gemma …
阅读更多以下是过去一段时间全球AI领域的重点新闻和进展: 谷歌Gemini 3 Deep Think的预测及2026年AI行业趋势分析-歸藏(guizang.ai) 谷歌发布了由Gemini 3驱动的Deep Think模型,并基于OpenRouter的报告分析了2026年AI行业发展趋势。预测指出,推理成本将大幅降低,云厂商的商业模式可能从“按Token收费”转向“按任务结果收费”,企业将更愿意为实际解决问题的成果付费。此外,AI基础设施将重构,全面支持有状态架构,使AI Agent能保持数小时甚至数天的“工作记忆”和上下文环境,无需重复上传数据,从而提升Agent的实用性和效率。 阿里巴巴发布Qwen3-TTS语音合成模型-小互 阿里巴 …
阅读更多以下是过去4小时全球AI领域的精选动态: Andrew Ng:西方世界对AI缺乏信任 Edelman和Pew Research的报告显示,美国及大部分欧洲和西方国家民众对AI持不信任态度,缺乏热情。相比之下,中国对AI的接受度更高。这种普遍的不信任阻碍了AI的普及和重要项目的推进,例如导致谷歌在印第安纳州的数据中心计划受阻,并增加了阻碍AI发展的立法风险。吴恩达呼吁AI社区应坦诚面对AI的益处与潜在危害,积极解决问题,并纠正媒体对AI危险性的过度炒作,以重建公众信任。 OpenAI推出AI“告解室”机制,提升模型诚实度 OpenAI最新研究引入了名为“confessions”(告解)的方法,旨在让AI诚实反馈其回答中是否存在偷懒、作 …
阅读更多以下是过去一段时间全球AI领域的重要动态: Runway 发布 Gen-4.5 视频生成模型,注重物理与视觉精度 - 歸藏(guizang.ai) Runway 推出了其最新视频生成模型 Gen-4.5。虽然该版本未带来范式革新,但其在多方面进行了显著升级,包括提升了物理与视觉精度,能够处理更复杂场景与详细构图。模型在物理准确性方面有所增强,并能生成更富有表现力的角色。此外,Gen-4.5 也优化了风格化与风格一致性,使其在生成电影感与真实日常场景时表现更佳。 国产AI视频生成应用内测,音画同步但风格抽象 - 向阳乔木 一项国产AI视频生成应用目前正在进行内测。该应用声称能够实现音画同步,这是一项重要的技术突破。然而,测试用户反馈其 …
阅读更多过去4小时全球AI要闻回顾 Runway 发布 Gen-4.5 视频生成模型:多维度升级,控制更灵活 Runway 发布了其最新的 Gen-4.5 视频生成模型,尽管未带来范式上的革新,但在多方面进行了显著升级。新模型提升了物理与视觉精度,能够处理更复杂场景与详细构图,增强了物理准确性,并能生成富有表现力的角色。同时,Gen-4.5 在风格化与风格一致性方面也有进步,能创造出更具电影感和真实日常场景的视频。此外,模型还全面升级了控制方式,除了文字生成视频 (Text to Video),还支持图片转视频、关键帧控制及视频转视频编辑,使创作流程更加灵活,接近专业视频剪辑软件的体验。 DeepSeek V3.2 正式发布: …
阅读更多以下是过去4小时内全球AI领域的重要动态: 微软CEO萨蒂亚·纳德拉:AI发展面临电力和数据中心机架短缺挑战-小互 微软CEO萨蒂亚·纳德拉指出,当前AI发展面临的主要瓶颈并非GPU或AI芯片供应短缺,而是缺乏足够的电力和可用的数据中心机架来运行这些高性能计算设备。他强调,数据中心必须靠近电源设施,而全球范围内的电力供应和基础设施审批速度难以跟上AI指数级增长的需求,这导致了算力投资的潜在浪费。微软自身也已遭遇“电力和基础设施短缺好几个季度”,预示着能源和核电等相关领域可能成为新的投资焦点。 拾象对2025 AGI主线思考:AI Agent能力每7个月翻倍,垂直Agent成硅谷热点-向阳乔木 一份来自拾象关于2025年通用人工智 …
阅读更多Ben Tossell的专家平台新增机构身份选项-Ben Tossell Ben Tossell宣布,其专家平台experts.bensbites.com已新增允许用户指定自己是否属于某个代理机构的功能。尽管用户仍需通过个人账户注册,但这一更新为代理机构成员提供了更明确的身份标识,有助于完善平台上的专家信息和合作模式。 AI未来预测与个人发展建议-向阳乔木 一位作者分享了对AI未来的一些**“疯狂”预测和个人发展建议**。预测中提及了培养讲故事能力、提升品味、真人出镜建立信任等已形成共识的方向,但部分观点仍待验证。作者建议当下可着手培养品味与讲故事能力,学习编排组合AI工具并掌控AI Agent,建立人机协作的作品集,并积极探 …
阅读更多AI模型中文表现对比与局限 - 歸藏(guizang.ai) 归藏(guizang.ai)分享了对AI模型Nano Banana和提示词GPT的使用体验,指出它们在英文等非中文语境下表现出色,但中文处理能力存在明显问题,出问题概率较高。这表明当前一些AI模型在多语言能力上仍有提升空间,尤其是在中文的精细化处理方面面临挑战,提示开发者需进一步优化模型对非英语语种的支持。 曲凯解读OpusClip增长秘诀 - Orange AI Orange AI 推荐了曲凯老师关于 OpusClip增长秘诀 的播客文字稿,强调其高含金量和一线实践价值。内容指出,与营销公司及非一线人员的分享相比,一手的实践经验对于企业增长策略至关重要。这篇播客被认为 …
阅读更多以下是过去4小时全球AI领域的动态摘要: Gary Marcus 引用The Information报道暗示AI领域存在“一贯的谎言模式” - Gary Marcus 知名AI研究者Gary Marcus引用The Information的报道,指出AI领域可能存在“一贯的谎言模式”,并提出疑问:“Ilya 到底看到了什么?”这番言论暗示了AI技术在透明度与可信度方面可能面临的挑战,尤其是关于其开发过程、能力或风险的沟通。这一讨论呼吁行业在追求技术进步的同时,更加重视伦理标准和信息披露的真实性。 向阳乔木分享Q版IP形象生成提示词,细致要求三视角效果图及线稿 - 向阳乔木 微博用户“向阳乔木”分享了一个详细的AI提示词,旨在生成Q版 …
阅读更多