2025.12.24.20 过去24小时全球AI发生了什么?
以下是过去24小时全球AI领域的一些重要动态和观点:
清华大学教授、智谱AI首席科学家唐杰分享了对2025年大模型的七层感悟。他指出,预训练仍是基础,但中后训练和长尾对齐是提升模型效果的关键。Agent被视为模型从“学生”到“打工人”的跨越,是进入真实世界、产生实际价值的门槛。模型记忆能力是AI在真实环境中落地的刚需,同时,在线学习与自我评估可能成为下一个Scaling范式。唐杰强调,AI应用的第一性原理不应是创造新App,而是替代人类工作。他直言“领域大模型”是伪命题,并认为多模态和具身智能前景广阔但道路艰难,预判2026年将取得长足进步。
微软与复旦大学合作推出AniX系统,实现可控角色动画生成-向阳乔木
微软研究院与复旦大学联合发布了AniX系统,该系统能够将用户定义的3D角色置于3DGS场景中,并通过自然语言指令生成可控的动作视频,例如“往前跑”或“弹吉他”。AniX的核心优势在于其保持场景与角色一致性、拥有丰富的动作库(通过少量训练泛化出142种新动作)、支持持续互动以及可控的镜头视角。该系统利用GTA-V游戏录像作为训练数据,结合多视角角色输入和角色遮罩技术,在视觉质量和动作控制成功率上超越了现有视频生成模型。
Lovable增长负责人分享AI行业增长洞察:PMF保质期仅三月,应用本质是工种替代-Orange AI
全球增长最快的AI应用公司Lovable的增长负责人提出了AI行业的十大增长认知。他指出,由于模型更新周期快,PMF(产品市场契合度)的保质期仅为三个月,需持续重新赢得。产品发布需要达到“Wow Moment”,而非仅仅是MVP。社交媒体已取代SEO成为主要有机增长渠道,且产品路线图不宜超过三个月。Lovable在无销售团队的情况下实现了2亿ARR,并主张在当前阶段疯狂圈地,而非优化利润。发版速度和品牌好感度被认为是AI时代唯一的护城河,巨头的护城河也异常脆弱。
Vercel团队分享了一套编写v0等AI编程工具高效提示词的核心框架,该框架包含三个关键部分:产品表面(Product Surface)、使用场景(Context of Use)和约束条件(Constraints & Taste)。产品表面要求具体描述所需功能,使用场景则需明确用户、时间、决策和时间限制,而约束条件涵盖了风格、设备、布局和配色等细节。实践证明,提供清晰、详细的提示词能显著提高AI生成结果的准确性和效率,减少迭代修改。
AI Agent技术发展:Skill、SubAgent与上下文管理-宝玉
大语言模型中的Skill和SubAgent概念被解释为通过Prompt组织,如同工具说明书,由大模型根据场景自主触发。在上下文管理方面,MCP(Multi-tool Coordination Prompt)可能因工具说明过于臃肿导致上下文过载,而Skill则采用渐进式加载方式,先加载简介,按需加载完整说明。SubAgent通过将子任务委托出去,有效解决了上下文污染和过载问题,例如将Chrome Dev Tool封装,主Agent只接收分析结果,从而提升了任务执行的效率和泛化能力。
Grok的任务功能被推荐为高效的AI圈信息猎手工具。用户可以利用特定的提示词,设定监控特定账号在过去24小时内互动量最高或最具爆发潜力的帖子。该功能支持按互动量降序排序,并优先展示AI相关内容,输出格式包括排名、作者、内容摘要、总互动数和链接。用户需通过Grok独立站或App使用此功能,并可设置定时推送,以便实时掌握AI领域热点。
GLM-4.7在CSS Grid生成方面存在小问题-歸藏(guizang.ai)
有开发者反馈,智谱AI的GLM-4.7模型在代码生成方面整体表现良好,但在处理CSS Grid布局时仍存在一些细微问题,具体表现为卡片未能完美填充布局。这表明尽管大模型在代码生成能力上取得了显著进步,但在某些特定的前端细节和布局精确性上,仍有进一步优化的空间。
一款全新的超写实烟花提示词模板已正式发布,旨在帮助用户利用AI生成电影级真实感的庆典烟花秀。用户只需简单输入数字、字母或符号作为“主体”,AI即可将其完美地融入夜空中的烟花表演。该提示词强调高分辨率、摄影级真实质感、符合物理规律的粒子动态及柔和光照效果,并指定了金色、银色、白色、红色和蓝色等配色,以确保中央主体清晰醒目,同时背景烟花富有层次感且亮度适中。
有观察者提出,当前的AI视频生成技术已经发展到难以与真实情况区分的程度。这一现象引发了关于“这是AI视频还是真实情况”的疑问,凸显了AI生成内容在视觉真实感方面的飞速进步,以及未来在内容真伪辨别上可能面临的挑战。
对AI Skill交互的反思:大模型应将非结构化数据转化为结构化-宝玉
一篇评论指出,当前一些AI Skill的交互设计可能“反直觉”,甚至有“走回头路”之嫌。作者认为,大语言模型的真正优势在于其将非结构化数据转化为结构化数据的能力。理想的AI交互应是用户直接表达意图(如“为老板写圣诞明信片”),而非被要求像传统软件那样手动填写表单,AI应能主动整合信息并生成所需结构化内容,以最大化其智能价值和用户体验。
Replit在ChatGPT中集成,并考虑新增营销视频构建选项-Amjad Masad
在线集成开发环境(IDE)平台Replit已成功在ChatGPT中集成其应用,旨在为开发者提供更加便捷和智能的编程环境。Replit的CEO Amjad Masad还透露,公司正在积极考虑将**“营销视频”作为一项新的构建选项**加入平台,以帮助用户更轻松地创建和发布产品推广视频。此举获得了社区的积极反响,进一步强化了Replit在开发工具领域的生态布局。
AI Agent使用趋势:用户更多地外包认知而非自动化任务-Peter H. Diamandis, MD
根据Perplexity和哈佛大学的最新数据分析,AI Agent的实际使用模式揭示了一个显著趋势:用户正越来越多地利用AI Agent来外包“认知”任务,而非仅仅自动化简单的日常杂务。研究、信息综合和复杂工作流管理在AI Agent的应用中占据主导地位,这表明用户正在利用AI进行更高层次的思考、分析和组织工作,从而延伸了人类的认知能力。
哈利波特主题3D圣诞卡片海报AI生成提示词分享-歸藏(guizang.ai)
归藏(guizang.ai)分享了一个详尽的AI提示词,用于生成一张极具视觉张力的《哈利波特》主题3D圣诞卡片海报。该提示词详细描绘了一张厚重精致的3D贺卡,其中央凹槽内是羊毛毡与粗棒针编织的微缩霍格沃茨城堡和海格小屋等IP场景,配以雪地、圣诞树及Q版经典角色。卡片上方有半透明磨砂玻璃质感的3D“Merry Christmas”艺术字,周围环绕红色天鹅绒丝带等节日元素。背景设定为东方水墨流光虚空,底部包含手写体名言,并指定了C4D、Octane渲染、8K分辨率、微距摄影等高级渲染参数,以实现电影级真实感。