2025.12.24.18 过去4小时全球AI发生了什么?
注:本次报告内容基于2025年12月23日16:00 UTC(北京时间2025年12月24日00:00)发布的X/Twitter数据,与报告生成时间存在一定时差。
清华大学教授、智谱AI首席科学家唐杰分享了对2025年大模型发展的七点感悟。他指出,预训练仍是基础,但中后训练对长尾能力和真实场景对齐至关重要。Agent是模型从“学生”到“打工人”的关键跨越,记忆能力是刚需,而在线学习和自我评估可能是下一个Scaling范式。唐杰强调,AI应用的第一性原理是替代人类工作,而非创造新App,并认为领域大模型在AGI面前将是伪命题。多模态和具身智能前景光明但挑战重重,预计2026年将有显著进步。这些观点与Andrej Karpathy的观察有诸多共鸣。
Peter H. Diamandis博士援引Perplexity和哈佛大学的数据揭示,AI Agent的用户实践与预期有所不同。用户并未将AI Agent主要用于自动化日常琐事,而是将其用于认知外包,如研究、内容合成和工作流程管理。这一发现表明AI Agent正在深入人类更高层次的思维和组织任务中,而非仅仅是执行简单的指令。
Vercel团队总结了编写高效v0(以及类似AI编程工具Lovable)提示词的核心框架:“产品表面”、“使用场景”和“约束条件”。强调提示词需具体描述要构建的组件和功能、目标用户及使用情境,并明确视觉风格、布局等限制。通过对比测试,结果显示详细、清晰的提示词能显著提高生成质量和效率,减少迭代次数,最终实现更快的产品开发。
微软研究院与复旦大学团队共同发布了AniX系统,该系统能基于自然语言指令,在3DGS(3D Gaussian Splatting)场景中生成可控的3D角色动画视频。AniX的核心能力包括场景与角色一致性、丰富的动作库(从少量基础动作泛化出142种新动作)、持续互动性及可控的镜头。系统利用《GTA-V》游戏录像进行训练,在视觉质量和动作控制成功率方面超越了现有视频生成模型。论文指出游戏数据和多视角角色输入对提升泛化能力和一致性至关重要。
ARR达到2亿美元的AI应用公司Lovable增长负责人分享了对AI行业高速发展的认知。他表示,在AI时代,PMF(产品市场契合度)的保质期只有三个月,MVP已死,需要“MLP”才能引发用户“Wow Moment”。SEO和长期路线图也已失效,社交媒体成为唯一有机增长渠道。公司放弃了销售团队和利润率优化,专注于发版速度和品牌好感度作为核心护城河,并强调即便巨头如OpenAI,其护城河也极为脆弱,需持续迭代优秀模型。
一个实用的提示词模板被分享,教用户如何利用Grok的任务功能来追踪AI圈热点信息。该提示词能筛选指定X/Twitter账号在过去24小时内互动量最高或最具潜力的AI相关帖子,并以排名、作者、内容摘要、总互动数及链接的形式输出,帮助用户高效获取有价值的AI动态。
一个详细的提示词被分享,用于指导AI生成一张视觉张力十足的哈利波特主题3D圣诞卡片海报。该提示词细致描述了卡片主体、毛毡微缩场景、经典角色互动、节日生态、3D流体磨砂艺术字标题、华丽动态装饰及东方水墨流光背景等元素,旨在通过精细化指令实现电影级真实感的艺术作品。
一款全新的超写实烟花提示词模板上线,用户只需输入数字、字母或符号,即可生成完美融合在烟花中的超清主体,打造电影级庆典效果。该模板详细定义了夜空背景、烟花颜色组合、光晕辉光效果以及粒子动态,确保生成图像具有高度真实感和视觉冲击力。
Replit作为AI开发平台,其应用场景正在不断扩展。最新消息显示,Replit已集成到ChatGPT中,允许用户在ChatGPT内直接使用Replit功能。此外,Replit还被用于将书籍内容转化为在线互动体验,并探讨将“营销视频”作为Replit的构建选项,进一步简化开发者的工作流程,凸显了其在AI辅助开发和内容创作方面的潜力。
有观点指出,某些AI“Skill”的交互方式显得反直觉,甚至有“走回头路”的趋势。评论认为,大语言模型的优势在于将非结构化数据转化为结构化信息,因此AI应能自动从自然语言中生成结构化数据,而非让用户像传统模式一样逐一填写表单,这违背了LLM的强项。
对大模型中**“Skill”和“SubAgent”的概念及其上下文管理**进行了深入探讨。这些功能通过Prompt(提示词)来组织,如同工具说明书。大模型根据场景动态触发这些功能。为了解决上下文污染和过载问题,Skill采用渐进式加载(先简介后详情),而SubAgent则将子任务委托出去,确保其中间结果不会占用主Agent的上下文,例如将强大的Chrome Dev Tool封装为SubAgent。
一条引人深思的推文将与AI对话(编写提示词)比作发布“征婚启事”。如果提示词模糊,就像“找个姑娘”一样,结果会随机且低效。而详细、具体的提示词,明确需求、背景和约束,则能更精准地获得理想结果。这强调了提示词工程中明确性和迭代的重要性,以减少试错成本。
GLM-4.7模型在处理特定提示词进行代码生成时,表现出不错的效果。然而,在CSS Grid布局方面出现了一些小问题,未能完美填充卡片。这表明尽管AI在代码生成方面已取得显著进步,但在处理复杂的布局和细节时仍存在挑战,需要进一步的优化和改进。
AI工具“Opal”在Hacker News内容洞察上的应用
AI工具“Opal”被展示出在Hacker News内容洞察方面的强大潜力。通过一个简单指令,Opal能够在三分钟内查询并总结过去24小时内Hacker News上得分最高的帖子内容,为用户提供了快速高效的信息获取途径。