2025.12.24.04 过去4小时全球AI发生了什么?

  1. GLM 4.7 模型发布:开放前沿模型的重大飞跃 - merve GLM 4.7 模型已正式发布,被誉为开放前沿模型的重大飞跃。该版本在编码、复杂推理和工具使用方面取得了显著进步,性能超越DeepSeek V3.2,并在多项任务中表现优于部分闭源模型。GLM 4.7已在Hugging Face Transformers和推理提供商上同步可用,进一步推动了开源AI领域的发展。

  2. 微软与复旦大学合作推出AniX系统,实现可控角色动画生成 - 向阳乔木 微软研究院与复旦大学共同开发了AniX系统,旨在实现可控的3DGS场景角色动画生成。用户可通过自然语言指令控制3D场景中的角色,例如“往前跑”或“弹吉他”,系统便能生成相应的视频。AniX系统核心能力包括场景和角色一致性、丰富的动作库(能从4个基础动作泛化出142种新动作)、持续互动性以及可控的镜头。该系统基于HunyuanCustom(130亿参数)和Flow Matching训练方法,并利用GTA-V游戏录像作为训练数据。AniX在WorldScore评估体系中表现优异,尤其在动作控制成功率和角色一致性方面显著超越现有模型。

  3. 深入解析Vibe Coding:AI编程时代的人机协作挑战 - 宝玉 一篇名为《A Year Of Vibes》的文章总结了2025年Vibe Coding的发展,指出资深开发者如今主要通过指挥AI来编写代码,转变为“虚拟实习生的技术领导”。文章探讨了AI编程工具(如Amp、Claude Code、Pi、Codex)的普及,并提出AI编程决策日益依赖“直觉”或“感觉”(vibes)。作者Armin Ronacher(Flask框架作者)表达了对人机关系和AI“人格”化的困惑,并指出了AI编程面临的实际痛点:缺乏针对提示词的版本控制、现有代码审查流程不适应人机协作,以及需要更强的可观测性工具。文章强调,如何负责任地使用AI进行代码编写是未来产品发展的关键方向。

  4. Grok任务功能:AI圈热帖信息捕手 - 向阳乔木 Grok的任务功能被推荐为每日AI圈热帖的信息捕手。用户可以通过特定提示词,筛选指定账号过去24小时内互动量最高或最具传播潜力的50个AI相关帖子,并按互动量降序输出摘要和链接。此功能需在Grok的独立站或App中使用,X上的Grok不适用。这一工具为AI从业者提供了高效追踪行业动态的途径。

  5. 超写实烟花提示词模板,轻松打造电影级视觉庆典 - 宝玉 一个全新的超写实烟花提示词模板已上线,用户只需输入数字、字母或符号,即可生成完美融入烟花中的超清主体,实现电影级的庆典效果。该模板详细描述了夜空背景、烟花色彩、光影效果和粒子动态,确保生成图像具有摄影级真实感和视觉冲击力,例如可生成“I ❤️ U”、“🎄”或“2026”形状的烟花。

  6. 2025年AI行业年度产品榜单与发展趋势洞察 - 歸藏(guizang.ai) 知乎发布了2025年度AI产品榜单。国内通用聊天产品中,字节的豆包Deepseek位居前列,阿里千问也迅速崛起。海外ChatBot方面,谷歌的Gemini因强大模型和低成本优势表现突出,Anthropic的Claude Code在编程领域表现强劲,而OpenAI的ChatGPT仍是产品体验最佳,用户忠诚度高。内容创作工具如即梦和可灵在图像视频领域仍需追赶Nano Banana Pro和Sora2。Cursor被认为是今年Agent领域的开创者,其在上下文工程、模型混合调用和交互逻辑上的创新为AI Agent产品指明了方向。

  7. AI模型能力突破:CFA考试基准即将耗尽 - Peter H. Diamandis, MD AI模型的进展正在迅速耗尽现有基准。2023年,GPT-3.5未能通过CFA考试,但到了2025年,Gemini 3.0 Pro已取得97.6%的高分,GPT-5也通过了二级考试,成绩达94.3%。目前已有五款模型能够通过CFA全部三个级别的考试,表明AI在复杂专业领域的推理能力已达到人类专家水平。

  8. Hugging Face的职业加速器作用与Google的开源贡献 - clem 🤗 Hugging Face被赞誉为强大的职业加速器,其团队成员备受大型AI公司青睐,例如VB即将加入OpenAI。Hugging Face鼓励更多人才加入,共同推动AI的开放与协作。此外,Google也在Hugging Face上发布了一系列开源模型,涵盖Agent构建、医疗用例和多模态应用,体现了开放合作的趋势。

  9. Replit与ChatGPT实现集成,Vibecon大会将至 - Amjad Masad Replit已正式成为ChatGPT内部应用,用户现在可以直接在ChatGPT对话中启动应用程序构建。此外,2026年夏季将在纽约市举办Vibecon大会,目前已开放邀请申请,这预示着Vibe Coding社区和相关工具的进一步发展和交流。

  10. Prompt的价值:从用户到AI工程师的转变 - 宝玉 对于“大模型时代是否还需要Prompt”的疑问,作者指出,对于简单任务直接描述即可,但对于复杂任务,专业提示词是必不可少的“数学公式”和“工作流经理”。提示词能够将模糊需求拆解为清晰思维链,指导AI进行复杂思考,例如将学术论文改写成科普文章,或生成带配图的PPT。提示词的真正价值在于,它将用户从“提问者”转变为“指挥AI的工程师”,使其成为稳定输出高质量产品的“工具”,从而大幅提升效率。

  11. AI时代知识论的挑战:如何从AI信息中提取真知? - sarah guo 在AI可以按需起草、解释和提出解决方案的时代,如何将AI生成的大量看似合理却可能空洞的信息转化为真正的价值成为了一个核心问题。AI现在可以轻易地制造出“认知姿态”(confidence + coherence + detail),但这不再意味着与底层事物的真实接触。因此,实践需要适应,更加注重信息来源(provenance)不确定性(uncertainty)的清晰表达以及快速验证。这引发了关于AI时代知识论的深刻思考,即如何有效利用AI知识,避免陷入看似可靠的噪音。

  12. 欧洲对美国科技公司的罚款超其欧洲科技公司税收 - 向阳乔木 去年,欧洲对美国科技公司的罚款收入,超过了其对欧洲本土科技公司征收的税收总额。这反映出欧洲在数字监管方面对大型美国科技公司的严格立场,以及由此产生的经济影响。

  13. Peter Diamandis:我们是星际迷航一代的祖先 - Peter H. Diamandis, MD Peter H. Diamandis强调,我们是“星际迷航一代的祖先”,呼吁人们着眼未来。他指出,2025年的一项调查显示,45%的美国成年人选择生活在过去,而只有14%选择未来,这反映了对历史的误读和对过去的浪漫化倾向。他强调,现代技术(如非洲儿童用智能手机获取的信息量远超20年前的美国总统)正在创造前所未有的指数级发展时代,并呼吁人们停止关注负面新闻,转而积极创造自己想要的未来,将“月球计划”(Moonshot)定义为实现10倍的巨大进步,而非10%的微小改进。

  14. DeepMind创始人Demis Hassabis回顾“富有成效的一年” - Demis Hassabis DeepMind创始人Demis Hassabis简要总结道,DeepMind度过了“富有成效的一年”。尽管具体细节未披露,但作为全球领先的AI研究机构,此言预示着他们在AI领域可能取得了重要进展。

  15. Emad观点:AI在数学证明中应激发直觉而非仅自动化 - Emad Emad表示,AI在自动化数学证明方面的作用并非最引人注目。他认为,更有趣的是如何利用AI激发人类的直觉和灵感,就像数学家斯里尼瓦萨·拉马努金那样。他建议将具体的证明留给AI(GPU)来处理,而人类则专注于探索和发挥创造力。