2025.12.22.08 过去4小时全球AI发生了什么?


以下是过去一段时间全球AI领域的重要动态汇总:

  1. AI2发布SOTA多模态模型Molmo 2演示 - merve AI2(Allen Institute for AI)发布了其最新SOTA(State-of-the-Art)多模态模型Molmo 2的演示版本,现已在Hugging Face平台上线。Molmo 2支持多图像输入,展现了在处理复杂多模态数据方面的先进能力,为研究人员和开发者提供了强大的新工具,以探索和构建更加智能的多模态AI应用。该模型的推出有望推动多模态理解和生成领域的发展。

  2. Allen AI推出SAGE-MM模型演示,专注于长视频推理 - merve Allen AI发布了多模态模型SAGE-MM的演示版本,该模型专为长视频推理而设计。SAGE-MM被定位为一种“智能的任意视界代理”,能够有效处理并理解长时间的视频内容,具备卓越的事件检测和复杂场景理解能力。该演示已在Hugging Face上可用,为视频分析、内容理解和自动化等领域带来了新的研究和应用潜力。

  3. 小米MiMo论文揭示AI前端开发强劲秘诀 - 宝玉 小米在其MiMo论文中阐述了其AI在前端开发方面表现出色的核心原因。关键在于其基于视觉的验证器,该验证器通过评估录制视频片段的性能来综合考量视觉质量、功能准确性和可执行性。这种创新的奖励机制确保了模型在训练过程中能够同时优化生成应用程序的外观和实际功能,显著提升了AI生成前端代码的效率与用户体验。

  4. Nano Banana Pro高效动画制作方法 - 宝玉 有用户分享了利用Nano Banana Pro制作高质量动画的简便方法。首先,通过特定的提示词(例如“write ‘A high-quality 3D medical illustration of a [你想表达的内容]’")生成专业的3D医疗插画。随后,将这些生成的图片作为AI视频工具的首帧图,即可进一步生成流畅的视频动画。这种流程极大地简化了专业动画的制作门槛和周期。

  5. Codex正式支持“Skills”机制,增强规划能力 - 歸藏(guizang.ai) OpenAI的Codex已正式引入Skills(技能)机制,有效解决了其长期以来缺乏“Plan模式”的痛点。现在,用户只需在提示词中加入$plan即可调用内置的规划技能,而对于更复杂的规划任务,则可以使用execplan。这一重大更新显著提升了Codex处理复杂问题的能力,使其能够进行更精细的任务分解和执行。业内人士认为,“skills是新的apps”,预示着AI应用开发范式正向更智能、模块化的方向发展。

  6. Andrej Karpathy回顾2025年LLM六大变革 - 向阳乔木 Andrej Karpathy对2025年大型语言模型(LLM)的发展进行了深度总结,提出了六个“改变格局”的关键点。他指出,可验证奖励强化学习(RLVR)已成为模型训练的新范式,LLM智能呈现不均匀的“幽灵”形态。此外,Cursor等应用揭示了LLM应用层的巨大潜力,Claude Code将AI智能体引入个人电脑,Vibe Coding则推动了编程的普及化。最后,他认为Google Gemini Nano Banana是探索大模型图形用户界面(GUI)的早期尝试。Karpathy强调,LLM的能力虽有显著提升,但行业仍未完全释放其潜力,未来发展仍充满挑战与机遇。

  7. 近半数美国工人正使用AI,采用速度创纪录 - Peter H. Diamandis, MD 最新数据显示,接近50%的美国工作者已开始使用AI技术,这一数字令人瞩目。Peter H. Diamandis, MD指出,这很可能是有史以来技术采用速度最快的一次。AI在职场中的迅速普及,不仅预示着劳动力市场将经历深刻变革,也体现了AI工具在提高生产力和效率方面的巨大吸引力。这一趋势将持续影响企业运营和个人职业发展。

  8. Replit推出$1000信用包限时20%折扣 - Amjad Masad Replit宣布推出一项一次性20%折扣的1000美元信用包,旨在鼓励开发者在即将到来的假期期间,利用Replit平台构建和发布项目。此优惠为那些计划投入AI或软件开发项目的用户提供了经济实惠的机会,特别适合希望利用Replit强大的云端开发环境快速迭代和部署创意的开发者。

  9. AI初创公司面临巨头挑战的现实与出路 - Orange AI 当前AI初创公司若想挑战Google或字节跳动等巨头,几乎不可能建立核心竞争壁垒。有观点指出,初创企业的生存之道在于深耕巨头不重视的利基市场,或专注于巨头期望其完成的任务,从而在夹缝中求生存并实现盈利。从现实角度来看,这是避免正面竞争的务实选择;而从理想主义角度,创业者仍可选择大胆尝试,突破现状。

  10. 使用Gemini生成高质量信息图的实用技巧 - 宝玉 生成高质量信息图有几个关键技巧。首先,建议利用Gemini模型,因为它能在生成前进行推理、提炼信息并优化提示词,从而充分发挥大型语言模型的能力。其次,图像生成具有一定的随机性,需要多次尝试才能“抽卡”获得满意的结果。最后,即使得到了好的初稿,仍需进行细致的微调。这表明AI生成内容的高质量产出,离不开用户对工具的深入理解与精细操作。

  11. Merve预测2026年为AI科学之年,聚焦关键趋势 - merve Merve预测2026年将成为“AI科学之年”,认为Google DeepMind及Periodic Labs等将引领前沿研究,CERN等科学机构也将发布更多模型和数据集。她还预见了几个关键技术趋势,包括:更小、更强大、幻觉更少且具备推理能力的全能模型;能够控制手机并利用视觉LM进行截图的设备端MCPs及智能体;以及更多的产品/UI革新。此外,计算机视觉和机器人技术预计将走向主流。假期期间,她计划深入研究OpenEnv、视觉基础模型蒸馏、VLM定位及代理式VLM。

  12. Google AI Pro会员现可赠送高级功能访问权 - Demis Hassabis Google宣布,Google AI Pro会员现在可以通过两种方式赠送更高权限的AI功能和模型访问权。此举旨在扩大Google AI Pro服务的用户基础,并利用礼品赠送机制吸引更多用户体验其高级AI特性和模型,尤其在节假日期间,有望进一步提升其AI产品的市场渗透率。

  13. Loreco团队展示AI加速游戏开发:8周完成12个月工作量 - Fei-Fei Li Loreco团队成功展示了人工智能在游戏开发领域的颠覆性效率。他们宣称,仅用8周时间就开发完成了一款在传统模式下需要12个月才能完成的游戏。这一里程碑式的成就凸显了AI技术在大幅缩短开发周期、降低成本方面的巨大潜力,预示着未来游戏产业,特别是独立游戏开发,将迎来新的变革与发展机遇。

  14. Nano Banana Pro被指“降智”:大模型“出道即巅峰”现象 - Orange AI 有观察者指出,Nano Banana Pro近期似乎出现了**“降智”现象**,与此前GPT-4、Sora等大模型类似,普遍呈现出“出道即巅峰”的特点,随后便经历**“降智、审核、量化、降本”**的过程。这一现象反映出大模型在发布初期可能追求极致性能,但在后续运营中,出于成本控制或合规性考虑,可能不得不牺牲部分性能,从而影响用户体验和长期留存。

  15. Ranke-4B:一款训练数据截止1913年的“时光琥珀LLM” - 宝玉 Ranke-4B被形象地称为“时光琥珀LLM”,其独特之处在于仅使用1913年之前的数据进行训练。这款模型因此学会了语言结构,但对如世界大战、西班牙大流感等现代事件一无所知。这为研究者提供了一个引人入胜的实验平台,可以探讨与该模型讨论现代性话题时,它如何处理超出其训练数据范围的概念,从而深入理解大型语言模型的知识边界和潜在的推理机制。

  16. Redis之父Salvatore Sanfilippo的2025年AI八大反思 - 宝玉 Redis之父Salvatore Sanfilippo发表了对2025年AI发展的八项深刻反思。他认为,“随机鹦鹉”的论调已站不住脚思维链是AI发展中被低估的突破,可验证奖励强化学习正突破算力瓶颈。他观察到程序员对AI的态度从怀疑转向普遍接受,并认为Transformer架构仍有强大潜力,驳斥了“思维链改变LLM本质”的说法。此外,他指出曾经反LLM的ARC测试如今反而成为其能力的证明,并以一句简短的“未来20年AI的根本挑战是避免灭绝”结尾,强调了安全性的重要性。

  17. Nano Banana Pro城市海报生成提示词分享 - 歸藏(guizang.ai) Nano Banana Pro在生成城市海报方面展现了高级功能,能够根据用户选择的城市,自动调整云海艺术风格、3D字体装饰、经纬度、建成时间、别称、独特生物、天际线和古建筑等元素。一位用户分享了一个详细的提示词,旨在生成高质量的城市渲染数字艺术海报,并指定了Octane Render, C4D, Isometric City, Micro World, Living Ecosystem, 8k Resolution, DreamWorks style等具体风格和技术要求,以实现精美且平衡的艺术作品效果。