2025.12.22.20 过去4小时全球AI发生了什么?

以下是过去4小时内全球AI领域的重要动态汇总:

  1. AI2发布SAGE-MM和Molmo 2多模态模型Demo-merve

    Allen Institute for AI (AI2) 在Hugging Face上发布了其最先进(SOTA)的多模态模型SAGE-MMMolmo 2的演示版本。SAGE-MM是一个专注于长视频推理的智能多领域代理模型,而Molmo 2则特别支持多图像输入,展示了AI在复杂多模态理解和生成方面的最新进展。

  2. 小米MiMo论文揭示AI前端代码生成强化秘诀-宝玉

    小米在其MiMo论文中详细阐述了如何训练AI模型生成前端代码,其核心在于引入了基于视觉的验证器。该验证器通过对录制的视频片段进行评分,综合评估代码的视觉质量、功能准确性和可执行性,从而确保奖励机制能够同时兼顾前端代码的外观和实际效用,显著提升了AI生成前端代码的质量和实用性。

  3. 利用AI工具“nano banana pro”制作医疗动画的新方法-宝玉

    一种新颖的动画制作方法被分享,该方法利用AI工具“nano banana pro”来创建医疗插画动画。用户首先通过提示词生成高质量的3D医疗插画(例如“A high-quality 3D medical illustration of a hardening of the arteries”),然后将生成的图片作为首帧图输入AI视频工具,即可生成连贯的视频动画,极大简化了专业医疗动画的制作流程。

  4. 近半数美国员工已采用AI,成史上最快普及技术之一-Peter H. Diamandis, MD

    Peter H. Diamandis博士指出,近50%的美国工作者已经在使用AI,这是一个惊人的数字,表明人工智能可能是历史上普及速度最快的技术之一。这一数据凸显了AI技术在企业和个人工作流程中的快速集成,预示着劳动生产力和工作模式的深刻变革。

  5. 亚马逊或向OpenAI注资100亿美元,估值超5000亿美元-Peter H. Diamandis, MD

    据报道,亚马逊正考虑向OpenAI投资100亿美元,这笔交易可能使OpenAI的估值达到5000亿美元以上。此举意味着OpenAI将不再局限于单一云服务提供商,从而能与更多超大规模云厂商合作。对亚马逊而言,这将使其获得一个旗舰级合作伙伴,以推动其Trainium芯片和企业级AI战略的发展。

  6. AI上下游产品及基础设施中文资料发布-向阳乔木

    一份包含AI上游和下游产品、以及基础设施的中文资料已被翻译并发布。该资料提供了相关网址和简短评价,方便用户查找和了解AI生态系统中的各类工具和服务,为中文用户提供了宝贵的行业洞察。

  7. 旧金山大停电致Waymo无人出租车“罢工”-小互

    旧金山发生大面积停电,导致Google旗下的Waymo无人出租车停滞在路中央,未能正常运行。这一事件引发了对无人驾驶汽车在面对基础设施故障(如交通信号灯无法识别)时,其独立运行能力及对云端系统依赖性的讨论。

  8. 2026年被预测为“未来感”元年:人形机器人、飞行汽车等将普及-Peter H. Diamandis, MD

    Peter H. Diamandis博士预测,2026年将成为一个充满“未来感”的年份,因为“Jetsons-Era”的硬件技术将大规模进入人们的日常生活。这包括人形机器人、赛博出租车、飞行汽车和无人机等创新产品将广泛普及,彻底改变交通、生活和工作方式。

  9. 播客深度探讨AI在医疗领域的应用-歸藏(guizang.ai)

    一期备受推崇的播客节目深入探讨了人工智能在医疗领域的具体应用。该节目被评价为“牛批”,帮助听众理解了AI如何赋能医疗行业,展示了AI在诊断、治疗辅助、药物研发等方面的巨大潜力。

  10. “扁平涂鸦”AI插画提示词公开,创作可爱风格插画-宝玉

    一套用于生成“超治愈的扁平涂鸦风格”AI插画的提示词被分享。该提示词强调粗黑色描边、明亮柔和的粉彩色系、简单的平面图形、极少阴影、可爱的圆润比例,并以生产力为主题,主体孤立于纯白背景,高分辨率,1:1比例。例如,可用于生成“一个可爱的女孩坐在桌子前,正在一本计划本上制定计划”的场景。

  11. AI产品经济学:ARR比DAU更本质-Orange AI

    在当前的AI产品生态中,**年度经常性收入(ARR)**被认为比日活跃用户(DAU)更为重要。与传统互联网产品不同,AI产品即便在较低的DAU情况下,也能产生可观的收入,足以支撑小型团队的运营。这一观点强调AI工具正赋能“超级个体”创造更大价值,真正的用户倾向于为高效工具付费并私下使用,而非追求高DAU的“假用户”。

  12. PromptFill:开源、本地部署的提示词填空器发布-小互

    一款名为PromptFill的开源提示词填空器工具被推出,旨在通过**可视化“填空式交互”**简化AI提示词的编写。该工具将复杂提示词拆解为可点选、拖拽和填空的“变量”,帮助创作者快速构建、管理和迭代提示词结构,支持文本编辑、本地部署,并可一键导出至AI绘画工具,大大降低了创作门槛。

  13. NotebookLM“闪卡”功能助用户高效记忆-宝玉

    Google的NotebookLM新增了实用的“Flash Cards”(闪卡)功能。用户可以根据自己的素材生成闪卡,将知识点转化为问题和答案的形式,默认显示问题,点击后显示答案,有效帮助用户进行记忆和学习。

  14. 用户转向Droid与自定义模型工作流,提升效率-Ben Tossell

    有用户分享其已将整个工作流程切换至**@droid**平台并结合自定义AI模型,仅一天体验后便对其效果深信不疑。这表明定制化AI解决方案在提升个人及团队工作效率方面正获得用户认可。

  15. 开源聊天机器人图像转动漫速度超越ChatGPT-merve

    一个100%开源的聊天机器人在将图像转换为动漫风格方面,展示出比ChatGPT显著更快的处理速度。这一进展突显了开源AI社区在特定任务上,通过优化和创新,能够超越主流商业模型的性能。