2025.12.22.16 过去4小时全球AI发生了什么?

以下是过去4小时全球AI领域的重要动态:

  1. Allen AI发布SAGE-MM多模态模型演示-merve Allen AI团队的SAGE-MM(Smart Any-Horizon Agents for Long Video Reasoning)多模态模型现已在Hugging Face上提供演示。这款模型专注于长视频推理能力,有望在理解和分析复杂视频内容方面带来突破,为视频分析和AI代理领域提供新的研究和应用方向。

  2. AI2发布最新Molmo 2多模态模型演示-merve AI2(Allen Institute for AI)推出了其最新的Molmo 2多模态模型,并在Hugging Face上发布了演示。Molmo 2被誉为SOTA(State-of-the-Art)模型,支持多图像输入和长上下文理解,显示出在处理复杂视觉和文本信息方面的强大能力,对多模态AI研究具有重要意义。

  3. 小米MiMo论文揭示AI前端开发技术-宝玉 小米的MiMo论文详细介绍了AI如何大幅提升前端开发效率。其核心在于一个基于视觉的验证器,该验证器通过对录制的视频片段进行评分,综合评估AI生成的代码在视觉质量、功能准确性和可执行性方面的表现。这种创新的奖励机制确保了AI模型在生成前端代码时,能同时兼顾美观与实用性,推动了AI在软件开发领域的应用深度。

  4. 利用AI生成医学动画的新方法-宝玉 一种利用AI工具制作动画的新方法被分享。该方法首先使用“nano banana pro”等工具,通过特定提示词生成高质量3D医学插画,例如动脉硬化的图像。随后,将这些生成的图片作为AI视频工具的首帧图,进一步生成动态的医学动画。这种流程简化了复杂医学动画的制作,为医疗教育和科普提供了高效途径。

  5. 美国近半数工人已在使用AI技术-Peter H. Diamandis, MD Peter H. Diamandis博士指出,目前近50%的美国工人已在日常工作中应用AI技术。这一数据令人震惊,表明AI可能是历史上普及速度最快的技术之一。这不仅反映了AI对劳动力市场的深刻影响,也预示着未来AI将更广泛地融入工作场景,极大地改变生产力和工作模式。

  6. 亚马逊拟重金投资OpenAI,估值超5000亿美元-Peter H. Diamandis, MD 据报道,亚马逊可能以超过5000亿美元的估值向OpenAI注入100亿美元的巨额投资。此举不仅标志着OpenAI在资本市场的强大吸引力,也预示着其未来将不再局限于单一云服务商的生态。通过与亚马逊的合作,OpenAI有望拓展与更多超大规模云服务商的协作,同时亚马逊也将获得一个旗舰级合作伙伴,以强化其Trainium芯片和企业级AI服务。

  7. 开源AI上下游产品及基建中文资料发布-向阳乔木 一份涵盖AI上下游产品及基础设施的中文资料已被翻译并发布。这份资源提供了详细的网址和对每个项目的一句话评价,旨在帮助用户快速查找和了解AI生态系统中的关键产品和技术,对于中文社区的AI开发者和使用者具有较高的参考价值。

  8. 创新AI日志与反思产品上线-向阳乔木 一款结合AI的笔记与反思产品以其独特设计和交互脱颖而出。该产品类似本地优先的Flomo,允许用户随时记录思绪,并能针对每条记录进行“Reflect”反思,甚至可以基于所有日志进行对话。它支持配置Ollama本地模型或OpenAI兼容模型,例如Deepseek API,提供灵活的AI集成,尽管其编辑删除帖子的交互方式略显反直觉。

  9. 旧金山大停电致Waymo无人车瘫痪-小互 旧金山遭遇大停电,导致Google旗下的Waymo无人出租车服务受影响,多辆无人车直接停滞在路中央。这一事件引发了对无人车在复杂和非预期环境下的自主决策能力的讨论,推测其可能因无法识别红绿灯或其他交通信号而停止运行,凸显了自动驾驶技术对稳定外部环境的依赖性。

  10. 预测2026年将迎来“未来感”硬件时代-Peter H. Diamandis, MD Peter H. Diamandis博士预测,2026年将真正带来“未来感”,届时科技将以**“Jetsons时代”的硬件形态进入人们的日常生活。这包括人形机器人、赛博出租车、飞行汽车和无人机**等。他认为这些先进的AI和机器人技术将从概念走向实际应用,极大地改变我们对未来世界的感知和体验。

  11. 超治愈扁平涂鸦风格AI插画提示词公布-宝玉 一份用于生成超治愈“扁平涂鸦”风格AI插画的详细提示词(Prompt)被公开。该提示词强调画作应具有粗黑色描边、明亮柔和的粉彩色系、简单的平面图形、极少阴影和可爱的圆润比例,并以生产力为主题。作品需隔离在纯白背景上,保持高分辨率和1:1的比例,例如描绘一个女孩坐在桌前制定计划的场景,为AI艺术创作提供了具体指导。

  12. 探讨AI在医疗领域应用的播客推荐-歸藏(guizang.ai) 有用户推荐了一期深度探讨AI在医疗领域应用的播客,称其为“最牛批的播客”,并表示通过该节目对AI如何赋能医疗有了全新的理解。这表明AI在医疗健康领域正获得越来越多的关注,并展现出巨大的潜力。

  13. AI产品指标:ARR比DAU更具本质性-Orange AI Orange AI指出,在当前的AI产品中,年经常性收入(ARR)比日活跃用户(DAU)更重要。与传统互联网产品需要百万级DAU才能盈利不同,现在的AI产品即使DAU较低也能产生可观收入,足以支撑一个小团队。作者认为,AI赋能的是那些最强的“超级个体”,这些付费意愿高的真用户,他们对工具投入的资金量更能体现工具的真正价值,因此ARR是衡量AI产品成功的更本质指标。

  14. 开源AI提示词填空器PromptFill发布-小互 一款名为PromptFill的开源“提示词填空器”工具已发布,旨在简化AI绘画等场景的提示词编写。该工具通过可视化、填空式交互,将复杂Prompt拆解为可选择、拖拽和填空的“变量”,使用户无需记忆关键词,避免拼写和格式错误,一键即可生成完美的提示词结构。它还支持直观的文本编辑,并可本地部署,提供在线体验。

  15. NotebookLM的AI驱动Flash Cards功能-宝玉 NotebookLM推出了一项名为“Flash Cards”的实用功能。该功能能够根据用户上传的素材自动生成闪卡,将知识点转化为问答形式,默认只显示问题,点击后才显示答案,极大地方便了用户进行记忆和学习

  16. 用户转向基于AI的全新工作流程-Ben Tossell 有用户分享其已将整个工作流程完全切换到**@droid和自定义AI模型**,并表示仅使用一天便已深信不疑。这反映了AI工具和定制模型在提升个人工作效率和优化工作流程方面的显著潜力,越来越多专业人士开始采纳AI作为核心生产力工具。

  17. 开源聊天机器人图像转动漫速度超越ChatGPT-merve 一条推文提出了疑问,为什么100%开源的聊天机器人在将图像转换为动漫风格的速度上,能比ChatGPT快得多。这暗示了开源模型在特定任务上可能具有更高的效率或优化潜力,引发了对不同AI模型架构和性能的讨论。