2025.12.02.12 过去4小时全球AI发生了什么?

  1. Runway 发布 Gen-4.5 视频生成模型,增强物理与视觉精度-歸藏(guizang.ai)

    Runway 发布了其最新的视频生成模型Gen-4.5。尽管此次更新未带来范式级别的革新,但模型在多个核心能力上取得了显著提升,包括物理与视觉精度、复杂场景与详细构图、物理准确性、富有表现力的角色、风格化与风格一致性,以及电影感与真实日常场景的生成。此外,Gen-4.5还全面升级了控制方式,支持图片转视频、关键帧控制和视频转视频编辑,使得创作流程更加灵活,用户体验接近专业视频剪辑软件。

  2. DeepSeek V3.2 正式版发布,强化 Agent 能力并融入思考推理-Orange AI

    DeepSeek V3.2 正式版已推出,该版本显著强化了其Agent(代理)能力,并深度融入了思考推理机制。其中一大亮点是DeepSeek-V3.2的思考模式增加了对Claude Code的支持。用户可以通过将模型名称切换为“deepseek-reasoner”,或在Claude Code命令行界面中按下Tab键来启动思考模式,这为国内开发者和用户提供了一个使用Claude Code进行更复杂任务推理的新方法。

  3. 国产AI视频生成App内测:音画同步但内容抽象-向阳乔木

    有用户对一款国产AI视频生成App进行了内部测试,发现该应用具备音画同步功能。然而,测试结果显示其生成的视频内容“实在太抽象了”,目前可能更适用于创作如鬼畜视频这类对写实度要求不高的娱乐内容。这反映出当前国产AI视频生成技术在生成高质量、写实内容方面仍有进步空间。

  4. Nano Banana Pro 图像生成能力更新与赛博卡片提示词-歸藏(guizang.ai)

    Nano Banana Pro 展现出令人印象深刻的图像生成能力,不仅能够绘制《黑神话悟空》等近期热门内容,表明其训练数据保持了相当高的时效性,而且有用户分享了专门为 Gemini/Nano Banana Pro 优化的“赛博卡片”提示词。该提示词能将 X (Twitter) 个人资料截图转换成一张 9:16 竖版、具有霓虹光效的未来社交软件界面照片,突显了 AI 图像生成在个性化和未来感内容创作方面的潜力。

  5. HuggingFace 发布 Transformers v5 首个发布候选版-clem 🤗

    HuggingFace 正式发布了其开源机器学习库 Transformers v5 的第一个发布候选版(Release Candidate),这被誉为该项目五年以来的最大更新。此次版本迭代的核心亮点在于实现与生态系统伙伴的端到端(e2e)互操作性,旨在极大地提升开发者在使用Transformers进行模型构建和部署时的集成效率与便捷性。

  6. Anthropic 算力结构变化:Google TPU 对英伟达的潜在威胁-宝玉

    一张图表揭示了Anthropic(Claude模型开发商)在2024年第一季度至2025年第三季度期间的算力(FLOPs)来源结构发生了显著转变。数据显示,Anthropic对Google TPU的使用比例正在增加,这表明在AI算力领域,Google TPU正日益成为英伟达GPU的有力竞争者,对英伟达的市场主导地位构成潜在威胁。

  7. NeurIPS Agentic Reviewer:超越年度论文提交量的AI审稿工具-Andrew Ng

    人工智能领域知名学者吴恩达指出,今年的NeurIPS会议共收到21,575篇论文投稿。他同时透露,上周发布的一款名为Agentic Reviewer(代理审稿人)的AI工具,其在已提交和评审的论文数量上已超越这一数字。这一成就明确表明,代理论文评审技术已趋于成熟,并将对未来的学术评审流程产生深远影响。

  8. AlphaFold 在生物医学研究中产生巨大影响-Demis Hassabis

    DeepMind及Google DeepMind首席执行官Demis Hassabis引用《财富》杂志的一篇重要文章,强调了AlphaFold在生物学和生物医学研究领域产生的巨大影响。这篇由Jeremy Kahn撰写的文章进一步证实了AlphaFold在蛋白质结构预测方面的革命性突破,及其对加速科学发现和药物研发的深远意义。

  9. OpenBMB 开源 InfLLM-V2 训练数据及基础模型-clem 🤗

    OpenBMB 正式对外开源了其 InfLLM-V2 模型的训练数据和基础模型,旨在邀请全球社区开发者和研究人员下载、研究并在此基础上进行创新。此举旨在推动大型语言模型技术在开放社区的进一步发展和广泛应用,促进AI领域的协作与进步。

  10. AI 创业公司需从 Day 1 考虑商业化和盈利-Orange AI

    一位作者强调,与资金雄厚的大型科技公司不同,AI 创业公司无法承受在模型训练和推理过程中消耗大量 Token 所带来的高昂成本。鉴于 AI Token 消耗可能在一周内导致公司破产,文章提出,对于 AI 创业公司而言,从项目启动的第一天起,就必须将商业化和盈利能力作为核心考量,以确保可持续发展。

  11. 特斯拉 Robotaxi 实现旧金山湾区全程自动驾驶-sarah guo

    特斯拉的 Robotaxi 在旧金山湾区实现了全程自动驾驶,包括从旧金山到南湾的通勤,整个过程无需任何人工干预。这一进展标志着特斯拉在自动驾驶技术领域迈出了重要一步,预示着其Robotaxi服务在实际应用和L4级自动驾驶能力方面取得了显著的里程碑,有望改变未来的城市出行方式。

  12. 彼得·H·戴曼迪斯:创造力与科技是新的成本削减策略-Peter H. Diamandis, MD

    未来学家彼得·H·戴曼迪斯博士提出,我们正进入一个新时代,解决问题的最经济有效方式已不再是传统的削减开支,而是通过发明解决问题所需的工具。他强调,在当前技术快速发展的背景下,创造力与技术结合已成为企业和个人实现成本效益的新策略,鼓励人们应围绕自身创造和创新的能力而非既有局限性来构建未来。

  13. 旧经验在新技术浪潮中的挑战与机遇-宝玉

    一位作者通过自身重学前端的经历反思,指出过往的经验有时会成为学习和接受新技术的障碍。他以从 jQuery 到 React/Redux 的技术栈转变为例,说明对旧技术的过于熟悉反而可能阻碍新思维的建立。尽管学习新技术的初期充满痛苦和回归旧路径的冲动,但熬过这段时期便能掌握新技能,并让旧经验发挥补充作用,从而避免被时代淘汰。这篇反思对身处AI技术快速发展期的专业人士具有深刻的启发意义。