2025.12.02.08 过去4小时全球AI发生了什么?
Hugging Face发布Transformers v5首个Release Candidate
Hugging Face宣布发布其Transformers库的v5版本首个Release Candidate(RC)。这是一个重大更新,旨在实现与整个生态系统中其他工具的端到端互操作性,标志着该库自上一个主要版本以来的五年里程碑。此版本将进一步简化AI模型在不同平台和框架间的集成与应用。
斯坦福大学教授吴恩达指出,今年的NeurIPS会议收到了21,575篇论文投稿,而上周发布的“Agentic Reviewer”(代理审稿人)工具提交和评审的论文数量已超过此数。这表明代理审稿模式已崭露头角,并将对学术论文评审流程产生深远影响。
OpenBMB正式开源InfLLM-V2的训练数据和基础模型
OpenBMB宣布正式开源其InfLLM-V2大语言模型的训练数据和基础模型。此举旨在邀请全球社区下载、研究并在此基础上进行创新,促进大模型技术的开放发展和应用生态的繁荣。
DeepSeek V3.2发布:强化Agent能力并支持Claude Code思考模式
DeepSeek发布了V3.2正式版,该版本显著强化了模型的Agent(智能代理)能力,并深度融入了思考推理机制。值得注意的是,DeepSeek-V3.2增加了对Claude Code思考模式的支持,用户可通过将模型名更改为
deepseek-reasoner或在Claude Code CLI中按Tab键来启用这一思考模式,提升AI在复杂任务中的表现。Trinity公司推出了其开放权重MoE(Mixture of Experts)家族模型,旨在为企业和开发者提供可拥有和自定义的AI模型。这一举措有望降低AI技术的使用门槛,促进更多创新应用的诞生和AI生态系统的多样性发展。
有观点指出,与大型企业不同,AI创业公司没有无限的资金来“烧钱”。在AI领域,token消耗的成本极高,可能导致创业公司在一周内破产。因此,AI创业者必须从第一天起就将商业化和盈利能力作为核心考量。
一份分析图表显示,Anthropic(Claude大模型的开发公司)在2024年第一季度至2025年第三季度期间,其算力来源结构发生了显著变化。GPU(主要指英伟达)的份额逐渐减少,而Google TPU的份额有所增长,这引发了关于Google TPU对英伟达潜在威胁的讨论。
Runway推出Gen-4.5视频生成模型,侧重精度而非范式革新
Runway发布了其Gen-4.5视频生成模型。相较于前一代,该模型在物理与视觉精度、复杂场景与详细构图、物理准确性、富有表现力的角色、风格化与风格一致性以及电影感与真实日常场景生成方面进行了全面升级,但并未带来颠覆性的范式革新。
字节跳动旗下AI产品“豆包”将与国产手机厂商合作,推出手机助手解决方案。该助手支持通过电源键、语音识别和耳机唤醒,具备沉浸式实时通话(含视频)、语音修图、跨App操作完成复杂任务的能力,并能记忆图片、文本、日程等信息,实现全面升级的控制方式。
有用户内测了一款国产AI视频生成App,反馈该应用能够实现音画同步,但生成效果“实在太抽象了”,被认为更适合用于制作鬼畜视频,暗示其在生成真实感视频方面仍有提升空间。
Nano Banana Pro AI绘画工具支持《黑神话:悟空》内容创作
有用户发现AI绘画工具Nano Banana Pro竟然能够绘制与热门游戏《黑神话:悟空》相关的内容。这表明该模型的训练数据非常新,并具备强大的内容生成能力,能够捕捉并再现特定文化和IP的元素。
通过参考三张图片,AI成功生成了一张“非常可爱”的网络协议示意图。这种风格被认为非常适合作为文章插图使用,展示了AI在生成特定风格图示方面的潜力。
一项新的AI技术能够实现对图像上任意物体和对象的精准替换和修改。这项功能将极大提升图像编辑的效率和灵活性,为内容创作和视觉设计带来更多可能性。
ChatGPT迎来发布三周年纪念日,其出现被认为是世界进入生成式范式的里程碑,彻底改变了全球科技和人们的生活。评论鼓励人们积极拥抱AI,认为现在正是发展AI事业的绝佳时机。
一篇评论指出,已有的经验有时会成为接受更先进新技术的障碍,导致被淘汰。然而,若能转变心态,这些经验也能成为加速学习新技术的宝贵财富。以个人从jQuery转向React/Redux的学习经历为例,强调了克服旧思维模式的痛苦与收获。
未来学家Peter H. Diamandis纠正了“人型机器人将取代人类工作”的常见误解。他认为,人型机器人实际上将承担人类不擅长或具有风险的任务,从而让人类能够更加专注于自身优势和更具创造性的工作。
Peter H. Diamandis强调,尽管自主配送服务可能首先应用于家庭,但其更关键的未来在于灾区、诊所和冲突区域。在这些特殊环境下,自主配送能够安全、快速地将援助物资送达最需要的人群。
Ministral 3 8B 2512视觉模型发布,遵循Apache 2.0协议
一款名为Ministral 3 8B 2512的视觉模型已正式发布,并遵循Apache 2.0开源协议。这表明社区在视觉AI模型开发方面的持续进展,为开发者提供了新的工具和资源。