2025.09.20.00 过去4小时全球AI发生了什么?
ElevenLabs 推出全新音视频编辑平台 Studio 3.0-小互
AI语音技术公司ElevenLabs发布了其全新的音视频编辑平台 Studio 3.0。该平台在一个统一界面内集成了AI语音合成、音频编辑、音效添加等多种功能。其核心能力包括自动配音(支持多语言和音色)、语音转文字、声音克隆、根据描述生成背景音乐与音效、多语言配音(自动翻译并生成配音),以及音频清理(去除噪音)。这一平台旨在为内容创作者提供更高效的音视频制作工具。
Wan 团队开源唇形与动作同步模型 Wan‑Animate-歸藏(guizang.ai)
Wan团队发布了其强大的开源唇形和动作同步模型 Wan‑Animate。该模型具有极高的自定义程度,能够同时解决“角色动画生成”和“角色替换”两大任务。用户可以上传图片,将对应人物的表情和动作迁移到视频中,生成新的动画视频;也可以单纯替换原有视频中的人物,并智能复制原场景的光照与色调,实现无缝整合。
通义 DeepResearch Agent 论文《WebWeaver》:启发性的上下文压缩方法-宝玉
通义团队发布的 DeepResearch Agent 系列论文中,《WebWeaver》因其在上下文压缩方面的创新方法而受到关注。这项技术对于需要AI进行长文写作的场景具有重要启发意义,能有效提升AI处理和生成长篇内容的能力,解决传统大模型在长文本处理中面临的上下文限制问题。
OpenAI GPT-5 模型细分用途:High 版与 Codex 版-宝玉
OpenAI对即将推出的 GPT-5 模型进行了用途澄清和勘误。其中,GPT-5-high 版本被定位为处理需要更广泛世界知识的任务,例如确保代码符合冷门合规规则。而 GPT-5-codex 版本则更专注于技术性任务,如规划复杂的代码重构。用户可以根据具体需求在这两个专业化模型之间进行切换,以获得更优化的性能。
阿尔巴尼亚任命全球首位AI政府部长并首次在议会发言-Emad
阿尔巴尼亚创造历史,任命了全球首位AI政府部长,并在议会进行了首次发言。这一里程碑事件标志着AI在政府治理和公共服务领域扮演了新的角色,引发了关于AI在政治和决策中作用的广泛讨论。该事件突显了各国政府对探索AI潜力的日益增长的兴趣。
新款高性能AI开发者硬件发布:支持本地运行70B大模型-小互
市场推出了一款面向开发者的全新高性能AI硬件。该设备搭载英伟达芯片,配备64GB超大显存和275T的澎湃算力,能够支持在本地运行高达70B参数规模的大模型。这一配置为AI开发者在本地进行模型训练、推理和实验提供了强大的计算能力,并提供开发者专属购买优惠。
DecartAI 开源视频编辑工具 Lucy Edit v0.1 - “Open Source Nano Banana for Video”-merve
DecartAI 团队正致力于开发一款名为 Lucy Edit 的开源视频编辑工具,并发布了其 v0.1 演示版本,将其定位为“Open Source Nano Banana for Video”。该项目旨在提供一个开放、可访问的解决方案,以简化视频编辑流程,特别是在AI辅助功能方面,为视频创作者和开发者提供新的工具选择。