2025.09.24.16 过去4小时全球AI发生了什么？

Sep 24, 2025 · 1 分钟阅读 ·

分享到:

阿里巴巴云栖大会发布Qwen3-Max与通义万相2.5等系列大模型-向阳乔木
阿里巴巴在云栖大会上集中发布了多款重磅AI模型，包括超万亿参数的旗舰模型Qwen3-Max，该模型在SWE-Bench编码测试中斩获69.6分，在数学基准AIME 25和HMMT测试中达到满分100分，被认为能力已接近Claude 4 Opus及GPT-5。同时，通义万相2.5 preview视频生成模型也正式亮相，支持5-10秒1080P音画一体视频，被评价为国产“Veo3”最强平替，在图片和视频生成领域达到国际顶级水平。此外，Qwen系列共发布了300多个不同规模模型，从0.5B到超万亿参数，旨在覆盖更广泛的应用场景。用户可在夸克造点和通义万相平台体验相关模型。
可灵 2.5 与世界渲染大赛作品对比评测及见解-歸藏(guizang.ai)
有分析师对可灵 2.5 AI 视频模型与世界渲染大赛Top 100作品进行了对比测试，并提出独到见解。测试显示，当前顶级AI视频模型在5秒时间段内，对因果逻辑和物理表现的理解已相当到位，甚至某些瞬间能超越顶级CG表现。AI视频的创作方式更接近人类原始的绘画逻辑，能跳过精确直抵“传神”。然而，作者也指出，未来AI视频模型需加强叙事逻辑和叙事重点的强化，同时提供更细的时间粒度和画面控制手段，以满足更复杂的创作需求。
Marble from World Labs is so close to magic.-Fei-Fei Li
World Labs 推出的 Marble 工具被誉为“接近魔法”，它允许用户想象一个空间，生成该空间，并随后在VR头显中漫步其中。这项技术为虚拟现实内容的创作和探索提供了新的可能性。
Chrome DevTools MCP 应用案例：自动搜索下载谷歌学术论文-宝玉
一个实用的应用案例展示了如何结合Chrome DevTools MCP与Gemini Cli，自动化完成学术研究中的繁琐任务。该方案能够自动打开谷歌学术网站，搜索特定关键词，并自动将排名前五的PDF论文保存到本地文件夹，大幅提升了学术资料收集的效率。
个人观点：Anthropic 没有护城河，今年 all in coding，但被 OpenAI 追上了，接下来被 Gemini 在 Coding 方面超越也只是时间问题-宝玉
有行业观察者认为，Anthropic缺乏核心“护城河”，尽管今年全力投入编码领域，但已被OpenAI在编码能力上追上。该观点预测，Anthropic在编码方面的领先优势将进一步减弱，甚至可能很快被Google的Gemini模型超越。