2025.09.24.16 过去4小时全球AI发生了什么?
阿里巴巴云栖大会发布Qwen3-Max与通义万相2.5等系列大模型-向阳乔木
阿里巴巴在云栖大会上集中发布了多款重磅AI模型,包括超万亿参数的旗舰模型Qwen3-Max,该模型在SWE-Bench编码测试中斩获69.6分,在数学基准AIME 25和HMMT测试中达到满分100分,被认为能力已接近Claude 4 Opus及GPT-5。同时,通义万相2.5 preview视频生成模型也正式亮相,支持5-10秒1080P音画一体视频,被评价为国产“Veo3”最强平替,在图片和视频生成领域达到国际顶级水平。此外,Qwen系列共发布了300多个不同规模模型,从0.5B到超万亿参数,旨在覆盖更广泛的应用场景。用户可在夸克造点和通义万相平台体验相关模型。
可灵 2.5 与世界渲染大赛作品对比评测及见解-歸藏(guizang.ai)
有分析师对可灵 2.5 AI 视频模型与世界渲染大赛Top 100作品进行了对比测试,并提出独到见解。测试显示,当前顶级AI视频模型在5秒时间段内,对因果逻辑和物理表现的理解已相当到位,甚至某些瞬间能超越顶级CG表现。AI视频的创作方式更接近人类原始的绘画逻辑,能跳过精确直抵“传神”。然而,作者也指出,未来AI视频模型需加强叙事逻辑和叙事重点的强化,同时提供更细的时间粒度和画面控制手段,以满足更复杂的创作需求。
Marble from World Labs is so close to magic.-Fei-Fei Li
World Labs 推出的 Marble 工具被誉为“接近魔法”,它允许用户想象一个空间,生成该空间,并随后在VR头显中漫步其中。这项技术为虚拟现实内容的创作和探索提供了新的可能性。
Chrome DevTools MCP 应用案例:自动搜索下载谷歌学术论文-宝玉
一个实用的应用案例展示了如何结合Chrome DevTools MCP与Gemini Cli,自动化完成学术研究中的繁琐任务。该方案能够自动打开谷歌学术网站,搜索特定关键词,并自动将排名前五的PDF论文保存到本地文件夹,大幅提升了学术资料收集的效率。
个人观点:Anthropic 没有护城河,今年 all in coding,但被 OpenAI 追上了,接下来被 Gemini 在 Coding 方面超越也只是时间问题-宝玉
有行业观察者认为,Anthropic缺乏核心“护城河”,尽管今年全力投入编码领域,但已被OpenAI在编码能力上追上。该观点预测,Anthropic在编码方面的领先优势将进一步减弱,甚至可能很快被Google的Gemini模型超越。