2025.09.24.12 过去4小时全球AI发生了什么？

Sep 24, 2025 · 1 分钟阅读 ·

分享到:

以下是过去4小时全球AI领域的一些重要动态：

阿里云发布Wan 2.5 Preview模型，AI视频质量达网剧级别-歸藏(guizang.ai) 阿里云近日发布了 Wan 2.5 Preview 模型，该模型支持生成10秒1080P的音画同步视频，并具备图像生成和编辑功能。有评论指出，当前AI视频的质量虽可能尚未达到电影级别，但已足以满足网剧、短剧和电视剧等制作需求，显示出AI视频生成技术在内容创作领域的巨大潜力。
阿里巴巴通义实验室开源Qwen3-VL视觉语言模型-clem 🤗 阿里巴巴通义实验室宣布 开源 Qwen3-VL，这是一款功能强大的视觉语言模型。该模型能够操作图形用户界面（GUIs）并进行代码编写，进一步推动了多模态AI模型在理解和交互复杂数字环境方面的能力。
谷歌相册对话式图片编辑功能在美国安卓设备全量上线-歸藏(guizang.ai) 谷歌相册的对话式图片编辑功能已在美国所有安卓设备上全面上线。用户可以通过自然语言指令来编辑图片，使得图片处理体验更加直观和便捷，尤其适用于在相册中直接进行编辑的场景。
英国《金融时报》研究：多数美国上市公司缺乏清晰的AI战略-Gary Marcus 一项最新的《金融时报》研究指出，尽管许多美国大型上市公司都在谈论人工智能，但除了“害怕错过”的心态外，很少有公司能够清晰地描述AI技术如何真正改变其业务并带来积极影响。这表明企业在AI整合和战略规划方面仍面临挑战。
“Claude Code Now”：Mac上一键启动Claude Code的极简工具发布-orange.ai 一位非程序员产品经理开发并发布了首个Mac App——“Claude Code Now”。这款工具旨在简化Claude Code的启动流程，实现一键快速启动，使其在任何文件夹中都能作为通用型Agent，帮助用户分析、移动或整理文件，甚至基于Obsidian数据库进行洞察提取，极大提升了用户体验。
AI算力工厂目标：每周生产1吉瓦全新增量算力-宝玉关于AI算力工厂的建设目标进行了一项重要勘误，明确指出其目标是每周生产1吉瓦的全新增量算力，而非提供。这一修正强调了持续高效率的算力生产能力，以满足AI快速发展对计算资源日益增长的需求。
发现Lenny大礼包中的Granola：最强实时语音转写与笔记工具-向阳乔木有用户发现Lenny大礼包中的 Granola 应用是一个强大的实时语音转写和笔记工具。它能够后台监听并转写任何音视频内容，并支持一键摘要总结（可自定义Prompt），被认为是目前最佳的实时语音转写和笔记解决方案，尽管它默认仅支持英文，但可以通过提示词实现中文总结。
Anthropic因模型劣化及用户反馈处理不当遭用户批评-宝玉有用户对Anthropic公司处理模型劣化问题的方式提出严厉批评。用户反馈称，Anthropic模型出现性能下降（“烧糊的菜”）后，公司在一个月内对社区反馈不予理睬，并且在修复错误时称模型未受影响，导致用户继续反馈。这反映了用户对AI模型稳定性及厂商沟通透明度的不满。
谷歌在Google TV上推出Gemini AI助手-Demis Hassabis 谷歌宣布将 Gemini AI助手引入Google TV。用户现在可以通过更自然地与电视进行语音交互，来查找电影、进行脑力激荡或获取其他信息，进一步提升了智能电视的交互体验。
主流AI爬虫User-Agent盘点及其影响-向阳乔木一篇详细盘点了当前主流AI爬虫的User-Agent，包括 OpenAI的GPTBot、OAI-SearchBot、ChatGPT-User，以及 PerplexityBot、ClaudeBot、DeepSeekBot 和 字节跳动的Bytespider。文章指出，虽然GPTBot抓取频率高，但为了GEO效果，网站不得不向AI爬虫开放。这一现象反映了在AI时代，网站内容管理面临的新的挑战和权衡。