2025.09.24.12 过去4小时全球AI发生了什么?

以下是过去4小时全球AI领域的一些重要动态:

  1. 阿里云发布Wan 2.5 Preview模型,AI视频质量达网剧级别-歸藏(guizang.ai) 阿里云近日发布了 Wan 2.5 Preview 模型,该模型支持生成10秒1080P的音画同步视频,并具备图像生成和编辑功能。有评论指出,当前AI视频的质量虽可能尚未达到电影级别,但已足以满足网剧、短剧和电视剧等制作需求,显示出AI视频生成技术在内容创作领域的巨大潜力。

  2. 阿里巴巴通义实验室开源Qwen3-VL视觉语言模型-clem 🤗 阿里巴巴通义实验室宣布 开源 Qwen3-VL,这是一款功能强大的视觉语言模型。该模型能够操作图形用户界面(GUIs)并进行代码编写,进一步推动了多模态AI模型在理解和交互复杂数字环境方面的能力。

  3. 谷歌相册对话式图片编辑功能在美国安卓设备全量上线-歸藏(guizang.ai) 谷歌相册的对话式图片编辑功能已在美国所有安卓设备上全面上线。用户可以通过自然语言指令来编辑图片,使得图片处理体验更加直观和便捷,尤其适用于在相册中直接进行编辑的场景。

  4. 英国《金融时报》研究:多数美国上市公司缺乏清晰的AI战略-Gary Marcus 一项最新的《金融时报》研究指出,尽管许多美国大型上市公司都在谈论人工智能,但除了“害怕错过”的心态外,很少有公司能够清晰地描述AI技术如何真正改变其业务并带来积极影响。这表明企业在AI整合和战略规划方面仍面临挑战。

  5. “Claude Code Now”:Mac上一键启动Claude Code的极简工具发布-orange.ai 一位非程序员产品经理开发并发布了首个Mac App——“Claude Code Now”。这款工具旨在简化Claude Code的启动流程,实现一键快速启动,使其在任何文件夹中都能作为通用型Agent,帮助用户分析、移动或整理文件,甚至基于Obsidian数据库进行洞察提取,极大提升了用户体验。

  6. AI算力工厂目标:每周生产1吉瓦全新增量算力-宝玉 关于AI算力工厂的建设目标进行了一项重要勘误,明确指出其目标是每周生产1吉瓦的全新增量算力,而非提供。这一修正强调了持续高效率的算力生产能力,以满足AI快速发展对计算资源日益增长的需求。

  7. 发现Lenny大礼包中的Granola:最强实时语音转写与笔记工具-向阳乔木 有用户发现Lenny大礼包中的 Granola 应用是一个强大的实时语音转写和笔记工具。它能够后台监听并转写任何音视频内容,并支持一键摘要总结(可自定义Prompt),被认为是目前最佳的实时语音转写和笔记解决方案,尽管它默认仅支持英文,但可以通过提示词实现中文总结。

  8. Anthropic因模型劣化及用户反馈处理不当遭用户批评-宝玉 有用户对Anthropic公司处理模型劣化问题的方式提出严厉批评。用户反馈称,Anthropic模型出现性能下降(“烧糊的菜”)后,公司在一个月内对社区反馈不予理睬,并且在修复错误时称模型未受影响,导致用户继续反馈。这反映了用户对AI模型稳定性及厂商沟通透明度的不满。

  9. 谷歌在Google TV上推出Gemini AI助手-Demis Hassabis 谷歌宣布将 Gemini AI助手引入Google TV。用户现在可以通过更自然地与电视进行语音交互,来查找电影、进行脑力激荡或获取其他信息,进一步提升了智能电视的交互体验。

  10. 主流AI爬虫User-Agent盘点及其影响-向阳乔木 一篇详细盘点了当前主流AI爬虫的User-Agent,包括 OpenAI的GPTBot、OAI-SearchBot、ChatGPT-User,以及 PerplexityBot、ClaudeBot、DeepSeekBot字节跳动的Bytespider。文章指出,虽然GPTBot抓取频率高,但为了GEO效果,网站不得不向AI爬虫开放。这一现象反映了在AI时代,网站内容管理面临的新的挑战和权衡。