2025.09.23.12 过去4小时全球AI发生了什么?
阿里开源Qwen3-Omni:首个本地运行的全模态理解LLM - 歸藏(guizang.ai)
阿里巴巴近日开源了Qwen3-Omni,这是首个可本地运行的端到端全模态理解大型语言模型。该模型能够处理文本、图像、音频和视频输入,并支持文本和音频的流式输出,同时提升了音频和视频理解能力,且未牺牲单模态文本和图像的处理性能。Qwen3-Omni 基于MoE的Thinker–Talker设计,采用AuT预训练以获得强泛化表示,并通过多码本设计降低延迟,实现了低延迟流式传输和自然的轮流对话。
AI编程智能体进入“拨号上网”时代,基础设施面临巨大压力 - 宝玉
文章指出,当前的AI编程智能体(如Claude Code)在使用体验上正变得如同90年代末的“拨号上网”,面临不稳定、缓慢(30-60 tok/s)和频繁卡顿的问题。尽管AI token使用量呈爆炸式增长(OpenRouter数据显示增长50倍),但模型运行速度和基础设施的压力日益凸显。作者预测未来将出现更高tok/s的模型(例如2000 tok/s),支持更无监督、并行的工作流。同时,由于半导体工艺进步停滞,算力供给受限,未来可能出现**“错峰”定价模式**以平衡高峰时段的需求压力。
AI炮制的“工作垃圾”正在摧毁生产力:95%公司投资AI未见回报 - 宝玉
BetterUp Labs和斯坦福大学的研究发现,尽管生成式AI在工作场所使用激增,但95%的组织未见可衡量投资回报。原因在于“工作垃圾”(workslop):AI生成的内容表面精美但缺乏实质,将认知负担转嫁给同事。调查显示,40%的员工在过去一个月收到过“工作垃圾”,导致每人每月平均损失186美元,一个万人员工组织每年损失超900万美元。此外,“工作垃圾”还损害同事间的信任和协作。研究建议领导者避免“一刀切”式AI强制令,培养目的性使用AI的“飞行员”用户,并倡导协作式AI规范。
业内观察人士注意到一个引人深思的投资循环:OpenAI据称向甲骨文投资1000亿美元用于建立计算中心,随后甲骨文投入1000亿美元从英伟达采购GPU,而英伟达再将1000亿美元投资回OpenAI。这一系列大规模交易,据传可能源自软银的资金支持,凸显了AI基础设施建设背后庞大的资本流动和各科技巨头之间错综复杂的战略合作与财务关联。
有用户发现,谷歌的Gemini模型在基于大纲的写作能力上表现出色。通过反复使用“更改长度”功能将滑块调至最大,AI能够迭代扩充内容,不仅是简单地增加字数,而是会补充关键信息、调整文章结构,甚至加入案例和实操指导。这种“金箍棒式”的迭代扩充能力表明Gemini具备深度思考和补齐文章缺失部分的能力,展现了谷歌在AI内容生成技术方面的强大实力。