2025.09.22.12 过去4小时全球AI发生了什么？

Sep 22, 2025 · 1 分钟阅读 ·

分享到:

Google Deep Researcher (TTD-DR)：基于扩散模型的长篇报告生成框架-小互
Google 发布了一种新型的 Deep Researcher (TTD-DR) 框架，它是一个基于扩散模型的AI代理，旨在模拟人类研究员撰写报告的迭代过程。该框架借鉴了图片扩散模型的原理，将粗糙的初稿逐步“去噪”成高质量的研究报告。在长篇报告生成任务上，TTD-DR 的胜率达到了 74.5%，显著优于 OpenAI DR 的 50%。此外，它在 HLE-Search 和 GAIA 任务上的正确率也分别提升了 7.7% 和 1.7%，显示出在相同时间延迟下能生成更高质量结果的高效性。
AI对软件工程底层范式的影响：加速而非颠覆-宝玉
关于AI是否会改变软件工程底层范式的讨论指出，AI目前更多是加速了“需求 → 设计 → 开发 → 测试 → 部署”这一现有流程，而非彻底颠覆。作者认为，软件工程的范式转变取决于需求能否标准化，而当前需求普遍开放且非标准化，难以实现自动化验证。AI在可自动化验证领域表现出色，但在软件需求方面，由于其模糊性和持续变化性，“human in loop” 仍然是不可或缺的。真正的颠覆可能要等到AI能将人类需求标准化，从而实现完全自动化的编码和测试验收。
OpenAI 预告新模型与产品，或针对Pro用户额外收费-小互
Sam Altman 预告 OpenAI 将推出一系列新的模型和产品，这些新品将对算力提出更高的要求。据悉，这些新功能或产品将仅对 Pro 用户开放，并且可能采取额外收费的模式。这一动向表明 OpenAI 正在积极拓展其产品线，可能在 ChatGPT 之外推出新的应用或服务，以满足专业用户的深层需求，并进一步优化其商业化策略。
“论论”AI：一个主动讲解论文的播客式应用-orange.ai
一款名为“论论”的AI应用因其独特的交互方式受到关注。该应用一启动便能自动以播客形式，通过语音解读最新颖、最有趣的科学论文。这款AI展现出“E人AI”的积极主动性，其声音由公司CEO提供，所有内容均为自动生成，并伴有“魔性动画”播放。这种反传统的AI4S（AI for Science）应用体验，与多数APP的被动交互模式形成鲜明对比，凸显了AI在信息呈现和用户体验设计上的创新尝试。