2025.09.22.12 过去4小时全球AI发生了什么?
Google Deep Researcher (TTD-DR):基于扩散模型的长篇报告生成框架-小互
Google 发布了一种新型的 Deep Researcher (TTD-DR) 框架,它是一个基于扩散模型的AI代理,旨在模拟人类研究员撰写报告的迭代过程。该框架借鉴了图片扩散模型的原理,将粗糙的初稿逐步“去噪”成高质量的研究报告。在长篇报告生成任务上,TTD-DR 的胜率达到了 74.5%,显著优于 OpenAI DR 的 50%。此外,它在 HLE-Search 和 GAIA 任务上的正确率也分别提升了 7.7% 和 1.7%,显示出在相同时间延迟下能生成更高质量结果的高效性。
关于AI是否会改变软件工程底层范式的讨论指出,AI目前更多是加速了“需求 → 设计 → 开发 → 测试 → 部署”这一现有流程,而非彻底颠覆。作者认为,软件工程的范式转变取决于需求能否标准化,而当前需求普遍开放且非标准化,难以实现自动化验证。AI在可自动化验证领域表现出色,但在软件需求方面,由于其模糊性和持续变化性,“human in loop” 仍然是不可或缺的。真正的颠覆可能要等到AI能将人类需求标准化,从而实现完全自动化的编码和测试验收。
OpenAI 预告新模型与产品,或针对Pro用户额外收费-小互
Sam Altman 预告 OpenAI 将推出一系列新的模型和产品,这些新品将对算力提出更高的要求。据悉,这些新功能或产品将仅对 Pro 用户开放,并且可能采取额外收费的模式。这一动向表明 OpenAI 正在积极拓展其产品线,可能在 ChatGPT 之外推出新的应用或服务,以满足专业用户的深层需求,并进一步优化其商业化策略。
“论论”AI:一个主动讲解论文的播客式应用-orange.ai
一款名为“论论”的AI应用因其独特的交互方式受到关注。该应用一启动便能自动以播客形式,通过语音解读最新颖、最有趣的科学论文。这款AI展现出“E人AI”的积极主动性,其声音由公司CEO提供,所有内容均为自动生成,并伴有“魔性动画”播放。这种反传统的AI4S(AI for Science)应用体验,与多数APP的被动交互模式形成鲜明对比,凸显了AI在信息呈现和用户体验设计上的创新尝试。