Sam Altman就OpenAI扩大CHIPS法案税收抵免申请做出澄清 OpenAI首席执行官Sam Altman就公司寻求将《CHIPS法案》税收抵免扩大到数据中心的报道进行澄清。他表示,这是关于政府在关键基础设施建设中的作用,旨在支持美国本土供应链和制造业的再工业化,这包括晶圆厂、涡轮机等多个行业,最终将惠及所有相关参与者。Altman强调,这与直接向OpenAI提供贷款担保性质不同,是更广泛的国家政策,旨在确保国内供应安全。 Polymarket开始“调侃”Sam Altman Gary Marcus发文指出,预测市场平台Polymarket已开始对Sam Altman进行“调侃”。这反映出市场对于OpenAI及其领导 …
阅读更多AI 领袖观点差异解析-Gary Marcus AI 研究者 Gary Marcus 发布推文,探讨了 Sam Altman、Elon Musk、Geoffrey Hinton、他本人以及 Yann LeCun 等主要 AI 领域领袖之间的观点差异。尽管具体分歧内容未在推文中详细展开,但该推文暗示了这些关键人物在 AI 发展路径、风险及伦理等方面的多元化立场,为理解当前 AI 领域内的思想碰撞提供了线索。Marcus 以一种轻松的方式提及这些差异,可能指向了对 AI 未来走向的持续辩论。 多模态AI开发者讲座预告-merve 开发者 merve 宣布将于未来三天在克拉科夫 (Krakow) 的 futureconf 会议上发表演 …
阅读更多以下是过去4小时全球AI领域的最新动态: Andrej Karpathy 发布 nanochat:一个从零开始的极简 ChatGPT 克隆训练推理管线-Andrej Karpathy Andrej Karpathy 发布了其最新项目 nanochat,这是一个极简的、从零开始的全栈训练/推理管线,用于构建一个简易的 ChatGPT 克隆。该项目代码量约8000行,涵盖了从 Tokenizer 训练、FineWeb 上的 Transformer LLM 预训练、SmolTalk 上的 用户-助手对话中训、SFT(监督微调),到 RLHF(通过“GRPO”进行强化学习)的全过程。用户只需在一台云 GPU 设备上运行一个脚本,最快在 4小 …
阅读更多《通用智能体包含世界模型》论文提出AI智能体必须建立世界模型-宝玉 一篇新论文《通用智能体包含世界模型》通过严格数学证明,指出任何能有效完成复杂多步骤任务的智能体,都必然在内部学习并构建其所处世界的精确预测模型。这项研究挑战了长期以来“无模型”方法通向通用人工智能(AGI)的设想,表明AI智能体为了获得通用能力,会自发涌现出世界模型,而非必须显式编程。这一发现对AI的安全性和可解释性具有重大影响,意味着我们可以从强大的智能体行为中提取其隐藏的世界模型进行审查,为理解大语言模型(LLM)的“涌现能力”提供了理论解释,并可能统一AI研究领域。 阿里巴巴发布Qwen3-Omni,首个端到端全模态AI模型-clem 🤗 阿里巴巴重磅推 …
阅读更多Google Deep Researcher (TTD-DR):基于扩散模型的长篇报告生成框架-小互 Google 发布了一种新型的 Deep Researcher (TTD-DR) 框架,它是一个基于扩散模型的AI代理,旨在模拟人类研究员撰写报告的迭代过程。该框架借鉴了图片扩散模型的原理,将粗糙的初稿逐步“去噪”成高质量的研究报告。在长篇报告生成任务上,TTD-DR 的胜率达到了 74.5%,显著优于 OpenAI DR 的 50%。此外,它在 HLE-Search 和 GAIA 任务上的正确率也分别提升了 7.7% 和 1.7%,显示出在相同时间延迟下能生成更高质量结果的高效性。 AI对软件工程底层范式的影响:加速而非颠覆-宝 …
阅读更多以下是过去4小时全球AI领域的一些重要动态: Google AI 端侧模型体验应用上线 Google Play - 歸藏(guizang.ai) 谷歌已将其端侧模型体验应用“Google AI Edge Gallery”上架 Google Play 商店。用户现在可以直接搜索并安装此应用,其中集成了谷歌所有的 Gemma 端侧模型。该应用支持多种功能,包括图像识别、音频对话以及常规的文字对话,旨在为用户提供便捷的本地AI模型体验。 Anthropic 发布《如何为 Agent 构建工具》新文章 - 歸藏(guizang.ai) Anthropic 发布了一篇关于“如何为 Agent 构建工具”的新文章,强调了 Agent 工具设计需 …
阅读更多以下是过去4小时全球AI领域的动态摘要: HunyuanWorld-Voyager:可探索的3D世界生成 - clem 🤗 一项名为 HunyuanWorld-Voyager 的最新AI技术被提出,专注于可探索的3D世界生成。该技术利用了世界一致的视频扩散(World-consistent video diffusion)和长距离世界探索(Long-range world exploration)能力,预示着在创建沉浸式、连贯的虚拟环境方面取得了显著进展。这有望在游戏、虚拟现实和仿真等领域带来突破。 微软AI的VibeVoice:领先的开源文本转语音模型 - clem 🤗 微软AI推出的开源文本转语音(TTS) …
阅读更多