AI研究 | 72Live中文网

2026.01.03.20 过去4小时全球AI发生了什么？
Jan 3, 2026 · 1 分钟阅读 ·
分享到:
过去4小时全球AI要闻回顾从脑科学看AI：人类大脑为何能以20瓦功耗碾压AI - 向阳乔木 Dwarkesh Patel对神经科学家亚当·马布尔斯通的访谈深入探讨了人脑与AI的效率差异。报告指出，人脑仅以20瓦功耗就能在理解因果、学习新概念及泛化能力上超越当前最先进的AI模型，核心在于其高效的学习机制和独特的双系统架构（硬编码的导向系统与可塑性的学习系统）。文章还强调了大脑的“全向推理引擎”、存算一体、物理随机性及稀疏激活等节能特性，并为AI发展提出了借鉴：如采用辅助损失函数、多任务学习、连接组学以及形式化证明语言Lean来提升AI的鲁棒性和安全性。 Boris Cherny分享Claude Code实战技巧：效率与协作的关键 - …

阅读更多
2025.12.30.20 过去4小时全球AI发生了什么？
Dec 30, 2025 · 1 分钟阅读 ·
分享到:
过去4小时全球AI要闻 Meta 收购AI代理公司 Manus，估值数十亿美元 - Orange AI Meta 宣布成功收购人工智能代理公司 Manus，此次交易价格据称高达数十亿美元，此前 Manus 正寻求以20亿美元估值进行新一轮融资。此次收购谈判在极短时间内完成，仅历时十余天，彰显了AI领域 M&A 的快速节奏和巨头对通用AI代理的激烈争夺。此次收购被业界视为具有里程碑意义的事件，预计将对中国的AI投资和创业生态产生深远影响。 Novita Labs 在 Hugging Face 上的月请求量突破1000万 - clem 🤗 AI推理服务提供商 Novita Labs 宣布在 Hugging Face 平台上取得了显著成 …

阅读更多
2025.12.24.20 过去24小时全球AI发生了什么？
Dec 24, 2025 · 1 分钟阅读 ·
分享到:
以下是过去24小时全球AI领域的一些重要动态和观点：唐杰对2025年大模型的七层感悟及AI应用第一性原理-宝玉清华大学教授、智谱AI首席科学家唐杰分享了对2025年大模型的七层感悟。他指出，预训练仍是基础，但中后训练和长尾对齐是提升模型效果的关键。Agent被视为模型从“学生”到“打工人”的跨越，是进入真实世界、产生实际价值的门槛。模型记忆能力是AI在真实环境中落地的刚需，同时，在线学习与自我评估可能成为下一个Scaling范式。唐杰强调，AI应用的第一性原理不应是创造新App，而是替代人类工作。他直言“领域大模型”是伪命题，并认为多模态和具身智能前景广阔但道路艰难，预判2026年将取得长足进步。微软与复旦大学合作推出AniX …

阅读更多
2025.12.08.16 过去4小时全球AI发生了什么？
Dec 8, 2025 · 1 分钟阅读 ·
分享到:
Nano Banana Pro 推出多功能AI提示词模板，赋能万物锐评与可视化-歸藏(guizang.ai) 歸藏(guizang.ai) 近期发布了一系列围绕 “Nano Banana Pro” 的强大提示词模板，旨在帮助用户对世间万物进行锐评并生成高度可视化的信息图表。这些模板包括：基于实时网络搜索生成“从夯到拉”的五级产品评价榜单，采用“Bento Grid”布局；用于商品购买决策的3D四象限决策矩阵海报；以及以可爱黏土风格展示任何爱好或职业进阶之路的地图海报。该工具强调AI生成的意外话题度和美观性，并能针对特定领域如《无畏契约》皮肤进行锐评。 Andrej Karpathy：将LLM视为模拟器而非实体-Andrej …

阅读更多
2025.11.10.12 过去4小时全球AI发生了什么？
Nov 10, 2025 · 1 分钟阅读 ·
分享到:
以下是过去4小时全球AI领域的一些重要动态： Google Research 推出 Nested Learning 解决 AI“灾难性遗忘”问题-小互 Google Research 团队提出了 Nested Learning（嵌套学习）框架，旨在解决AI模型在学习新任务时遗忘旧知识的“灾难性遗忘”问题。该方法模仿人脑的神经可塑性，构建多层嵌套的学习系统。不同层级负责不同时间尺度的学习和记忆：高频层处理短期任务，中频层整合知识，低频层稳定长期知识，从而使AI模型能够像人类一样持续学习并长期保持稳定的知识结构。这项技术有望使AI具备更强大的持续学习能力和类人智能。 xAI 似乎要发布一款音乐模型-小互埃隆·马斯克的AI公司 xAI …

阅读更多
2025.11.08.08 过去4小时全球AI发生了什么？
Nov 8, 2025 · 1 分钟阅读 ·
分享到:
Sam Altman就OpenAI扩大CHIPS法案税收抵免申请做出澄清 OpenAI首席执行官Sam Altman就公司寻求将《CHIPS法案》税收抵免扩大到数据中心的报道进行澄清。他表示，这是关于政府在关键基础设施建设中的作用，旨在支持美国本土供应链和制造业的再工业化，这包括晶圆厂、涡轮机等多个行业，最终将惠及所有相关参与者。Altman强调，这与直接向OpenAI提供贷款担保性质不同，是更广泛的国家政策，旨在确保国内供应安全。 Polymarket开始“调侃”Sam Altman Gary Marcus发文指出，预测市场平台Polymarket已开始对Sam Altman进行“调侃”。这反映出市场对于OpenAI及其领导 …

阅读更多
2025.10.27.04 过去4小时全球AI发生了什么？
Oct 27, 2025 · 1 分钟阅读 ·
分享到:
AI 领袖观点差异解析-Gary Marcus AI 研究者 Gary Marcus 发布推文，探讨了 Sam Altman、Elon Musk、Geoffrey Hinton、他本人以及 Yann LeCun 等主要 AI 领域领袖之间的观点差异。尽管具体分歧内容未在推文中详细展开，但该推文暗示了这些关键人物在 AI 发展路径、风险及伦理等方面的多元化立场，为理解当前 AI 领域内的思想碰撞提供了线索。Marcus 以一种轻松的方式提及这些差异，可能指向了对 AI 未来走向的持续辩论。多模态AI开发者讲座预告-merve 开发者 merve 宣布将于未来三天在克拉科夫 (Krakow) 的 futureconf 会议上发表演 …

阅读更多
2025.10.14.00 过去4小时全球AI发生了什么？
Oct 14, 2025 · 1 分钟阅读 ·
分享到:
以下是过去4小时全球AI领域的最新动态： Andrej Karpathy 发布 nanochat：一个从零开始的极简 ChatGPT 克隆训练推理管线-Andrej Karpathy Andrej Karpathy 发布了其最新项目 nanochat，这是一个极简的、从零开始的全栈训练/推理管线，用于构建一个简易的 ChatGPT 克隆。该项目代码量约8000行，涵盖了从 Tokenizer 训练、FineWeb 上的 Transformer LLM 预训练、SmolTalk 上的用户-助手对话中训、SFT（监督微调），到 RLHF（通过“GRPO”进行强化学习）的全过程。用户只需在一台云 GPU 设备上运行一个脚本，最快在 4小 …

阅读更多
2025.09.23.04 过去4小时全球AI发生了什么？
Sep 23, 2025 · 1 分钟阅读 ·
分享到:
《通用智能体包含世界模型》论文提出AI智能体必须建立世界模型-宝玉一篇新论文《通用智能体包含世界模型》通过严格数学证明，指出任何能有效完成复杂多步骤任务的智能体，都必然在内部学习并构建其所处世界的精确预测模型。这项研究挑战了长期以来“无模型”方法通向通用人工智能（AGI）的设想，表明AI智能体为了获得通用能力，会自发涌现出世界模型，而非必须显式编程。这一发现对AI的安全性和可解释性具有重大影响，意味着我们可以从强大的智能体行为中提取其隐藏的世界模型进行审查，为理解大语言模型（LLM）的“涌现能力”提供了理论解释，并可能统一AI研究领域。阿里巴巴发布Qwen3-Omni，首个端到端全模态AI模型-clem 🤗 阿里巴巴重磅推 …

阅读更多
2025.09.22.12 过去4小时全球AI发生了什么？
Sep 22, 2025 · 1 分钟阅读 ·
分享到:
Google Deep Researcher (TTD-DR)：基于扩散模型的长篇报告生成框架-小互 Google 发布了一种新型的 Deep Researcher (TTD-DR) 框架，它是一个基于扩散模型的AI代理，旨在模拟人类研究员撰写报告的迭代过程。该框架借鉴了图片扩散模型的原理，将粗糙的初稿逐步“去噪”成高质量的研究报告。在长篇报告生成任务上，TTD-DR 的胜率达到了 74.5%，显著优于 OpenAI DR 的 50%。此外，它在 HLE-Search 和 GAIA 任务上的正确率也分别提升了 7.7% 和 1.7%，显示出在相同时间延迟下能生成更高质量结果的高效性。 AI对软件工程底层范式的影响：加速而非颠覆-宝 …

阅读更多
- 1
- 2