以下是过去4小时全球AI领域的主要动态: 英伟达斥资200亿美元收购AI芯片独角兽Groq核心资产 - 宝玉 英伟达(Nvidia)完成了一项约200亿美元现金的重大交易,收购AI芯片初创公司Groq的核心资产与人才团队。此次交易采取“掏空式”合作模式,Groq创始人Jonathan Ross将带领核心技术团队加入英伟达,负责技术落地,而Groq公司本身将继续运营其云服务业务GroqCloud。Groq的LPU(语言处理单元)在AI推理环节表现出色,提供极快、低延迟的AI答题速度。此次收购将进一步巩固英伟达在AI硬件领域的护城河,扫清潜在竞争对手。 Notion创始人Ivan Zhao论AI:从“看着后视镜开车”到“无限大脑” - …
阅读更多微软与复旦大学合作推出AniX系统,实现3D角色可控动画生成-向阳乔木 微软研究院与复旦大学联合开发了 AniX系统,该系统能让用户通过自然语言指令在3D场景中控制角色生成复杂动作视频。AniX的核心能力包括场景与角色的一致性、丰富的动作库(通过4个基础动作学习142种新动作)、持续互动性及可控镜头。该系统基于GTA-V游戏录像训练,通过条件自回归视频生成实现,并采用HunyuanCustom(130亿参数)和Flow Matching方法。评估结果显示,AniX在视觉质量和动作控制成功率上显著优于现有模型,尤其在基础动作上达到100%成功率,新动作成功率也高达80.7%。原始模型生成93帧360P视频需121秒,经蒸馏后可缩短 …
阅读更多以下是过去24小时全球AI领域的精选动态: GLM 4.7 模型发布:性能大幅提升且极具性价比 - mervenoyann & 小互 & clem 🤗 & Ben Tossell GLM 4.7 模型正式发布,标志着开放前沿模型取得了巨大进步。该模型在编码、复杂推理和工具使用方面显著超越了DeepSeek V3.2,并在多项任务中表现优于部分闭源模型。GLM 4.7已在Hugging Face Transformers和推理提供商上同步上线,并提供BF16和FP8检查点下载。对于GLM Coding Plan用户,将自动升级至GLM-4.7。相较于Claude Code模型,GLM 4.7的成本仅为其1/7,使用配额为其3倍,同时编 …
阅读更多AI模型在CFA考试中表现卓越 - Peter H. Diamandis, MD Peter Diamandis指出,AI技术发展迅速。2023年GPT-3.5未能通过CFA考试,但到了2025年,Gemini 3.0 Pro已能取得97.6%的成绩,而GPT-5在二级考试中也达到了94.3%。目前已有五款AI模型能够通过CFA所有三个级别的考试,显示出AI在复杂金融领域推理能力的显著提升。 GLM 4.7发布,在多任务上超越现有模型 - merve GLM 4.7已正式发布,被誉为开放前沿模型领域的一大飞跃。该模型在编码、复杂推理和工具使用方面取得了实质性改进,超越了DeepSeek V3.2,并在多项任务中表现优于部分闭源模 …
阅读更多以下是过去4小时内全球AI领域的重要动态汇总: AI2发布SAGE-MM和Molmo 2多模态模型Demo-merve Allen Institute for AI (AI2) 在Hugging Face上发布了其最先进(SOTA)的多模态模型SAGE-MM和Molmo 2的演示版本。SAGE-MM是一个专注于长视频推理的智能多领域代理模型,而Molmo 2则特别支持多图像输入,展示了AI在复杂多模态理解和生成方面的最新进展。 小米MiMo论文揭示AI前端代码生成强化秘诀-宝玉 小米在其MiMo论文中详细阐述了如何训练AI模型生成前端代码,其核心在于引入了基于视觉的验证器。该验证器通过对录制的视频片段进行评分,综合评估代码的视觉质 …
阅读更多AI2发布SAGE-MM多模态模型演示 Allen Institute for AI (AI2) 最新发布了其 SAGE-MM 多模态模型的演示,该模型被称为“智能任意视界代理”(Smart Any-Horizon Agents),专为长视频推理设计。这一演示已在Hugging Face上开放,预示着视频理解和长时序推理能力的进一步提升。 AI2发布Molmo 2多模态模型演示 AI2的另一项重要进展是发布了最新SOTA(State-of-the-Art)多模态模型 Molmo 2 的演示。该模型同样已在Hugging Face上提供,并支持多图像输入(Multi-Im…),展现了其在复杂视觉理解和多模态交互方面的强大潜力。 小 …
阅读更多Redis之父Salvatore Sanfilippo:2025年AI反思八大观点-宝玉 Redis之父Salvatore Sanfilippo发表了对AI的年终反思,包含八项主要观点。他认为,“随机鹦鹉”说法已不再被广泛接受,因为LLM在专业考试中表现出色并展现出内部概念表征。思维链(CoT)被低估,它通过内部表征采样和强化学习来提升推理能力。算力扩张瓶颈因可验证奖励的强化学习而打破,使模型能在特定任务上自我提升。程序员对AI辅助编程的态度从怀疑转向接受,因其高投入产出比。Salvatore对Transformer架构持开放态度,认为它仍有潜力达到AGI。他强调思维链并未改变LLM的本质,而ARC测试从反LLM立场转为支持。最 …
阅读更多Andrej Karpathy 2025年LLM年度回顾:RLVR、AI智能体、Vibe Coding和LLM GUI成亮点-宝玉 OpenAI联合创始人兼前特斯拉AI总监Andrej Karpathy发布了2025年LLM年度回顾,指出四大变化:训练方法的范式升级,引入“可验证奖励的强化学习”(RLVR),模型通过自我练习在数学、代码等领域提升推理能力,导致算力分配更多转向强化学习;其次,对AI智能本质的理解加深,其“参差不齐的智能”表现为在可验证领域能力飙升,但在常识、创意方面仍存不足,并对基准测试的信任度降低;第三,LLM应用层浮出水面,如Cursor,展示了垂直领域应用通过上下文工程、多模型编排和专业界面实现价值;第 …
阅读更多Alibaba’s Qwen-Image-Layered is LIVE — native image decomposition, fully open-sourced! - merve 阿里巴巴的Qwen团队发布了完全开源的Qwen-Image-Layered模型,该模型提供Photoshop级别的原生图片分层功能。这项强大的技术能够将图片分解为多个层,预计将催生出多种创新应用场景,为图像处理和内容创作带来变革性的潜力。 RT @matanSF: GPT5.2 + Droid is phenomenal for NextJS - Ben Tossell 有报道指出,GPT 5.2与Droid的结合在NextJS开发方面表现“非 …
阅读更多Allen AI 发布视频推理智能体系统-merve Allen AI 近期发布了一款用于视频推理的智能体系统,同时还提供了模型、针对不同训练阶段的数据集以及基准测试集。这一发布将推动视频内容理解和智能决策领域的发展,为研究人员和开发者提供了强大的新工具和资源。 Andrew Ng 剖析LLMs:通用性强但非通向AGI的捷径-Andrew Ng 吴恩达指出,尽管大型语言模型 (LLMs) 表现惊人且具有通用性,但它们并非在短短几年内就能通向通用人工智能 (AGI) 的路径。LLMs 知识的提升是一个碎片化过程,需要通过耗时的数据获取、清洗、去重、复述等数据工程工作,或通过构建大量强化学习模拟环境来反复训练模型。人类在面对较少数据和 …
阅读更多