今日全球AI动态呈现出鲜明的两极分化:一方面,底层基础设施的军备竞赛愈演愈烈,从英伟达与台积电在美国本土下线首片Blackwell芯片,到亚马逊规划核反应堆为AI供能,再到国产GPU厂商沐曦冲刺上市,硬件的物理边界正被不断拓宽。另一方面,上层应用和商业模式的探索则充满了不确定性。OpenAI试图通过“ChatGPT登录”构建生态壁垒,但其核心产品在欧洲市场已现增长瓶颈。AI应用的繁荣(广交会)与初创公司的脆弱(一星机器人解散)并存,显示出从技术热潮到商业价值的转化之路依然道阻且长。 英伟达与台积电合作,首片美国本土制造Blackwell芯片晶圆亮相 英伟达与台积电在美国亚利桑那州的工厂成功生产出首片 Blackwell 芯片晶圆,标 …
阅读更多Andrej Karpathy 深入解读 Dwarkesh 播客谈话要点:AGI 时间表、AI 学习范式与智能体设计-Andrej Karpathy Andrej Karpathy 在其 Dwarkesh 播客后的补充说明中,详细阐述了对 AI 领域多个关键议题的看法。他认为 **AGI 实现的“十年时间表”**相对当前炒作而言显得悲观,但与AI怀疑论者相比仍乐观,强调LLM进步巨大但仍有大量集成和安全工作待完成。Karpathy 区分了 “动物式”学习(进化预装智能)和 “幽灵式”LLM 智能(通过预测下一个词预装智能),并提出应使 AI 更像动物。他对 **强化学习(RL)**持短期看空态度,认为其效率低且噪声大,转而看好“智 …
阅读更多Replit通过AI Agent实现代码库自动化迁移-Amjad Masad Amjad Masad分享了Replit中一项令人印象深刻的功能:用户可以将代码库导入Replit,并由**智能体(Agent)**自动完成迁移工作。这展示了AI Agent在开发工作流中提供自动化和便利性的实际应用,能够显著提升开发效率和用户体验,标志着AI工具在软件开发领域日益成熟。 人形机器人正处于“iPhone时刻”的临界点-Peter H. Diamandis, MD Peter H. Diamandis博士预测,人形机器人正处于其“iPhone时刻”的临界点。他暗示人形机器人即将迎来一个突破性发展阶段,类似于智能手机在2007年iPhone发 …
阅读更多Grok 4能力引发AGI讨论及Twitter整合计划-Emad, orange.ai, Gary Marcus Stability AI的Emad表示,如果Grok 4在工程能力上能超越Andrej Karpathy,他将乐意称其为AGI。与此同时,orange.ai透露Twitter的算法将迎来重大改革,未来将完全由Grok驱动,被视为一项革命性改进,但其表现仍有待观察。然而,Gary Marcus对埃隆·马斯克关于Grok能力的某些说法持强烈怀疑态度,直接表达了“胡说八道”的观点,并质疑其实现的概率。 Walmart通过ChatGPT实现直接购物,零售数据流向OpenAI-Peter H. Diamandis, MD 沃尔玛 …
阅读更多以下是过去四小时内全球AI领域的重要动态: Gary Marcus 反思LLM发展困境及AGI预期 - Gary Marcus AI研究员Gary Marcus近期总结了多项对大型语言模型(LLM)实现通用人工智能(AGI)前景构成打击的进展。他引用了苹果和亚利桑那州立大学(ASU)等机构的论文,证实LLM仍然无法解决分布偏移问题。此外,他指出GPT-5的表现未能达到预期,图灵奖得主Rich Sutton也认同他对LLM的批评。值得关注的是,Andrej Karpathy表示当前AI代理远未成熟,无法胜任人类同事或实习生角色,并预测AGI的实现仍需十年之久。DeepMind的Demis Hassabis也据称驳斥了OpenAI关 …
阅读更多Gemini App 改进 LaTeX 渲染功能-Demis Hassabis Google DeepMind 负责人 Demis Hassabis 转发了 Josh Woodward 的更新,宣布 Google Gemini 应用已修复一项关键的“小痛点”,即 LaTeX 渲染功能得到显著改进。此次更新不仅优化了渲染效果,还加入了多项新功能,旨在让用户在 Gemini App 中处理 LaTeX 内容时更加便捷。这一改进对于需要处理学术文档、数学公式或技术报告的用户而言,无疑将大幅提升其工作效率和使用体验。
阅读更多Veo 3.1 与 Sora 2 视频生成能力对比:各有优劣-向阳乔木 近期对视频生成模型Veo 3.1和Sora 2的对比测试显示,两者在不同方面表现出各自的优势。Veo 3.1 在画质清晰度、动态幅度以及对提示词的遵循度上表现更佳,提供了更高的真实感。然而,其生成的动作有时显得不够自然。相比之下,Sora 2 在剧情叙事理解、画面连贯性以及中文语音的自然度方面则更胜一筹,展现出更强的故事性和语言处理能力。整体而言,Veo 3.1可能在画面细节和动态表现上领先,而Sora 2则在叙事和语言自然度上更具优势。 Gemini API 集成 Google Maps 实现地理位置信息“接地”-Demis Hassabis Google …
阅读更多今日全球AI领域呈现出软硬件两翼齐飞的态势。硬件层面,英伟达Blackwell芯片在美国本土的成功下线,标志着全球AI算力供应链格局的深刻变化。软件层面,AI正加速从模型能力向“代理”能力进化,Anthropic为Claude赋予“技能”,Zoho则将其应用于企业工作流,预示着AI执行复杂任务时代的到来。同时,具身智能赛道持续升温,资本与开源社区共同发力。在激烈的市场竞争中,谷歌凭借生态优势冲击Adobe,再次印证了应用场景与分发渠道的重要性。 黄仁勋亲赴庆祝:首片美国产英伟达 Blackwell 晶圆在台积电亚利桑那工厂下线 英伟达CEO黄仁勋亲临台积电亚利桑那州工厂,庆祝首片在美国本土生产的 Blackwell 架构晶圆成功下 …
阅读更多市场首次对AI“奇幻”预测表示质疑,2030年2000亿美元利润前景堪忧-Gary Marcus AI专家Gary Marcus对当前市场中关于AI的过度乐观预测和高达2000亿美元的未来利润预期表达了强烈的怀疑。他指出,市场首次对这些“奇幻”般的AI前景发出了“不买账”的声音,暗示了投资者的信心可能正在回归理性。Gary Marcus长期以来一直是AI发展中的一位批评者,主张对AI的能力和实际落地应用保持谨慎,避免过度炒作。他的言论可能反映了部分行业观察家对AI泡沫化趋势的担忧,以及对实际商业价值实现难度的关注。 陶哲轩与CVS案例:AI应聚焦辅助日常繁琐任务,而非直接攻克最难问题-宝玉 知名博主“宝玉”援引数学家陶哲轩的观点, …
阅读更多以下是过去四小时内全球AI领域的动态摘要: HuggingChat Omni发布,引领多模型路由新范式-clem 🤗 HuggingFace的clem 🤗宣布推出HuggingChat Omni,其核心突破在于能够智能地在数百个开源模型(包括gpt-oss、deepseek、qwen等100多个模型)之间路由用户请求,以提供最佳、最经济、最快速的答案。这一机制类似于GPT-5在不同模型间进行消息路由的“主要突破”,但HuggingChat Omni将这一能力扩展到更广阔的开源生态系统,涵盖了文本、图像、音频、视频等多种模态。此外,他还提及了其模型路由是基于Arch-Router-1.5B等开放模型实现,预示着AI模型服务进入多模型智 …
阅读更多