以下是过去4小时内全球AI领域的重要动态: Andrej Karpathy 深入探讨离散文本扩散模型 Andrej Karpathy 分享了一篇关于简单文本(离散)扩散的短文,并对文本生成中的两种主要范式——扩散(迭代去噪)和自回归(从左到右生成)进行了深入比较。他指出,扩散模型在图像/视频生成中占据主导地位,而自回归在文本领域更为普遍。Karpathy 解释说,去除数学形式主义后,扩散模型本质上是一种带有双向注意力的 Transformer,通过迭代重新采样和遮蔽 tokens 来生成最终样本。尽管双向注意力在语言模型中更强大,但训练成本更高。他认为,这两种范式在 LLM 堆栈中仍有进一步融合和泛化的可能性。 Claude …
阅读更多Elon Musk 的 AGI 定义与 Gary Marcus 的百万美元慈善赌注-Gary Marcus AI研究员Gary Marcus对埃隆·马斯克关于其下一个模型有10%几率实现通用人工智能(AGI)的说法提出质疑,并向马斯克发起了100万美元的慈善赌注。Marcus表示,他愿意以10:1的赔率,根据马斯克自己定义的AGI标准来判定结果,如果马斯克接受挑战。Marcus对这一预测持高度怀疑态度,认为实际可能性“接近于零”,此举旨在促使马斯克为其言论负责。 Claude Code Now v1.5.0 更新:支持多API配置切换,提升效率-orange.ai Claude Code Now 发布了 v1.5.0 更新,解决了 …
阅读更多今日全球AI动态呈现出鲜明的两极分化:一方面,底层基础设施的军备竞赛愈演愈烈,从英伟达与台积电在美国本土下线首片Blackwell芯片,到亚马逊规划核反应堆为AI供能,再到国产GPU厂商沐曦冲刺上市,硬件的物理边界正被不断拓宽。另一方面,上层应用和商业模式的探索则充满了不确定性。OpenAI试图通过“ChatGPT登录”构建生态壁垒,但其核心产品在欧洲市场已现增长瓶颈。AI应用的繁荣(广交会)与初创公司的脆弱(一星机器人解散)并存,显示出从技术热潮到商业价值的转化之路依然道阻且长。 英伟达与台积电合作,首片美国本土制造Blackwell芯片晶圆亮相 英伟达与台积电在美国亚利桑那州的工厂成功生产出首片 Blackwell 芯片晶圆,标 …
阅读更多Veo 3.1 与 Sora 2 视频生成能力对比:各有优劣-向阳乔木 近期对视频生成模型Veo 3.1和Sora 2的对比测试显示,两者在不同方面表现出各自的优势。Veo 3.1 在画质清晰度、动态幅度以及对提示词的遵循度上表现更佳,提供了更高的真实感。然而,其生成的动作有时显得不够自然。相比之下,Sora 2 在剧情叙事理解、画面连贯性以及中文语音的自然度方面则更胜一筹,展现出更强的故事性和语言处理能力。整体而言,Veo 3.1可能在画面细节和动态表现上领先,而Sora 2则在叙事和语言自然度上更具优势。 Gemini API 集成 Google Maps 实现地理位置信息“接地”-Demis Hassabis Google …
阅读更多过去4小时全球AI动态: AI视频公司HeyGen揭秘“HeyGen Way”产品方法论,实现惊人增长-歸藏(guizang.ai) AI视频生成公司HeyGen在不到两年半的时间内,从100万美元收入增长至1亿美元,并公开了其内部称为“圣经”的产品方法论——“HeyGen Way”。该方法论核心在于**“快速行动,成为绝对最佳”**,倡导拥抱AI技术的不确定性和快速变化,将产品设计成能随模型改进而自动升级。HeyGen将视频分为沟通类和电影类,专注于让沟通类视频对所有人可用。其运营节奏包括2个月路线图规划、6-12个月战略押注、两周承诺清单和每日发布。公司遵循五大运营原则:速度至上、拥抱技术浪潮、表达异议并承诺执行、通过创新实现用 …
阅读更多以下是过去4小时全球AI领域的最新动态: Anthropic 发布 Claude Haiku 4.5 模型 - 歸藏(guizang.ai) Anthropic公司发布了最新的小型模型 Claude Haiku 4.5,该模型在性能上已接近五个月前的顶级模型 Claude Sonnet 4,但成本仅为后者三分之一,速度却提升两倍。尤其在如Claude for Chrome等电脑操作任务中,Haiku 4.5的表现甚至优于Sonnet 4。其定价极具竞争力,输入和输出每百万Token分别仅需1美元和5美元。Haiku 4.5现已全面集成到Claude平台、Claude Code以及Droid CLI中,旨在提供更高效、经济的AI服务。 …
阅读更多以下是过去四小时全球AI领域的主要动态: 斯坦福大学发布2025年“最恐怖”AI论文,聚焦AI对人类的影响-Emad Emad转发了Chris LaubAI的推文,指出斯坦福大学在2025年发布了一篇被形容为“最恐怖”的AI论文,其核心内容并非关于杀手机器人,而是关于AI对人类自身的影响。尽管具体细节尚未完全披露,但该论文似乎探讨了AI技术进步与人类社会、个体行为之间深层且可能令人不安的关联,预示着AI发展将带来深刻的社会变革和挑战。 Hugging Face成为AI领域的“GitHub”,Google是其最大下载组织-clem 🤗 Clement Delangue转发了关于Hugging Face的讨论,指出Hugging …
阅读更多海外播客Peter H. Diamandis谈AI:OpenAI策略、未来数据中心及软件自改进 - 向阳乔木 一位名为Peter H. Diamandis的海外播客邀请多位科技界大佬共同探讨AI前沿动态,并分享了多个大胆预测和观点。其中,对OpenAI推出的Agent Builder被评为“世界上最愚蠢的事情”,并指出Sam Altman的战略核心在于控制用户安装量和海量计算能力。播客还预测,未来数据中心将脱离电网,与天然气或小型模块化核反应堆(SMRs)一同建设,甚至可能部署在太空。大佬们认为,人类可能成为超级智能“最不重要的用户”,且我们正处在软件递归自我改进的临界点,AI甚至能在我们意识到需求前就写好软件。此外,Sora2的 …
阅读更多新闻列表 腾讯混元图像3.0登顶LMArena文生图榜首,成为全球第一-orange.ai 腾讯混元图像3.0在国际权威AI模型竞技场LMArena的用户投票榜单中登顶第一,成为全球领先的文生图模型。该模型通过完全匿名的盲测机制,击败了包括Google的Nano Banana和OpenAI的GPT-4o生图在内的众多国际知名模型,是LMArena所有单项榜单中唯一一个获得第一的中国模型。用户反馈其最大的特色在于对用户意图的深刻理解,显著降低了提示词编写的复杂性。此外,它在画面精度、色彩还原和风格多样性方面表现出色,并具备优秀的中文文字生成能力(长文本仍有改进空间)。目前,腾讯混元图像3.0已完全免费开放体验。
阅读更多Gary Marcus:对OpenAI Altman的怀疑论正在AI社区中获得认同 AI研究者Gary Marcus指出,OpenAI的GPT-5未能兑现其关于“通用人工智能(AGI)和博士级认知”的承诺,这表明OpenAI依赖大规模数据和芯片来指数级提升系统智能的路径可能不再奏效。他表示,此前Altman曾试图将他的质疑视为孤立观点,但现在这种怀疑论在AI社区中获得了广泛认同。Altman回应时仅强调GPT-6和GPT-7将显著改进,但Marcus认为这缺乏实质性内容,仅是新的承诺。 AI被比作“石棉”:对AI长期影响的担忧 著名作家Cory Doctorow被引用发表了对AI未来的强烈担忧,他将AI比作“我们社会墙壁中填塞的石 …
阅读更多