Sora 2 物理模拟缺陷集锦 - Gary Marcus Gary Marcus 分享了一段关于 OpenAI Sora 2 视频生成模型物理模拟缺陷的视频合集。该合集展示了Sora 2在处理复杂物理交互时出现的明显失误,例如物体穿透、不自然的运动轨迹以及对重力等基本物理定律的错误演绎。这表明尽管Sora在视频生成方面取得了显著进展,但在实现真实世界的物理一致性上仍面临重大挑战,反映出当前AI视频模型在理解和模拟复杂物理世界方面的局限性。 AI 正在接管 𝕏:Grok 赋能全球交流与算法 - 小互 用户“小互”发文指出,Elon Musk 领导下的 X(原Twitter)正加速由 AI 接管,特别是通过深度集成 Grok AI …
阅读更多以下是过去4小时全球AI领域的动态摘要: 关于多模态模型和图像处理的思考-merve AI研究者merve分享了对多模态模型处理方式的看法。她指出,当前许多模型更像是“学会了看”的LLM,而非真正的图像原生模型。她对通过文档检索器进行文档检索提出了“大胆的看法”,认为不应忽视图像模态,并提出了“通过图像解决文本问题”的有趣思路,这可能预示着未来在视觉和文本处理融合方面的新方向。 AI初创公司一年内实现2亿美元营收并招聘工程师-Amjad Masad Amjad Masad转发了一则消息,某AI初创公司在短短一年内,从零收入跃升至超过2亿美元的年经常性收入(ARR),并正在积极招聘工程师。这一快速增长案例凸显了当前AI市场中部分领域的 …
阅读更多在过去4小时内,全球AI领域涌现出多项新进展和讨论。语音技术方面,Fish Audio S1推出了升级版语音克隆模型和API,大幅提升了性能。Google的Veo视频模型增加了强大的精确编辑功能。Anthropic为生命科学领域推出了专属的Claude版本,并强化了Agent Skills。DeepSeek在AI基础设施和开放研究方面持续发力。此外,OpenAI发布了编写高质量文档的指南,知名思想家Ray Dalio也推出了其思想的AI智能体。 Fish Audio S1 API上线及语音克隆模型升级-小互 Fish Audio S1 API已正式上线,并对语音克隆模型进行了显著升级。该API实现了低于 500毫秒的首帧延 …
阅读更多今日全球AI动态聚焦于人工智能的深度渗透与基础能力的构建。微软正式宣告Windows 11进入AI原生平台时代,标志着操作系统层面的AI集成成为新常态。与此同时,国产算力取得关键突破,首款**全国产通用GPU“曦云 C600”**的发布,为大模型训练提供了自主可控的硬件基础。在模型进展方面,马斯克对Grok 5实现AGI的预测引发热议,而DeepSeek则开源了新的OCR模型,持续推动AI在特定应用领域的深化。此外,从机器人控制算法的革新到AI在广告、客服等行业的颠覆性应用,技术正加速从数字世界走向物理世界,重塑产业格局。 微软官宣:Win10 时代落幕,Win11 凭 AI 全面开启“未来办公” 微软正式宣布Windows 10时 …
阅读更多English Version (Intro Music with upbeat tempo) Host: News Discovery Time! Today we are exploring… Bang! Pop! Wow! …the secret lives of zombie cicadas and time-traveling treasures!
(Sound of cicadas buzzing, followed by a mysterious sound effect) Host: Our first story is a little creepy, a little crawly, and …
阅读更多以下是过去4小时全球AI领域的动态摘要: AI对就业市场的影响及新机遇-Peter H. Diamandis, MD Peter H. Diamandis指出,AI正在加速就业岗位的消失,预计2025年将有80万人失业,仅9月份就有1万人因AI失业。然而,他强调这同时也是一场“新淘金热”的开始,机遇属于那些学会与机器协作而非对抗机器的人。这意味着个人和企业需要积极适应AI带来的变革,通过学习如何利用AI工具来构建新价值,从而在新时代中找到立足之地。 Claude Code Now项目进展与GLM 4.6支持-orange.ai Claude Code Now项目已突破300 Star,显示出其在开发者社区中的受欢迎程度。该项目近期更 …
阅读更多以下是过去4小时内全球AI领域的重要动态: Andrej Karpathy 深入探讨离散文本扩散模型 Andrej Karpathy 分享了一篇关于简单文本(离散)扩散的短文,并对文本生成中的两种主要范式——扩散(迭代去噪)和自回归(从左到右生成)进行了深入比较。他指出,扩散模型在图像/视频生成中占据主导地位,而自回归在文本领域更为普遍。Karpathy 解释说,去除数学形式主义后,扩散模型本质上是一种带有双向注意力的 Transformer,通过迭代重新采样和遮蔽 tokens 来生成最终样本。尽管双向注意力在语言模型中更强大,但训练成本更高。他认为,这两种范式在 LLM 堆栈中仍有进一步融合和泛化的可能性。 Claude …
阅读更多AI模型真实加密货币交易表现揭示:DeepSeek稳健领先,GPT-5与Gemini表现不佳-歸藏(guizang.ai) 一项N of 1项目通过让六个顶级AI模型(DeepSeek Chat V3.1、Grok 4、Claude Sonnet 4.5、Qwen3 Max、GPT-5、Gemini 2.5 Pro)在真实加密货币市场进行自主交易,每个模型初始资金1万美元,揭示了它们在不确定性下的决策风格和交易能力。结果显示,DeepSeek Chat V3.1以+37.29%的收益率领跑,Grok 4紧随其后。DeepSeek采用数据驱动的技术派策略,保持稳健现金储备;Grok则通过分散投资降低风险。Qwen3 Max以20倍杠 …
阅读更多在过去四小时内,AI领域发生了多起引人注目的事件。一场大规模的AWS宕机影响了众多依赖云服务的AI及互联网工具。同时,AI模型在图像和视频生成方面取得了新进展,DeepSeek发布了高效的OCR模型,李飞飞团队也推出了实时视频生成的世界模型。 AWS大宕机影响全球互联网及AI服务-歸藏(guizang.ai) AWS近日发生大规模故障,导致全球半数互联网服务受到影响,包括Perplexity、Snapchat、Fortnite、Airtable、Canva、Slack等多款常用工具及部分AI服务瘫痪。此次事件凸显了云服务集中化带来的潜在风险,众多企业网站和应用因此受损。据后续消息,服务已陆续恢复,部分受影响的团队也结束了因故障造成的 …
阅读更多宇树发布 | Unitree H2 天命觉醒!-宝玉 宇树(Unitree)公司正式发布了其新款仿生人形机器人 Unitree H2。这款机器人高180厘米,重70公斤,旨在为用户提供安全友好的服务。H2的发布标志着宇树在人形机器人领域的又一重要进展,未来有望在各种场景中为人类提供协助,进一步推动仿生机器人技术的实用化和商业化。 \n\n Andrej Karpathy 澄清强化学习(RL)在AI发展中的关键作用-宝玉 知名AI专家 Andrej Karpathy 澄清了外界对他“唱衰强化学习(RL)”的误解,强调RL并非可替代的技术,而是通向通用人工智能(AGI)过程中不可或缺的“分层”之一。他将AI开发比作多层蛋糕,指出基础模 …
阅读更多