2025.10.10.04 过去4小时全球AI发生了什么?
Radical Numerics发布RND1,最强大的扩散语言模型 Radical Numerics公司推出了RND1,声称这是迄今为止最强大的基础扩散语言模型(DLM)。该模型旨在推动AI在语言理解和生成领域的最新进展,可能为内容创作、代码生成及其他AI应用带来新的可能性。
Emad M.呼吁社会核心模型全面开放与合成化 Emad M.强调,驱动社会运行的模型需要实现完全开放,包括数据和权重。他指出,这些模型应趋向于完全合成和聚焦,并透露其团队正致力于政府、金融和健康领域的开放模型开发,预计很快将有更多公告发布。
Gary Marcus批判AI炒作及大模型局限性 AI研究员Gary Marcus对当前AI领域的过度炒作表示担忧,指出真正的突破如AlphaGo和AlphaFold是精心设计的解决方案,而非纯粹的大语言模型(LLM)。他批评了像Figure 03这样通过华丽视频宣传短期内无法实现的产品的行为,并警告Excel中的Copilot可能引发全球金融危机,同时指出Claude等模型存在“虚构”历史和“编造”答案的问题。
serenaa_ge完成1750万美元融资 serenaa_ge公司宣布成功完成1750万美元的融资,其中包括一笔由Chemistry领投的1500万美元A轮融资,以及一笔270万美元的种子轮融资。尽管具体业务细节未完全披露,但考虑到Amjad Masad的转发,这很可能是一家在AI或相关技术领域取得进展的公司。
Anthropic AI与英美机构合作研究恶意文档漏洞 Anthropic AI联合英国AI安全研究所(@AISecurityInst)和图灵研究所(@turinginst)发布了最新研究。研究发现,即使是少量恶意文档也可能对AI系统产生严重影响,这突显了在AI训练数据中识别和缓解安全漏洞的重要性。
AmpCode和FactoryAI在开发者工具追踪榜单中快速崛起 AI开发者工具领域出现两颗新星,AmpCode和FactoryAI在短短三周内跃居追踪榜单的前两位。这表明两家公司在AI工具和自动化领域可能取得了显著的用户增长或技术突破,引发了行业关注。
小型模型(7M参数)通过迭代细化实现与大型模型竞争 一篇最新论文引发了广泛关注,展示了一个仅有700万参数(7M!)的“小”模型,能够通过16步迭代细化其答案和推理轨迹,从而与许多规模大得多的模型竞争。这一突破预示着模型效率和性能之间可能存在新的平衡点。
Hugging Face Hub更新:支持自定义应用、GGUF元数据编辑和组织搜索 Hugging Face Hub团队近期推出了一系列更新。用户现在可以在Spaces上创建带有自定义域名的应用,编辑GGUF模型的元数据,并且在Hugging Face Papers平台上可以搜索组织并查看其所有相关论文,极大地提升了平台的功能性和用户体验。
Google Gemini月访问量首次突破10亿 根据Similarweb的数据,Google Gemini在2025年9月的访问量达到了10.57亿次,首次突破了10亿大关。这是Gemini连续第九个月实现访问量增长,标志着其在大语言模型市场中用户基础的显著扩张。
Google推出企业级AI新功能,强化上下文数据应用 Google正在推出一系列新的企业级功能,旨在帮助组织和用户更好地利用与自身业务和上下文相关的宝贵数据。这些新功能将提升AI模型在特定业务场景下的实用性和准确性,为企业客户带来更强大的定制化AI解决方案。
LlamaIndex与LangChain探讨AI智能体及工作流构建 LlamaIndex的Jerry Liu表示,比起低代码/无代码可视化工作流工具,他更看好基于代码的编排(code-based orchestration)结合代码智能体(coding agents)的未来。他认为,虽然可视化工具如OpenAI的AgentKit能快速构建简单流程,但在定制复杂逻辑和长期运行智能体时,代码仍是提供最大灵活性的最佳选择。LlamaIndex专注于构建围绕用户数据的高级智能体,并通过LlamaAgents的Alpha版本实现代码工作流的一键部署。LangChain的Harrison Chase也持类似观点,解释LangChain未开发可视化工具的原因是它们对非技术用户而言仍不够简单,且在复杂任务中难以扩展。LangChain倾向于通过LangGraph解决高复杂度问题,并看好未来无代码智能体和AI生成代码的能力。
Peter Diamandis与Emad讨论AI操作系统之争 Peter H. Diamandis在最新一期节目中与Emad M.探讨了“谁将拥有人类的操作系统”这一核心问题。讨论涵盖了OpenAI如何将应用程序、用户和屏幕连接起来,以及Grok如何以追求真相、快速、未经过滤的现实进行反击。节目还涉及了超智能化的六个月临界点、Anthropic的近乎超人AI智能体、Sam Altman的AMD巨额交易与全球数据中心布局,以及特斯拉FSD 14.1和具身AGI的兴起。