以下是过去4小时全球AI领域的最新动态: 阿里发布最强模型Qwen 3-MAX推理版,基准测试表现出色 - 歸藏(guizang.ai) 阿里巴巴近日发布了其最强模型 Qwen 3-MAX 的推理版本。该模型在包括 AIME 2025 和 HMMT 在内的挑战性推理基准测试中取得了 100% 的得分,展现了卓越的推理能力。此外,Qwen 3 Max 的“Thinking”版本也进行了更新,在测试中显示出更像 Claude 的对话风格,并且能够就阅读习惯等非宇宙或科技主题展开讨论,表明其在更广泛的领域具备出色的对话和理解能力。 深度分析:AI为何疯狂使用破折号?—— 19世纪旧书的“语法DNA” - 向阳乔木 一篇深入分析探讨了大 …
阅读更多关于大型语言模型(LLM)智能本质的持续辩论 - Gary Marcus 人工智能领域著名批评家Gary Marcus转发推文指出,关于大型语言模型(LLM)并非且永远不会拥有真正智能的基本概念,仍然未能被广泛理解和接受。这反映出学术界和公众对于LLM能力和局限性的认知存在差异,持续的讨论围绕LLM是否仅是高级模式匹配工具,而非具备人类水平理解或推理能力的真实智能体。 对OpenAI早期融资策略及其地缘政治影响的担忧 - Gary Marcus Gary Marcus转发了一条推文,内容提及OpenAI领导层曾认真考虑通过向俄罗斯出售通用人工智能(AGI)来为其发展筹集资金。这一披露引发了关于AI开发伦理、地缘政治风险以及AGI治 …
阅读更多学生利用LLM撰写关于生成式AI的深刻书籍-Gary Marcus Gary Marcus指出,一名学生借助大型语言模型(LLM)撰写了一本关于生成式AI的深刻书籍,其内容比主流媒体的报道更具洞察力。该书的结论强调,公众作为知情的公民和消费者,必须要求科技公司和政策制定者提高透明度和问责制,并倡导保护人权、促进机会的政策,确保AI惠及所有人,而非少数特权阶层。 HuggingFace发布200余页LLM训练资源指南-clem 🤗 HuggingFace发布了一份长达200多页的详尽资源指南,全面覆盖了从零开始训练大型语言模型(LLMs)的整个过程。这份资源被业内人士评价为“精美”,它深入探讨了LLM训练的完整流程,为AI开发者和研 …
阅读更多OpenAI 创始人 Ilya 在证词中爆料:曾与 Anthropic 密谈合并,内部纷争不断-宝玉 OpenAI联合创始人兼前首席科学家伊尔亚·苏茨克维(Ilya Sutskever)的证词揭露了一段陈年往事:早在两年前,OpenAI董事会解雇Sam Altman后,其竞争对手Anthropic公司曾对与OpenAI合并表示“兴奋”。证词显示,如果这笔交易当时真的达成,Anthropic的CEO达里奥·阿莫迪(Dario Amodei)当时很有可能会反过来执掌OpenAI。这一爆料不仅揭示了OpenAI内部持续存在的权力斗争,也暗示了行业巨头之间在关键时期曾考虑大规模整合的可能性。 Is it just me, or does …
阅读更多沙特阿拉伯在FII9峰会推出SAGE人工智能计划 - Peter H. Diamandis, MD 在FII9峰会上,彼得·戴曼迪斯(Peter Diamandis)与伊玛德·莫斯塔克(Emad Mostaque)共同揭示了沙特阿拉伯向世界献礼的创新项目——SAGE。SAGE被定位为一个前沿的人工智能平台,旨在推动全球AI生态系统的发展。此举表明沙特阿拉伯正积极投资并参与到全球AI领域的基础设施建设和技术创新中,有望在全球人工智能格局中扮演日益重要的角色。 \n\n Baseten Training 正式发布,提供高级模型训练服务 - sarah guo 经过数月收集早期客户反馈并完成数千项任务后,Baseten正式宣布推出 …
阅读更多以下是过去4小时内全球AI领域的重要动态: OpenAI发布开源安全推理模型gpt-oss-safeguard - clem 🤗 OpenAI已发布gpt-oss-safeguard,这是一个处于研究预览阶段的开源安全推理模型,旨在用于内容分类和审核。该模型提供120B和20B两个版本,其核心特点是采用推理而非记忆的方式,能够直接读取并遵循开发者自定义的安全政策进行判断。这意味着开发者无需重新训练模型即可修改政策,模型能够输出其推理过程,且不同产品和场景可以灵活定制政策。性能评估显示,gpt-oss-safeguard在同时执行多项政策时,准确率优于GPT-5-thinking及其他gpt-oss模型,标志着内容安全从“被动学习规 …
阅读更多OpenAI 完成营利性资本重组,微软延长IP权益至2032年-宝玉 OpenAI 宣布已完成复杂的资本重组,正式将公司架构调整为由一个非营利基金会控制的“公益公司”性质的营利性实体 OpenAI Group。基金会将持有营利公司26%的股份,并负责任命董事会。作为早期投资者,微软将持有约27%的股份,目前公司估值约1350亿美元。此次重组使得微软对 OpenAI 模型知识产权的权益延长至2032年,并规定若实现通用人工智能 (AGI),需提交独立专家小组验证。此举旨在平衡AI技术发展与公共利益,并得到加州和特拉华州总检察长的放行,但附加了需持续减轻AI对青少年风险的条件。 \n\n NVIDIA 发布新版开放数据集和OCR工具, …
阅读更多以下是过去四小时全球AI领域的一些重要动态: 对家庭机器人5倍生产力提升的怀疑-Gary Marcus 知名AI怀疑论者Gary Marcus对一个旨在实现家庭机器人5倍生产力提升的演示表达了强烈的怀疑。他个人认为,该演示在实现这一宏大目标上的贡献度“不足1%”。这一评论反映了AI和机器人技术领域内部对于当前进步的实际效用和长远前景的持续争论,质疑了某些演示可能带来的过度乐观情绪,并强调了实际应用落地的复杂性。 AI提升知识获取却导致架构师更稀缺-宝玉 有观点指出,尽管AI技术能够使架构知识更容易获取和学习,但最终结果可能是架构师这一职位变得更加稀缺。作者认为,一个行业专家数量的增减,并非取决于知识获取的难易,而是由“清晰的成长路 …
阅读更多ListenHub 发布全新编辑模式,赋能 AI 播客和多人语音配音内容创作-Orange AI ListenHub 近期推出了全新的编辑模式,旨在简化 AI 生成音频内容的编辑流程,让用户像使用 Word 一样轻松编辑 AI 播客。此模式解决了此前 AI 生成语音内容难以修改的痛点,允许用户像导演选角一样为播客设定多个角色并指定声音,还能像作家一样灵活地插入或删除内容。此外,该功能也支持完全可控的多人语音配音,甚至可以用于制作多人有声书,致力于在 AI 功能和传统编辑器之间找到平衡,提供既简单又可控的创作体验。 AI Coding/Codex 实践技巧:利用 AI 自我日志调试-宝玉 分享了一项实用的 AI 编码/Codex 实 …
阅读更多《基于大语言模型的Vibe Coding综述》发布,探讨AI编程新范式-宝玉 中科院、杜克大学等机构联合发布了《基于大语言模型的Vibe Coding综述》,将Vibe Coding定义为人类开发者、软件项目和编程智能体之间的“三方关系”。论文指出,经验丰富的开发者在使用高级AI工具时,任务完成时间反而可能增加19%,这主要归因于上下文工程、反馈循环和基础设施等方面的挑战。文章还提出了五种Vibe Coding开发模式,并强调开发者应将AI智能体视为员工而非工具,其核心工作将转向意图阐述、上下文管理、系统级调试、架构监督及质量验证。Vibe Coding的推广也带来代码可靠性、安全、大规模监管以及教育体系脱节等深远挑战。 AI生成 …
阅读更多