以下是过去4小时全球AI领域发生的一些重要事件和动态: Ling Flash 论文在 Hugging Face Papers 上线 - clem 🤗 Ling Flash 论文现已在 Hugging Face Papers 平台发布。用户可以通过该平台查阅论文详情,并有机会与作者进行在线交流,深入了解这项新的AI研究成果。 QeRL:量化增强强化学习项目开源,支持32B LLM训练 - clem 🤗 QeRL(Quantization-enhanced Reinforcement Learning,量化增强强化学习)项目已正式开源。该技术支持4-bit量化强化学习训练,显著降低了硬件要求,例如,能够仅使用两块A6000 GPU就训练 …
阅读更多Tahoe Bio发布并开源30亿参数生物AI模型Tahoe-x1 - 小互 美国生命科学公司Tahoe Bio发布了30亿参数AI模型 Tahoe-x1 (Tx1),旨在理解基因、细胞和药物之间的复杂关系,标志着AI正式进入细胞与生命系统建模阶段。该模型能够像ChatGPT理解人类语言一样“学习生物学的语言”,预测关键基因、识别癌症信号通路、并进行零样本药物反应预测,为虚拟临床试验开辟了可能性。Tx1在DepMap和MSigDB数据集上表现超越现有模型。此外,Tahoe团队已将其完全开源,公开模型权重、训练与评估代码、实验流程及一个Hugging Face互动工具,允许用户上传单细胞数据生成嵌入可视化。 MiniMax发布新模 …
阅读更多过去4小时全球AI要闻速览: AI驱动的全栈开发与部署平台迎来突破 - Emad & 小互 AI工具在全栈开发和产品部署领域取得显著进展。II-Agent 宣布支持通过单个提示词构建全栈网站并交付可编辑幻灯片,同时能调用 OpenAI Codex 处理复杂代码。另一方面,Bolt new 发布 V2 版本,深度集成了所有后端服务,包括服务器托管、数据库、API、支付和认证,使用户能够从零开始快速构建和上线完整产品。该平台提供可扩展的云端后端,支持百万级用户规模,并实现自动部署、调试和资源分配。它集成了 Claude Code、Cody、Codex 等顶级AI编码代理,内置深度规划功能,并能进行完全自主的调试,将错误率降低98%。这 …
阅读更多DeepSeek发布实验性模型V3.2-Exp,大幅提升长文本推理效率并降低成本-小互 DeepSeek发布了其最新实验性语言模型 DeepSeek-V3.2-Exp,该模型在推理效率和计算成本方面实现了显著提升。V3.2-Exp在整体性能上与V3.1-Terminus持平,但长文本推理效率提高了约一倍,使得其 API价格大幅下降50%。这一突破主要得益于其引入的 稀疏注意力(DSA)机制,该机制能够智能地聚焦文本中的关键部分,从而在不影响输出质量的前提下,显著加快处理速度并减少显存占用,特别适合处理 超过32K tokens 的长文档和对话场景。 Merve Noyan公开分享多模态AI幻灯片,涵盖趋势、模型与工具-merve …
阅读更多以下是过去4小时全球AI领域的最新动态: Factory AI 推出免费代币及创新编码工作流-Ben Tossell AI编码工具Factory AI正在积极推广其平台,用户可获得4000万免费代币。同时,有用户分享了使用Factory AI进行复杂代码重构的工作流,强调通过“spec mode”实现高效实施。该平台还曾举办“Factory Founders:AI编码的未来”线上活动,展示其在AI辅助开发领域的进展和潜力,旨在提升开发者利用AI进行软件开发的能力。 vLLM 正式支持小红书 hi lab 的多语言 OCR 模型 dots.ocr-merve vLLM项目宣布其最新版本正式支持小红书 hi lab 开发的强大多语言光学 …
阅读更多以下是过去4小时全球AI领域的一些主要动态: FactoryAI Droids在Terminal Bench基准测试中排名第一-Nathan Lands \n\n FactoryAI宣布推出其最新的Droids编码代理,并在Terminal Bench基准测试中超越Claude Code,位居第一。该代理被多位用户誉为现有编码AI的“类固醇升级版”,可作为Claude AI代码的即时替代品,并据称运行在GPT-5-Codex上。有评论指出,一个仅由四名研究工程师组成的团队,在创建最佳编码代理方面,超越了OpenAI和Anthropic等百亿美元级别的大型实验室,其性能甚至被认为优于Cursor,标志着编码AI领域的新突破。 \n\n …
阅读更多以下是过去4小时全球AI领域的重要动态: DeepMind联合创始人Demis Hassabis更新前沿AI安全框架-Demis Hassabis DeepMind联合创始人兼Google DeepMind CEO Demis Hassabis宣布,他们的“前沿安全框架”(Frontier Safety Framework)进行了重要更新。此次更新扩展了针对先进AI的风险领域,并精炼了评估协议。这表明业界对AI安全问题的重视程度持续提升,尤其是在AI模型能力日益强大的背景下,提前布局和完善风险管理机制成为关键。此举旨在确保AI技术在发展的同时,能够有效识别和规避潜在风险。 Chrome DevTools推出模型上下文协议(MCP), …
阅读更多以下是过去4小时全球AI领域的重点新闻回顾: Meta Superintelligence Lab 开源 Meta Agents Research Environments (ARE) 平台-clem 🤗 Meta Superintelligence Lab已开源其 Meta Agents Research Environments (ARE) 平台。ARE旨在支持多模态大型语言模型(LLM)驱动的智能体研究,提供统一框架,用于开发、训练和评估能够通过观察、交互和学习来理解和导航复杂环境的具身智能体。此举有望降低研究门槛,加速AI智能体在各种模拟环境中的发展和应用,推动具身智能体技术的前沿突破。 IBM Granite …
阅读更多以下是过去4小时全球AI领域的一些重要动态: Google AI 端侧模型体验应用上线 Google Play - 歸藏(guizang.ai) 谷歌已将其端侧模型体验应用“Google AI Edge Gallery”上架 Google Play 商店。用户现在可以直接搜索并安装此应用,其中集成了谷歌所有的 Gemma 端侧模型。该应用支持多种功能,包括图像识别、音频对话以及常规的文字对话,旨在为用户提供便捷的本地AI模型体验。 Anthropic 发布《如何为 Agent 构建工具》新文章 - 歸藏(guizang.ai) Anthropic 发布了一篇关于“如何为 Agent 构建工具”的新文章,强调了 Agent 工具设计需 …
阅读更多大型AI实验室发布多款开源模型:苹果、OpenGVLab和微软贡献突出-merve 过去一周,多个主要AI实验室发布了重要的开源模型。苹果公司推出了FastVLM和MobileCLIP2,这些设备端视觉语言模型(VLM)在HuggingFace上发布,性能卓越:比现有方案快85倍,体积小3.4倍,支持在浏览器本地实现实时视频字幕。OpenGVLab发布了InternVL3.5,包含32个新的视觉语言模型,其中一个基于gpt-oss。此外,微软也发布了一款高效的小型文本转语音(TTS)模型。这些发布共同推动了设备端AI和多模态理解技术的发展。 HuggingFace平台新增医疗AI基准HealthBench与合成问答数据集-clem …
阅读更多