以下是过去4小时全球AI领域的关键动态: Hugging Face Inference Providers 支持 Qwen3-VL 视觉语言模型-merve Hugging Face的推理服务平台,由Novita Labs提供支持,现已集成并支持Qwen3-VL,一款前沿的视觉语言模型。该模型参数规模庞大,其中220亿为活跃参数,总参数量达2350亿,此次集成将极大便利研究人员和开发者体验和利用这款强大的多模态AI模型,进一步推动视觉-语言理解领域的发展。 GPT-5 在解决开放性数学问题上展现潜力-Sam Altman Sam Altman转发Sebastien Bubeck的观点指出,GPT-5在解决一些非核心的开放性数学问题方 …
阅读更多Meta 发布 32B 参数开源代码世界模型 (CWM)-宝玉 Meta AI 发布了全新的开源代码世界模型 (Code World Model, CWM),该模型拥有 32B 参数。与传统大语言模型不同,CWM 利用“世界模型”让 AI 智能体学会推理和规划,通过模拟代码执行的后果来提升代码生成能力。这使得模型能够理解代码运行时的动态世界,而非仅仅进行“代码模仿”。在多任务强化学习测试中,CWM 在 LiveCodeBench v5 上达到 67.6%,在 AIME24 上达到 76%,在 SweBench Verified 上通过推理扩展达到 65.8%,表现出色。 Google AI 提升 Gemini CLI/Code …
阅读更多阿里巴巴云栖大会发布Qwen3-Max与通义万相2.5等系列大模型-向阳乔木 阿里巴巴在云栖大会上集中发布了多款重磅AI模型,包括超万亿参数的旗舰模型Qwen3-Max,该模型在SWE-Bench编码测试中斩获69.6分,在数学基准AIME 25和HMMT测试中达到满分100分,被认为能力已接近Claude 4 Opus及GPT-5。同时,通义万相2.5 preview视频生成模型也正式亮相,支持5-10秒1080P音画一体视频,被评价为国产“Veo3”最强平替,在图片和视频生成领域达到国际顶级水平。此外,Qwen系列共发布了300多个不同规模模型,从0.5B到超万亿参数,旨在覆盖更广泛的应用场景。用户可在夸克造点和通义万相平台体 …
阅读更多可灵2.5 Turbo视频模型表现亮眼,有望辅助CG制作 - 歸藏(guizang.ai) 歸藏(guizang.ai)对可灵2.5 Turbo视频模型进行了测试,并将其与世界渲染大赛的顶级CG作品进行对比。测试结果显示,在特定场景下,AI视频的质量已能与CG相匹敌,例如在模拟汽车甩尾漂移等动态场景中,模型表现出卓越的还原能力和视觉效果。虽然AI视频距离完全替代CG仍有距离,但它已能在CG流程中承担动态预览和前期方案探索等部分,显著提高了工作效率和便利性。 传言:Gemini 3.0 Pro与Claude 4.5 Sonnet或本周发布 - 向阳乔木 有传言指出,谷歌的Gemini 3.0 Pro和Anthropic的Claude …
阅读更多阿里开源Qwen3-Omni:首个本地运行的全模态理解LLM - 歸藏(guizang.ai) 阿里巴巴近日开源了Qwen3-Omni,这是首个可本地运行的端到端全模态理解大型语言模型。该模型能够处理文本、图像、音频和视频输入,并支持文本和音频的流式输出,同时提升了音频和视频理解能力,且未牺牲单模态文本和图像的处理性能。Qwen3-Omni 基于MoE的Thinker–Talker设计,采用AuT预训练以获得强泛化表示,并通过多码本设计降低延迟,实现了低延迟流式传输和自然的轮流对话。 AI编程智能体进入“拨号上网”时代,基础设施面临巨大压力 - 宝玉 文章指出,当前的AI编程智能体(如Claude Code)在使用体验上正变得如 …
阅读更多今日全球AI领域的核心焦点是算力基础设施的军备竞赛。英伟达与OpenAI的千亿美元合作计划,旨在构建前所未有的10GW级别AI数据中心,这不仅是资本的豪赌,更是将算力定义为未来经济核心的明确信号。与此同时,苹果正通过操作系统层面的整合(如MCP协议),意图成为AI能力的“调度中心”,掌控终端入口。在模型层面,GPT-5的评测细节揭示了顶尖模型在解决复杂任务时的真实瓶颈,而百度、DeepSeek等则在垂直应用和模型优化上持续发力,显示出AI技术从通用能力向产业落地纵深发展的清晰趋势。 英伟达与OpenAI达成千亿美元战略合作,共建10GW超级AI数据中心 英伟达和OpenAI宣布建立战略合作伙伴关系,计划利用数百万块英伟达GPU, …
阅读更多DeepSeek V3.1 全新升级 → DeepSeek V3.1 Terminus 发布!-宝玉 DeepSeek 发布了 V3.1 Terminus 版本,这是 V3.1 的重要升级。新版本在语言流畅性上有了显著提升,有效减少了中英文混用和乱码问题。同时,**代码智能体(Code Agent)和搜索智能体(Search Agent)**的性能也得到了大幅加强,处理任务更加高效精准。经过多项权威基准测试,DeepSeek V3.1 Terminus 的输出更为稳定可靠。该模型支持App、网页和API,并且开源权重已在 Hugging Face 提供下载。 Anthropic 和 OpenAI 如何培养AI“同事”- …
阅读更多LongCat-Flash-Thinking:更智能推理,更低成本-clem 🤗 美团的LongCat-Flash-Thinking项目发布,该模型致力于实现更智能的推理和更低的成本。LongCat-Flash-Thinking在逻辑、数学和编码等关键领域展示了最先进的开源模型性能,预示着AI推理效率和能力的新进展。 AWS科学家:你的AI策略需要数学逻辑-Gary Marcus 一位AWS科学家强调,在制定AI策略时,数学逻辑的重要性不容忽视。该观点指出,将数学逻辑融入AI系统设计,对于提升模型的准确性、鲁棒性及可解释性至关重要,为AI未来发展奠定了更坚实的基础。 AI智能体的新突破:通过MBTI人格设定提升性能-宝玉 一项关 …
阅读更多以下是过去4小时全球AI领域的一些值得关注的进展: DecartAI 开源 Lucy Edit 视频模型-Emad DecartAI 公司已正式开源 Lucy Edit 模型,并发布了相关的技术报告。该模型是其“视频纳米香蕉(nano banana for video)”系列的首个产品,旨在推动视频生成和编辑技术的发展。此次开源将有助于研究人员和开发者社区进一步探索视频AI领域的创新应用和技术突破。 LumaLabsAI 推出 Ray3 AI 视频生成模型-Emad LumaLabsAI 推出了其新的AI视频生成模型 Ray3,并展示了通过该模型制作的AI视频。Ray3 代表了AI在视频创作领域的新进展,使用户能够更高效、更便捷地生 …
阅读更多OpenAI 发布专为编程优化的 GPT-5-Codex 模型-宝玉 OpenAI 正式推出 GPT-5-Codex,这是基于 GPT-5 进一步强化的编程优化模型。该模型在真实项目数据上进行训练,旨在提升软件开发效率,能够从零开始构建工程、添加功能、编写测试、调试及进行大规模代码重构。GPT-5-Codex 显著提升了代码审查能力,能够在软件上线前识别关键漏洞。目前,该模型已全面上线,成为云端任务和代码审查的默认选择,并可通过 Codex CLI 和 IDE 扩展在本地使用。 微软加入世界核能协会,押注核能为 AI 时代供电-Peter H. Diamandis, MD 微软成为首家加入世界核能协会的科技巨头,此举表明其正将赌注 …
阅读更多