以下是过去4小时全球AI领域的主要动态: Qwen 3 VL旗舰模型发布,性能爆表并支持百万级上下文长度 - orange.ai 阿里云近期发布了其新一代旗舰模型 Qwen 3 VL (Vision Language Model)。多位观察者指出,该模型在基准测试中表现出色,分数“爆表”,被形容为“怪物”。Qwen 3 VL采用Apache 2.0许可,并支持高达 100万 上下文长度,预示着其在多模态理解和长文本处理方面具备强大潜力。 OpenAI发布GPT-5-Codex,专为AI智能体和交互式编程优化 - 宝玉 OpenAI推出了 GPT-5-Codex,这是GPT-5的一个全新版本,专门针对AI智能体和交互式编程任务进行了深 …
阅读更多以下是过去4小时全球AI领域的重要动态: DeepMind联合创始人Demis Hassabis更新前沿AI安全框架-Demis Hassabis DeepMind联合创始人兼Google DeepMind CEO Demis Hassabis宣布,他们的“前沿安全框架”(Frontier Safety Framework)进行了重要更新。此次更新扩展了针对先进AI的风险领域,并精炼了评估协议。这表明业界对AI安全问题的重视程度持续提升,尤其是在AI模型能力日益强大的背景下,提前布局和完善风险管理机制成为关键。此举旨在确保AI技术在发展的同时,能够有效识别和规避潜在风险。 Chrome DevTools推出模型上下文协议(MCP), …
阅读更多可灵2.5 Turbo视频模型表现亮眼,有望辅助CG制作 - 歸藏(guizang.ai) 歸藏(guizang.ai)对可灵2.5 Turbo视频模型进行了测试,并将其与世界渲染大赛的顶级CG作品进行对比。测试结果显示,在特定场景下,AI视频的质量已能与CG相匹敌,例如在模拟汽车甩尾漂移等动态场景中,模型表现出卓越的还原能力和视觉效果。虽然AI视频距离完全替代CG仍有距离,但它已能在CG流程中承担动态预览和前期方案探索等部分,显著提高了工作效率和便利性。 传言:Gemini 3.0 Pro与Claude 4.5 Sonnet或本周发布 - 向阳乔木 有传言指出,谷歌的Gemini 3.0 Pro和Anthropic的Claude …
阅读更多Qwen3-Omni:新的SOTA多模态模型发布 - merve Qwen团队近期发布了Qwen3-Omni,一款全新的、具备“任意到任意”能力的SOTA(State-of-the-Art)多模态模型,并同步推出了两个演示和三款模型变体。Qwen3-Omni是一个30B MoE模型,具有3B的活跃参数,包含指令(instruct)、思考(thinking,用于推理)和字幕生成(captioner,用于稳健语音生成)三种版本。该模型能够理解图像、文本、音频和视频等多种模态,并可输出文本或语音,支持多达119种文本语言、19种语音输入语言以及10种语音输出语言。它同时支持Transformers和vLLM,并在多项视频和音频基准测试中 …
阅读更多Kimi 推出 Agent 会员服务,明确商业化路径-歸藏(guizang.ai) 中国AI助手Kimi近日正式上线了Agent会员服务,标志着其商业化进程的推进。服务分为多个等级,包括免费的Adagio(慢板)、中档的Andante(行板,49元/月)和Moderato(中速,99元/月)。Andante和Moderato等级提供更多的K2模型使用权限、深度研究额度及并发能力,并附赠等额API兑换券。海外市场还设有**Vivace(活泼,$199/月)**等级,享有高峰时段优先访问权。值得一提的是,Kimi对早期打赏用户提供了会员订阅时的全额返还或抵扣优惠,可直接转换成会员时长。尽管Agent功能付费,但Kimi的核心聊天服务依 …
阅读更多阿里开源Qwen3-Omni:首个本地运行的全模态理解LLM - 歸藏(guizang.ai) 阿里巴巴近日开源了Qwen3-Omni,这是首个可本地运行的端到端全模态理解大型语言模型。该模型能够处理文本、图像、音频和视频输入,并支持文本和音频的流式输出,同时提升了音频和视频理解能力,且未牺牲单模态文本和图像的处理性能。Qwen3-Omni 基于MoE的Thinker–Talker设计,采用AuT预训练以获得强泛化表示,并通过多码本设计降低延迟,实现了低延迟流式传输和自然的轮流对话。 AI编程智能体进入“拨号上网”时代,基础设施面临巨大压力 - 宝玉 文章指出,当前的AI编程智能体(如Claude Code)在使用体验上正变得如 …
阅读更多今日全球AI领域的核心焦点是算力基础设施的军备竞赛。英伟达与OpenAI的千亿美元合作计划,旨在构建前所未有的10GW级别AI数据中心,这不仅是资本的豪赌,更是将算力定义为未来经济核心的明确信号。与此同时,苹果正通过操作系统层面的整合(如MCP协议),意图成为AI能力的“调度中心”,掌控终端入口。在模型层面,GPT-5的评测细节揭示了顶尖模型在解决复杂任务时的真实瓶颈,而百度、DeepSeek等则在垂直应用和模型优化上持续发力,显示出AI技术从通用能力向产业落地纵深发展的清晰趋势。 英伟达与OpenAI达成千亿美元战略合作,共建10GW超级AI数据中心 英伟达和OpenAI宣布建立战略合作伙伴关系,计划利用数百万块英伟达GPU, …
阅读更多English Version News Discovery Time! Today we're going to explore… Bang! Pop! Wow! Amazing Moose Journey Across Europe!
Scientists have been tracking an incredible journey of a moose named Emil who has traveled through three different continents this summer! Emil started his adventure in the northern forests of …
阅读更多以下是过去4小时全球AI领域的重点新闻回顾: Meta Superintelligence Lab 开源 Meta Agents Research Environments (ARE) 平台-clem 🤗 Meta Superintelligence Lab已开源其 Meta Agents Research Environments (ARE) 平台。ARE旨在支持多模态大型语言模型(LLM)驱动的智能体研究,提供统一框架,用于开发、训练和评估能够通过观察、交互和学习来理解和导航复杂环境的具身智能体。此举有望降低研究门槛,加速AI智能体在各种模拟环境中的发展和应用,推动具身智能体技术的前沿突破。 IBM Granite …
阅读更多《通用智能体包含世界模型》论文提出AI智能体必须建立世界模型-宝玉 一篇新论文《通用智能体包含世界模型》通过严格数学证明,指出任何能有效完成复杂多步骤任务的智能体,都必然在内部学习并构建其所处世界的精确预测模型。这项研究挑战了长期以来“无模型”方法通向通用人工智能(AGI)的设想,表明AI智能体为了获得通用能力,会自发涌现出世界模型,而非必须显式编程。这一发现对AI的安全性和可解释性具有重大影响,意味着我们可以从强大的智能体行为中提取其隐藏的世界模型进行审查,为理解大语言模型(LLM)的“涌现能力”提供了理论解释,并可能统一AI研究领域。 阿里巴巴发布Qwen3-Omni,首个端到端全模态AI模型-clem 🤗 阿里巴巴重磅推 …
阅读更多