阿里开源Qwen3-Omni:首个本地运行的全模态理解LLM - 歸藏(guizang.ai) 阿里巴巴近日开源了Qwen3-Omni,这是首个可本地运行的端到端全模态理解大型语言模型。该模型能够处理文本、图像、音频和视频输入,并支持文本和音频的流式输出,同时提升了音频和视频理解能力,且未牺牲单模态文本和图像的处理性能。Qwen3-Omni 基于MoE的Thinker–Talker设计,采用AuT预训练以获得强泛化表示,并通过多码本设计降低延迟,实现了低延迟流式传输和自然的轮流对话。 AI编程智能体进入“拨号上网”时代,基础设施面临巨大压力 - 宝玉 文章指出,当前的AI编程智能体(如Claude Code)在使用体验上正变得如 …
阅读更多今日全球AI领域的核心焦点是算力基础设施的军备竞赛。英伟达与OpenAI的千亿美元合作计划,旨在构建前所未有的10GW级别AI数据中心,这不仅是资本的豪赌,更是将算力定义为未来经济核心的明确信号。与此同时,苹果正通过操作系统层面的整合(如MCP协议),意图成为AI能力的“调度中心”,掌控终端入口。在模型层面,GPT-5的评测细节揭示了顶尖模型在解决复杂任务时的真实瓶颈,而百度、DeepSeek等则在垂直应用和模型优化上持续发力,显示出AI技术从通用能力向产业落地纵深发展的清晰趋势。 英伟达与OpenAI达成千亿美元战略合作,共建10GW超级AI数据中心 英伟达和OpenAI宣布建立战略合作伙伴关系,计划利用数百万块英伟达GPU, …
阅读更多DeepSeek V3.1 全新升级 → DeepSeek V3.1 Terminus 发布!-宝玉 DeepSeek 发布了 V3.1 Terminus 版本,这是 V3.1 的重要升级。新版本在语言流畅性上有了显著提升,有效减少了中英文混用和乱码问题。同时,**代码智能体(Code Agent)和搜索智能体(Search Agent)**的性能也得到了大幅加强,处理任务更加高效精准。经过多项权威基准测试,DeepSeek V3.1 Terminus 的输出更为稳定可靠。该模型支持App、网页和API,并且开源权重已在 Hugging Face 提供下载。 Anthropic 和 OpenAI 如何培养AI“同事”- …
阅读更多LongCat-Flash-Thinking:更智能推理,更低成本-clem 🤗 美团的LongCat-Flash-Thinking项目发布,该模型致力于实现更智能的推理和更低的成本。LongCat-Flash-Thinking在逻辑、数学和编码等关键领域展示了最先进的开源模型性能,预示着AI推理效率和能力的新进展。 AWS科学家:你的AI策略需要数学逻辑-Gary Marcus 一位AWS科学家强调,在制定AI策略时,数学逻辑的重要性不容忽视。该观点指出,将数学逻辑融入AI系统设计,对于提升模型的准确性、鲁棒性及可解释性至关重要,为AI未来发展奠定了更坚实的基础。 AI智能体的新突破:通过MBTI人格设定提升性能-宝玉 一项关 …
阅读更多以下是过去4小时全球AI领域的一些值得关注的进展: DecartAI 开源 Lucy Edit 视频模型-Emad DecartAI 公司已正式开源 Lucy Edit 模型,并发布了相关的技术报告。该模型是其“视频纳米香蕉(nano banana for video)”系列的首个产品,旨在推动视频生成和编辑技术的发展。此次开源将有助于研究人员和开发者社区进一步探索视频AI领域的创新应用和技术突破。 LumaLabsAI 推出 Ray3 AI 视频生成模型-Emad LumaLabsAI 推出了其新的AI视频生成模型 Ray3,并展示了通过该模型制作的AI视频。Ray3 代表了AI在视频创作领域的新进展,使用户能够更高效、更便捷地生 …
阅读更多OpenAI 发布专为编程优化的 GPT-5-Codex 模型-宝玉 OpenAI 正式推出 GPT-5-Codex,这是基于 GPT-5 进一步强化的编程优化模型。该模型在真实项目数据上进行训练,旨在提升软件开发效率,能够从零开始构建工程、添加功能、编写测试、调试及进行大规模代码重构。GPT-5-Codex 显著提升了代码审查能力,能够在软件上线前识别关键漏洞。目前,该模型已全面上线,成为云端任务和代码审查的默认选择,并可通过 Codex CLI 和 IDE 扩展在本地使用。 微软加入世界核能协会,押注核能为 AI 时代供电-Peter H. Diamandis, MD 微软成为首家加入世界核能协会的科技巨头,此举表明其正将赌注 …
阅读更多火山引擎免费开放顶级Seedream 4.0生图模型,API支持4K与去水印-向阳乔木 火山引擎现已免费开放其顶级Seedream 4.0生图模型,用户无需API或积分即可使用。该模型在架构上与Nano Banana类似,具备4K高清图片生成能力,并提供出色的中文支持。Seedream 4.0被认为具有巨大潜力,在多个场景下表现不俗。最值得关注的是,火山引擎还支持API接入,允许用户直接生成4K图片并去除水印,预计将催生大量基于此模型的AI原生产品。该模型已通过多种案例展示其强大的图像生成能力,包括设计乐队海报、可视化解数学题、生成衍纸艺术绘本、模拟烹饪过程、创建Q版玩偶蓝图以及生成表情包和手办。 Claude AI助手上 …
阅读更多向阳乔木用油猴脚本增强飞书文档AI功能-向阳乔木 用户“向阳乔木”分享了如何通过油猴脚本(Tampermonkey script)来增强飞书文档的功能,使其成为更强大的主力笔记工具。这项改进在工具栏中集成了AI对话、复制和谷歌搜索等功能,显著提升了飞书文档在内容创作和信息检索方面的效率。这一举措旨在优化用户体验,让飞书文档在与iOS备忘录共同使用时,发挥更全面的作用。 AI预训练数据“数据墙”被质疑:FinePDFs发布3T新文本数据-merve 有观点认为AI预训练已达到“数据墙”瓶颈,甚至“预训练已死”。然而,最新发布的研究表明情况并非如此。一项名为“FinePDFs”的新数据集已被公布,该数据集包含了3万亿(3T)新文 …
阅读更多今日全球AI领域的核心焦点在于模型的 “专精化” 与 “安全性”。大型科技公司正从追求通用大模型的竞赛,转向开发面向特定行业、解决具体问题的垂直模型,例如专用于安全代码生成的CodeGuardian。与此同时,数据隐私问题催生了如“联邦微调”这样的开源新框架,旨在解决企业在应用AI时的合规难题。这些趋势共同表明,AI技术正在告别单纯的性能比拼,迈向与实体经济深度融合、解决实际业务痛点、并构建可信基础设施的全新阶段。 Nexus AI发布CodeGuardian-8B:专为企业级安全代码生成而生 Nexus AI公司今日正式发布其最新模型CodeGuardian-8B。该模型是一个参数量为80亿的“小模型”,但其训练数据完全聚焦于经过 …
阅读更多今日的AI领域展现出从技术突破向产业纵深发展的清晰脉络。一方面,基础大模型的竞争焦点正从单纯的参数规模转向能效比与特定任务的优化,新一代代码生成模型的问世预示着AI在软件工程领域的应用将更加成熟。另一方面,金融等强监管行业正积极拥抱AI,通过制定标准与合作项目来探索其在合规与风控中的应用潜力。与之配套的硬件创新和开源生态的安全建设也在同步加速,共同构建一个更高效、更可信、更易于商业化落地的AI生态系统。 Nexus AI发布新一代代码生成模型“Odyssey-Coder”,据称在多项基准测试中超越GPT-5 备受瞩目的AI初创公司Nexus AI正式发布其最新的代码生成大模型Odyssey-Coder。该模型拥有700亿参数,但在架 …
阅读更多