阿里巴巴云栖大会发布Qwen3-Max与通义万相2.5等系列大模型-向阳乔木 阿里巴巴在云栖大会上集中发布了多款重磅AI模型,包括超万亿参数的旗舰模型Qwen3-Max,该模型在SWE-Bench编码测试中斩获69.6分,在数学基准AIME 25和HMMT测试中达到满分100分,被认为能力已接近Claude 4 Opus及GPT-5。同时,通义万相2.5 preview视频生成模型也正式亮相,支持5-10秒1080P音画一体视频,被评价为国产“Veo3”最强平替,在图片和视频生成领域达到国际顶级水平。此外,Qwen系列共发布了300多个不同规模模型,从0.5B到超万亿参数,旨在覆盖更广泛的应用场景。用户可在夸克造点和通义万相平台体 …
阅读更多以下是过去4小时全球AI领域的重要动态: DeepMind联合创始人Demis Hassabis更新前沿AI安全框架-Demis Hassabis DeepMind联合创始人兼Google DeepMind CEO Demis Hassabis宣布,他们的“前沿安全框架”(Frontier Safety Framework)进行了重要更新。此次更新扩展了针对先进AI的风险领域,并精炼了评估协议。这表明业界对AI安全问题的重视程度持续提升,尤其是在AI模型能力日益强大的背景下,提前布局和完善风险管理机制成为关键。此举旨在确保AI技术在发展的同时,能够有效识别和规避潜在风险。 Chrome DevTools推出模型上下文协议(MCP), …
阅读更多可灵2.5 Turbo视频模型表现亮眼,有望辅助CG制作 - 歸藏(guizang.ai) 歸藏(guizang.ai)对可灵2.5 Turbo视频模型进行了测试,并将其与世界渲染大赛的顶级CG作品进行对比。测试结果显示,在特定场景下,AI视频的质量已能与CG相匹敌,例如在模拟汽车甩尾漂移等动态场景中,模型表现出卓越的还原能力和视觉效果。虽然AI视频距离完全替代CG仍有距离,但它已能在CG流程中承担动态预览和前期方案探索等部分,显著提高了工作效率和便利性。 传言:Gemini 3.0 Pro与Claude 4.5 Sonnet或本周发布 - 向阳乔木 有传言指出,谷歌的Gemini 3.0 Pro和Anthropic的Claude …
阅读更多阿里开源Qwen3-Omni:首个本地运行的全模态理解LLM - 歸藏(guizang.ai) 阿里巴巴近日开源了Qwen3-Omni,这是首个可本地运行的端到端全模态理解大型语言模型。该模型能够处理文本、图像、音频和视频输入,并支持文本和音频的流式输出,同时提升了音频和视频理解能力,且未牺牲单模态文本和图像的处理性能。Qwen3-Omni 基于MoE的Thinker–Talker设计,采用AuT预训练以获得强泛化表示,并通过多码本设计降低延迟,实现了低延迟流式传输和自然的轮流对话。 AI编程智能体进入“拨号上网”时代,基础设施面临巨大压力 - 宝玉 文章指出,当前的AI编程智能体(如Claude Code)在使用体验上正变得如 …
阅读更多以下是过去4小时全球AI领域的重点新闻回顾: Meta Superintelligence Lab 开源 Meta Agents Research Environments (ARE) 平台-clem 🤗 Meta Superintelligence Lab已开源其 Meta Agents Research Environments (ARE) 平台。ARE旨在支持多模态大型语言模型(LLM)驱动的智能体研究,提供统一框架,用于开发、训练和评估能够通过观察、交互和学习来理解和导航复杂环境的具身智能体。此举有望降低研究门槛,加速AI智能体在各种模拟环境中的发展和应用,推动具身智能体技术的前沿突破。 IBM Granite …
阅读更多DeepSeek V3.1 全新升级 → DeepSeek V3.1 Terminus 发布!-宝玉 DeepSeek 发布了 V3.1 Terminus 版本,这是 V3.1 的重要升级。新版本在语言流畅性上有了显著提升,有效减少了中英文混用和乱码问题。同时,**代码智能体(Code Agent)和搜索智能体(Search Agent)**的性能也得到了大幅加强,处理任务更加高效精准。经过多项权威基准测试,DeepSeek V3.1 Terminus 的输出更为稳定可靠。该模型支持App、网页和API,并且开源权重已在 Hugging Face 提供下载。 Anthropic 和 OpenAI 如何培养AI“同事”- …
阅读更多LongCat-Flash-Thinking:更智能推理,更低成本-clem 🤗 美团的LongCat-Flash-Thinking项目发布,该模型致力于实现更智能的推理和更低的成本。LongCat-Flash-Thinking在逻辑、数学和编码等关键领域展示了最先进的开源模型性能,预示着AI推理效率和能力的新进展。 AWS科学家:你的AI策略需要数学逻辑-Gary Marcus 一位AWS科学家强调,在制定AI策略时,数学逻辑的重要性不容忽视。该观点指出,将数学逻辑融入AI系统设计,对于提升模型的准确性、鲁棒性及可解释性至关重要,为AI未来发展奠定了更坚实的基础。 AI智能体的新突破:通过MBTI人格设定提升性能-宝玉 一项关 …
阅读更多AI的真实影响:高手更强,新人难借力-宝玉 一篇深入分析AI对程序员影响的文章指出,AI并非如预期般助力新人,反而让资深工程师如虎添翼。AI擅长快速生成样板代码、自动化重复任务及原型开发,但在代码审查、架构设计、代码质量和安全性方面的不足,意味着仍需资深人类工程师的指导和修正。文章强调,高质量的AI提示词需要深刻理解业务,AI的不可控性也增加了风险,导致“新人+AI”模式可能埋下隐患。结论是AI目前尚未民主化编程,反而集中了能力给资深专家,呼吁重新校准对AI短期影响的期待。 AI是否是泡沫?专家:尚未形成,但需警惕未来风险-向阳乔木 对AI行业是否为泡沫的分析指出,当前AI仍处于“需求驱动、资本密集型繁荣期”,尚未形成泡沫。主要依 …
阅读更多Claude Code 小工具发布,Mac用户终端操作更便捷-orange.ai 一款名为“cd to. app”的Mac系统小工具被推出,旨在简化在Finder中切换目录并启动终端的流程。该工具通过在Finder工具栏上添加一个按钮,允许用户一键在当前文件夹中启动终端,极大地提升了Claude Code作为编程软件和通用Agent的易用性。通过此集成,用户可以更便捷地利用Claude Code对文件系统进行各类操作,如总结、查找和分析,有效解决了Mac终端中繁琐的cd命令操作问题,使得AI辅助工作流更加顺畅高效。 谷歌发布深度研究论文:通过迭代检索与修订提升研究报告质量-歸藏(guizang.ai) 谷歌近日发布了一项开创性的深 …
阅读更多过去4小时全球AI动态一览 AI编码助手Codex导致用户代码丢失,凸显使用风险-宝玉 一位用户分享了使用AI编码助手Codex时遭遇的代码丢失经历。在对文件进行修改时,因操作失误和对AI指令的表述不清,导致Codex执行了超出预期的“回滚”操作,直接将文件B恢复到上次Git提交状态,从而抹去了数小时的开发成果。此次事件强调了在使用AI工具进行代码修改时,及时提交版本控制的重要性,以及清晰准确地向AI传达指令的必要性,以避免潜在的数据损失风险。 扎克伯格揭秘Meta AI团队建设理念:小而精锐,高算力投入-宝玉 马克·扎克伯格在近期访谈中阐述了Meta构建AI顶尖团队的独特策略。他指出,与大型研发部门不同,大语言模型开发更适合“小 …
阅读更多