Radical Numerics发布RND1,最强大的扩散语言模型 Radical Numerics公司推出了RND1,声称这是迄今为止最强大的基础扩散语言模型(DLM)。该模型旨在推动AI在语言理解和生成领域的最新进展,可能为内容创作、代码生成及其他AI应用带来新的可能性。 Emad M.呼吁社会核心模型全面开放与合成化 Emad M.强调,驱动社会运行的模型需要实现完全开放,包括数据和权重。他指出,这些模型应趋向于完全合成和聚焦,并透露其团队正致力于政府、金融和健康领域的开放模型开发,预计很快将有更多公告发布。 Gary Marcus批判AI炒作及大模型局限性 AI研究员Gary Marcus对当前AI领域的过度炒作表示担忧, …
阅读更多Gary Marcus 对Sora 2能力提出质疑及能源消耗担忧-Gary Marcus 知名AI研究者Gary Marcus对OpenAI的Sora 2模型表达了多方面质疑。他认为,尽管投入了巨量计算资源,Sora 2仍未能展现通用人工智能(AGI)的能力。Marcus指出,Sora 2在应对新颖、富有挑战性的提示词时,常出现物理法则和组合性方面的错误,并提供了“驴子骑贝斯手”等复杂场景下的失败案例(如物体消失或出现“无实物手”)。他认为,模型在某些特定提示词上的表现出色,可能是因为在这些已知例子上进行了**“应试训练”。此外,Marcus还对OpenAI因模型扩展而带来的电力消耗问题**表示担忧。 OpenAI Sora 2 …
阅读更多Claude Agent SDK 推荐-宝玉 宝玉推荐使用 Claude Agent SDK,因为它内置了 Claude Code 所需的所有工具,能够完成大部分普通 Agent 的任务。开发者只需根据需求编写新的提示词或添加少量工具,即可快速完成原型开发。这一推荐强调了 SDK 在简化 AI Agent 开发流程方面的优势,特别是对于需要快速验证概念或搭建原型项目的情况。 如何编写 prompt 才能让大模型更好地理解工具?-宝玉 关于如何编写能让大模型更好地理解工具的 Prompt,宝玉分享了一个有效方法:让模型自己来写并优化 Prompt。具体步骤包括:首先让 Claude Code 基于设计系统完成一个任务(如制作登录页 …
阅读更多OpenAI Sora 推出IP版权精细控制与商业化分成模式-Sam Altman OpenAI 正为视频生成模型 Sora 推出两项重要调整。首先,OpenAI 将允许IP版权方对人物角色的创作提供更细粒度的控制,版权方可以精细设定允许/不允许、允许的场景及可能的限制,甚至放开大尺度创作,以促进“互动式粉丝创作”并吸引更多版权方参与。其次,鉴于用户创作量远超预期导致成本上升,OpenAI 计划探索商业化路径,推出收入分享模式,如果用户创作的视频涉及版权方的角色,OpenAI 将与版权方分享相应的收入。Sam Altman 强调团队将像ChatGPT早期一样进行快速迭代,并特别提及日本内容生态的强大创意表现力,暗示日本动漫/角色可 …
阅读更多ModernVBERT高效视觉语言检索模型发布-merve Hugging Face平台宣布推出ModernVBERT,这是一种高效的视觉语言检索模型,专为文档和通用图像-文本检索设计。与传统基于因果注意力的检索器不同,ModernVBERT训练了一个双编码器,在nDCG@5指标上取得了显著的10.6点提升。所有模型均已在Hugging Face上发布,并遵循MIT许可证,为研究人员和开发者提供了强大的新工具。 对AI产品成瘾性与行业泡沫的深度反思-orange.ai 作者对当前科技界将AI产品“成瘾性”视为成功标志的趋势表达了深度担忧,并质疑了类似“AI抖音”这类产品是否满足真实需求。文章指出,成瘾性并非积极指标,低门槛的AI内 …
阅读更多在过去四小时内,AI领域迎来多项重要进展,OpenAI 推出了直接集成购物功能的 ChatGPT Merchants,将电商带入对话界面。同时,Anthropic 发布了其新一代模型 Claude Sonnet 4.5,并推出了实验性的实时界面生成功能 “Imagine with Claude”,进一步提升了其在编程和交互方面的能力。此外,Replit 平台的 Agent 3 也创下了新的运行记录。 OpenAI 推出 ChatGPT Merchants 功能,将购物集成至对话界面 - 小互 OpenAI 正式推出 ChatGPT Merchants 功能,将购物体验直接整合进 ChatGPT 的对话窗口,实现“边问边买”。用户现在 …
阅读更多以下是过去4小时全球AI领域的关键动态: Hugging Face Inference Providers 支持 Qwen3-VL 视觉语言模型-merve Hugging Face的推理服务平台,由Novita Labs提供支持,现已集成并支持Qwen3-VL,一款前沿的视觉语言模型。该模型参数规模庞大,其中220亿为活跃参数,总参数量达2350亿,此次集成将极大便利研究人员和开发者体验和利用这款强大的多模态AI模型,进一步推动视觉-语言理解领域的发展。 GPT-5 在解决开放性数学问题上展现潜力-Sam Altman Sam Altman转发Sebastien Bubeck的观点指出,GPT-5在解决一些非核心的开放性数学问题方 …
阅读更多Meta 发布 32B 参数开源代码世界模型 (CWM)-宝玉 Meta AI 发布了全新的开源代码世界模型 (Code World Model, CWM),该模型拥有 32B 参数。与传统大语言模型不同,CWM 利用“世界模型”让 AI 智能体学会推理和规划,通过模拟代码执行的后果来提升代码生成能力。这使得模型能够理解代码运行时的动态世界,而非仅仅进行“代码模仿”。在多任务强化学习测试中,CWM 在 LiveCodeBench v5 上达到 67.6%,在 AIME24 上达到 76%,在 SweBench Verified 上通过推理扩展达到 65.8%,表现出色。 Google AI 提升 Gemini CLI/Code …
阅读更多阿里巴巴云栖大会发布Qwen3-Max与通义万相2.5等系列大模型-向阳乔木 阿里巴巴在云栖大会上集中发布了多款重磅AI模型,包括超万亿参数的旗舰模型Qwen3-Max,该模型在SWE-Bench编码测试中斩获69.6分,在数学基准AIME 25和HMMT测试中达到满分100分,被认为能力已接近Claude 4 Opus及GPT-5。同时,通义万相2.5 preview视频生成模型也正式亮相,支持5-10秒1080P音画一体视频,被评价为国产“Veo3”最强平替,在图片和视频生成领域达到国际顶级水平。此外,Qwen系列共发布了300多个不同规模模型,从0.5B到超万亿参数,旨在覆盖更广泛的应用场景。用户可在夸克造点和通义万相平台体 …
阅读更多可灵2.5 Turbo视频模型表现亮眼,有望辅助CG制作 - 歸藏(guizang.ai) 歸藏(guizang.ai)对可灵2.5 Turbo视频模型进行了测试,并将其与世界渲染大赛的顶级CG作品进行对比。测试结果显示,在特定场景下,AI视频的质量已能与CG相匹敌,例如在模拟汽车甩尾漂移等动态场景中,模型表现出卓越的还原能力和视觉效果。虽然AI视频距离完全替代CG仍有距离,但它已能在CG流程中承担动态预览和前期方案探索等部分,显著提高了工作效率和便利性。 传言:Gemini 3.0 Pro与Claude 4.5 Sonnet或本周发布 - 向阳乔木 有传言指出,谷歌的Gemini 3.0 Pro和Anthropic的Claude …
阅读更多