Anthropic发布Claude Sonnet 4.5,编程能力和智能体特性显著提升-宝玉 Anthropic最新推出的Claude Sonnet 4.5模型在编程能力和智能体任务处理方面实现了重大突破。第三方评测显示,Sonnet 4.5速度比Opus 4.1快至少50%,且具备更强的可控性、超长上下文处理能力以及更高的稳定性。它在SWE-bench基准测试中刷新了业界最高水平,并引入了全新的记忆工具(Beta版)API。此外,Sonnet 4.5在自主运行时间上可超过30小时,且在OSWorld计算机使用基准测试中表现出色,沟通风格也更为精炼自然。 Reachy Mini机器人集成OpenAI GPT-4o,实现多模态交互新 …
阅读更多Hyper3D Rodin Gen-2:一款可“无限炸裂”的SOTA 3D模型-orange.ai 一款名为 Hyper3D Rodin Gen-2 的图生3D模型在云栖大会上亮相,展示了其独特的“组件分解”能力,支持3D模型的无限炸裂式拆解,将复杂模型分解为简单组件。这项技术显著提升了3D模型的精度和可用性,尤其适用于精细化3D打印、高精度游戏、影视制作及工业设计等领域。该模型被认为是当前3D模型效果的SOTA(State-Of-The-Art)。用户可通过提供的链接尝试该模型。 商业本质:AI作为扩展与利用的双重性-向阳乔木 有观点指出,一切商业活动都围绕着利用或解除人类的各种限制和短板。技术进步如显微镜、望远镜、汽车、飞机和 …
阅读更多FactoryAI 的 Droid CLI 赋能 GML 4.5 与 GPT-5 结合 Ben Tossell 转发消息称,FactoryAI 的 Droid 命令行工具现已支持运行 Zai.org 的 GML 4.5 模型(被视为 Sonnet 4 的替代方案)。用户反馈 Droid 在代码生成方面表现出色,甚至超越了 Claude Code、Amp、Warp、Cline 和 Codex 等工具。这一进展预示着 GML 4.5 与 GPT-5 高级功能的结合,有望在代码生成和 AI 开发领域提供强大的协同效应,为开发者带来更高效、更强大的编程体验。 OpenAI 被指秘密部署 GPT-5-Chat-Safety 模型 有消息指 …
阅读更多谷歌发布具身智能模型 Gemini Robotics 1.5 - 歸藏(guizang.ai) 谷歌近日推出了专门用于具身智能的 Gemini Robotics 1.5 模型系列,其中包含 Gemini Robotics 1.5 和 Gemini Robotics-ER 1.5 两款协同模型。Gemini Robotics 1.5 作为视觉-语言-动作 (VLA) 模型,负责将高层指令转化为机器人精确的运动指令,并通过思考过程提高透明度,加速跨形态技能学习。Gemini Robotics-ER 1.5 则作为视觉-语言模型 (VLM),充当机器人的高级大脑,能够进行物理世界推理、原生调用数字工具并制定详细的多步骤计划。这两款模型 …
阅读更多以下是过去4小时全球AI领域的重要动态: AI对放射科医生工作影响的深度分析-Andrej Karpathy Andrej Karpathy分享了一篇关于“AI不会取代放射科医生”的文章,指出对AI在就业市场影响的许多预测都过于天真。文章以放射科为例,详细阐述了AI不简单替代工作的复杂原因,包括基准测试不足以反映实际场景、工作本身的多面性、部署面临的监管、保险和责任问题,以及耶冯斯悖论(AI提升效率反而可能增加需求)。他建议,AI短期内更可能改变那些重复性高、任务独立、上下文需求少、错误成本低的例行性工作,且通常作为工具使工作性质发生重构。 Moondream3模型部署:实现物体检测、跟踪、提问和图像字幕-merve Merve宣 …
阅读更多开放权重是多任务、多领域、多语言的未来趋势 - clem 🤗 Hugging Face的联合创始人Clement Delangue强调,**开放权重(open weights)**模型是未来许多AI任务、领域和语言的关键前沿。他指出,通过强化学习(RL)根据特定约束条件对模型进行专业化,开放权重模型的优势将更加显著。这表明了对开源AI社区和定制化模型潜力的坚定信心,预示着AI技术将以更灵活和适应性强的方式发展。 Groq 模型现已通过 Hugging Face 直接在 VS Code 中访问 - clem 🤗 (via GroqInc) Groq公司宣布,其模型现在可以通过Hugging Face直接在Visual Studio …
阅读更多以下是过去4小时内全球AI领域的最新动态: 韩国公布创纪录AI预算:5240亿美元押注AI,促进芯片、培训及智能工厂发展-Peter H. Diamandis, MD 韩国政府公布了2026年创纪录的5240亿美元预算,比上一年增长8.1%,其中人工智能成为核心焦点。该国计划投入数十亿美元用于芯片研发、AI人才培训以及建设智能工厂。这项重大投资旨在测试AI能否有效应对贸易壁垒和劳动力老龄化带来的挑战,通过技术创新驱动经济增长和转型。 Florence-2 视觉语言模型正式支持 Hugging Face Transformers-merve 备受关注的视觉语言模型Florence-2现已正式获得Hugging Face …
阅读更多豆包 P 图Seedream 4.0 效率场景挖掘与使用技巧-宝玉 宝玉测试并分享了字节跳动新推出的豆包 P 图 Seedream 4.0 模型。该模型在画图能力上表现出色,被评价为兼具 GPT-4o 的深度指令意图理解和 nano banana 的角色一致性保持,并能精准编辑图片。更重要的是,它对中文支持极佳,远超同类产品。用户 歸藏 也验证了其对“中式 Q 版恐怖”氛围的理解到位。宝玉强调 Seedream 4.0 不仅是娱乐工具,更是高效的生产力工具,并提供了“分步描述”和“做中学、多抽卡”等使用技巧。此外,推荐用户参考 GitHub 上的提示词整理和 歸藏 的万字教程以更好地掌握该模型。 为字节Seedream 4.0 模 …
阅读更多