Luma AI 推出 Ray3:世界首个具备“推理能力”的视频模型-小互 Luma AI 发布了 Ray 3 视频生成模型,号称是全球首个具备**“推理能力”的视频模型。Ray 3 能够理解复杂指令,以视觉和语言进行创作,并能评估自身生成结果。该模型支持生成专业级 HDR 视频**,提供 10、12、16-bit 高动态范围,并支持物理仿真、复杂场景、群体动画、运动模糊及写实光照等高级功能。此外,它能理解图像上的涂鸦和绘制等视觉注释,实现对镜头、运动和构图的精确控制,并引入草稿模式以提升创意迭代效率,通过 Hi-Fi diffusion 技术可将视频无缝升级至 4K HDR,还能将普通 SDR 视频转换为 HDR 并输出 EXR …
阅读更多以下是过去4小时内全球AI领域的重要动态: Replit Agent 3 展现强大能力,实现可视化调试和智能代理构建 - Amjad Masad Replit 公司的 Agent 3 展示了显著的进步,不仅能够自动修复代码错误并在浏览器中进行可视化测试,还具备了运行更长时间、自我测试以及构建其他代理的能力。这标志着 Agent 3 从一个辅助工具向一个更具协作性和自主性的智能代理发展,预示着AI在软件开发流程中扮演的角色将更加深入和多元。 Higgsfield 完成5000万美元融资并启动 Higgsfield Ventures - Emad AI公司 Higgsfield 宣布成功完成5000万美元融资, …
阅读更多Claude Code 表现降智,Augment 成功解决编程难题-向阳乔木 一位用户反映,近期 Claude Code 在处理编程任务时出现严重的“降智”现象,导致其花费整个上午都无法解决一个bug,即使重新开启对话也无效。然而,在切换至 Augment 后,同样的编程问题在短短两分钟内便得以解决。这一经历引发了对各大模型“降智策略”的担忧,认为其纯粹是浪费用户时间。这表明在实际应用中,不同大型语言模型在特定任务上的表现可能存在显著差异。 Linters 大幅提升编码Agent的效率-Ben Tossell FactoryAI 强调,如果使用得当,Linters 能够将编码Agent的效率提升十倍。Linters不仅能够编码架构 …
阅读更多以下是过去4小时内全球AI领域的重要动态: Anthropic因“对抗性国家”标签禁止Claude服务 - Emad Anthropic,Claude AI模型的开发者,据报道已在其博客中将中国明确标记为**“对抗性国家”**,并因此禁止了Claude在包括中国在内的特定地区的服务。此举表明AI服务分发正受到地缘政治因素的显著影响,可能对受影响区域的AI发展和获取产生深远影响。 Baseten获得Bond Capital的投资与合作 - sarah guo Sarah Guo宣布,Baseten正与世界级投资者和运营者Jay Simons及其Bond Capital团队进行深度合作并获得投资。此次战略性合作预计将利用Bond …
阅读更多Replit 推出通用 Agent:导入、构建和运行任何内容-Amjad Masad Replit 首席执行官 Amjad Masad 宣布推出 General Agent,这是 Replit Agent 的重大升级。此前的 Replit Agent 擅长从头开始启动项目,但无法运行现有代码仓库或构建自定义堆栈。General Agent 解决了这些限制,现在支持导入、构建和运行任何内容。通过演示,用户只需在 URL 中添加 “repl•new/” 即可运行 ComfyUI,展现了其在处理复杂应用方面的强大灵活性。 关于去除 AI 文本“AI 味”的探讨-宝玉 AI 专家宝玉讨论了去除 AI 生成内容“AI 味”的难题。他指出,目 …
阅读更多大型AI实验室发布多款开源模型:苹果、OpenGVLab和微软贡献突出-merve 过去一周,多个主要AI实验室发布了重要的开源模型。苹果公司推出了FastVLM和MobileCLIP2,这些设备端视觉语言模型(VLM)在HuggingFace上发布,性能卓越:比现有方案快85倍,体积小3.4倍,支持在浏览器本地实现实时视频字幕。OpenGVLab发布了InternVL3.5,包含32个新的视觉语言模型,其中一个基于gpt-oss。此外,微软也发布了一款高效的小型文本转语音(TTS)模型。这些发布共同推动了设备端AI和多模态理解技术的发展。 HuggingFace平台新增医疗AI基准HealthBench与合成问答数据集-clem …
阅读更多