腾讯开源生图模型 3.0 亮相,具备强悍文字生成与世界知识理解能力-歸藏(guizang.ai) 腾讯最新开源的生图模型 3.0,参数高达 80B,在美学表现、文字生成与世界知识理解方面取得了显著提升。该模型能够生成包括中文在内的较长文字,支持复杂排版和艺术字体设计,甚至能图解中学几何题,媲美头部图像模型如Banana。虽然目前尚不支持图像编辑功能,但有消息称该能力有望在国庆后上线。其强大的世界知识和推理能力,结合微调潜力,预示着广泛的应用前景。 Google DeepMind Veo 3 达到视觉AI的“GPT-3”时刻-小互 Google DeepMind的研究揭示,Veo 3 在视觉AI领域可能迎来了“GPT-3”时刻。该模 …
阅读更多腾讯混元图像3.0模型免费开源,支持中英文精准渲染与长文本生成-向阳乔木 腾讯混元团队近日发布并免费开源了80B图像生成模型“混元图像3.0”,该模型支持中英文精准渲染和长文本生成,被认为是AI图像生成领域的“Deepseek”时刻。无论是插画、漫画、海报还是表情包,用户只需通过一段提示词即可生成专业级作品。模型具备强大的世界知识理解和推理能力,能够从诗句等抽象描述中准确生成图片。此模型不仅可免费商用,还允许个人和企业进行二次开发,极大地拓展了AI图像生成的应用场景,如电商广告、品牌Logo设计、图标生成、PPT配图及多样材质渲染等。该模型源代码已完全开放,体现了腾讯在AI领域的加速布局。 Deemos发布高精度3D生成模 …
阅读更多以下是过去4小时全球AI领域的一些重要动态和观点: 生成式AI在构建稳健世界模型方面的普遍失败-Gary Marcus AI研究者Gary Marcus再次强调了他对大型语言模型(LLMs)和世界模型(world models)的看法,并推荐读者阅读他的文章《生成式AI在构建稳健世界模型方面的严重且普遍的失败》。他指出,包括LeCun、Bengio和Richard Sutton在内的多位AI专家在这一议题上持有相似立场。这篇文章深入探讨了LLMs在理解和建立对世界深层认知模型方面的局限性,对当前生成式AI的发展方向提出了批评和质疑。 Claude Code Now:提升开发者AI工具启动效率的macOS解决方案-orange.ai …
阅读更多今日AI领域风起云涌。在底层技术层面,苹果正自研多模态大模型Manzano,直接对标GPT-4o,而奥特曼则大胆预言,五年内AI将实现人类无法企及的科学发现。资本市场同样瞩目,欧洲独角兽Mistral AI获ASML巨额战略投资,凸显AI在半导体产业链中的核心地位。商业模式上,国内出现首例AIRaaS并购案,标志着行业重心从“卖算力”向“卖结果”的关键转变,同时业界也开始警惕“智能体洗白”的市场泡沫。此外,从脑机接口首个国家标准的发布到工业机器人领域的合资,AI的产业化落地正在加速规范和深化。 刚刚,奥特曼预言:人类「只剩」最后5年! OpenAI CEO萨姆·奥特曼预测,到2030年,人工智能将在所有维度上超越人类,真正的转折点将 …
阅读更多以下是过去4小时全球AI领域的重要动态: Amjad Masad 投入“Agent 4”开发,实现超长编码-Amjad Masad Replit的CEO Amjad Masad表示,他连续6小时不间断地编码,正在积极开发**“Agent 4”**。这标志着Replit在AI代理技术方面取得了显著进展,显示出其AI辅助编程工具和智能体开发的高度集中与效率。长时间的集中开发也暗示了该项目的重要性及其对未来编码工作流的潜在影响。 文本转视频AI能耗研究:长度翻倍,能耗翻两番-Gary Marcus 一项新的研究表明,文本转视频(text-to-video)生成器的能耗随着视频长度的增加而非线性增长。具体而言,当生成的视频长度翻倍时,其所需 …
阅读更多FactoryAI 的 Droid CLI 赋能 GML 4.5 与 GPT-5 结合 Ben Tossell 转发消息称,FactoryAI 的 Droid 命令行工具现已支持运行 Zai.org 的 GML 4.5 模型(被视为 Sonnet 4 的替代方案)。用户反馈 Droid 在代码生成方面表现出色,甚至超越了 Claude Code、Amp、Warp、Cline 和 Codex 等工具。这一进展预示着 GML 4.5 与 GPT-5 高级功能的结合,有望在代码生成和 AI 开发领域提供强大的协同效应,为开发者带来更高效、更强大的编程体验。 OpenAI 被指秘密部署 GPT-5-Chat-Safety 模型 有消息指 …
阅读更多AI 行业趋势与可持续性辩论 AI 发展需要“非规模化”视角与可持续性警示-Gary Marcus Gary Marcus 与 Yann LeCun、Richard Sutton 等人就 AI 模型的“规模化”问题展开辩论,强调规模化虽然必要但并非充分条件。他同时转发了德意志银行的一份研究报告,该报告警告称,当前 AI 领域的 巨大资本支出 使得 AI 繁荣不可持续,引发了对 AI 行业长期经济可行性和发展基础的担忧。 Claude Code Agent 及其启动器功能升级 Claude Code 成为全链路开发领域最强 AI Agent-orange.ai Orange.ai 高度赞扬 Claude Code 是目前最强的 AI …
阅读更多Emad提出“人工普通人智能”(ANI)新概念-Emad Emad Mostaque提出了一个新术语——“人工普通人智能”(Artificial Normie Intelligence, ANI)。他认为,这种AI将难以与普通人在网络或远程工作场景中区分开来,表现“平平”,虽然无法解决量子引力等复杂问题,但足以应对日常任务。这一概念旨在描述一种功能足够但非顶尖的AI形态,暗示AI的普及化可能使其能力趋向“普通”。 ListenHub:最佳AI播客生成器亮相-orange.ai orange.ai分享了ListenHub,并将其宣传为“最好的AI播客生成器”。这款工具利用人工智能技术,为用户提供自动生成播客内容的能力,可能涵盖从脚本 …
阅读更多以下是过去4小时全球AI领域的一些主要动态: FactoryAI Droids在Terminal Bench基准测试中排名第一-Nathan Lands \n\n FactoryAI宣布推出其最新的Droids编码代理,并在Terminal Bench基准测试中超越Claude Code,位居第一。该代理被多位用户誉为现有编码AI的“类固醇升级版”,可作为Claude AI代码的即时替代品,并据称运行在GPT-5-Codex上。有评论指出,一个仅由四名研究工程师组成的团队,在创建最佳编码代理方面,超越了OpenAI和Anthropic等百亿美元级别的大型实验室,其性能甚至被认为优于Cursor,标志着编码AI领域的新突破。 \n\n …
阅读更多Google探索生成式操作系统原型,实现AI即时生成UI - 小互 Google团队正在研究一个生成式操作系统原型,旨在彻底改变用户界面的交互方式。该系统基于Gemini 2.5 Flash-Lite模型,能够根据用户的实时操作,而非预设模板,即时生成并逐步渲染界面。其核心创新在于,系统能记住用户之前的操作链,使新生成的界面更具上下文相关性。例如,当用户点击“保存笔记”时,AI会瞬间生成显示操作结果的新界面,而非跳转到固定窗口。这种“神经操作系统”通过动态生成UI代码和内容,让操作系统变得更加“活”和个性化,同时通过缓存机制避免了每次操作都完全重新生成。 AI播客在抖音平台实现爆发式增长 - orange.ai 有观察指出,AI播 …
阅读更多