图像生成 | 72Live中文网

2025.11.27.04 过去4小时全球AI发生了什么？
Nov 27, 2025 · 1 分钟阅读 ·
分享到:
AI 评论家 Gary Marcus 重申对 LLM 及 OpenAI 的长期警告 AI 评论家 Gary Marcus 再次强调了他对大型语言模型（LLMs）的长期批判观点，指出它们无法导向通用人工智能（AGI），并将面临经济困境，甚至可能需要救助。他同时表达了对 Sam Altman 的不信任，并预测 OpenAI 将失去其主导地位，GPT-5 也无法实现 AGI 承诺，幻觉及泛化能力不足等问题将持续存在。 Gary Marcus 炮轰 Yann LeCun 剽窃其对 LLM 限制的预测 AI 评论家 Gary Marcus 严厉指责 Yann LeCun 盗用他 2022 年 3 月提出的观点，即 LLM 的扩展将遇到瓶颈， …

阅读更多
2025.10.16.16 过去4小时全球AI发生了什么？
Oct 16, 2025 · 1 分钟阅读 ·
分享到:
在过去4小时内，AI领域主要关注Sora 2 Pro的视频生成能力升级、AI图像/视频生成的技术实践与Veo-3.1模型的正式发布。 Sora 2 Pro支持25秒视频生成与故事板功能-歸藏(guizang.ai) Sora 2 Pro现已支持生成最长达25秒的视频内容，并引入了故事板功能，允许用户对视频进行更精细的控制。一位用户详细分享了通过分镜提示词（如场景、镜头和情感描述）生成连贯情节视频的测试经验。该功能通过点击输入框的“故事板”按钮，并在右下角切换时间来实现，极大地增强了文生视频的叙事能力和用户自定义度。 AI图像与视频生成实践技巧分享-宝玉 AI图像和视频生成领域涌现了多项实用技巧。有用户分享了使用Grok …

阅读更多
2025.10.05.20 过去4小时全球AI发生了什么？
Oct 5, 2025 · 1 分钟阅读 ·
分享到:
新闻列表腾讯混元图像3.0登顶LMArena文生图榜首，成为全球第一-orange.ai 腾讯混元图像3.0在国际权威AI模型竞技场LMArena的用户投票榜单中登顶第一，成为全球领先的文生图模型。该模型通过完全匿名的盲测机制，击败了包括Google的Nano Banana和OpenAI的GPT-4o生图在内的众多国际知名模型，是LMArena所有单项榜单中唯一一个获得第一的中国模型。用户反馈其最大的特色在于对用户意图的深刻理解，显著降低了提示词编写的复杂性。此外，它在画面精度、色彩还原和风格多样性方面表现出色，并具备优秀的中文文字生成能力（长文本仍有改进空间）。目前，腾讯混元图像3.0已完全免费开放体验。

阅读更多
2025.09.15.16 过去4小时全球AI发生了什么？
Sep 15, 2025 · 1 分钟阅读 ·
分享到:
AI 产品营销策略转向案例驱动-歸藏(guizang.ai) 最新的观点指出，AI产品的营销策略正逐步转向案例驱动。这意味着成功的AI产品推广需要能够引人入胜地理解并解释技术的人才，因为模型的创造者往往未能完全洞悉其作品的全部价值和能力边界。未来的营销将更加注重结合客户需求、突破性技术能力，并通过从简单到复杂的案例教学来展示产品优势和应用场景。 AI 编程工具简化开发流程，Augment 获推荐-向阳乔木 AI编程工具正在显著简化服务器连接、部署及安装等开发环节，极大地提升了开发效率。其中，Augment 工具被特别推荐，因其能有效避免其他AI编程助手可能出现的“降智”问题。尽管每月50美元的订阅费用较高，但其卓越的实用性使开发人 …

阅读更多
2025.09.12.20 过去4小时全球AI发生了什么？
Sep 12, 2025 · 1 分钟阅读 ·
分享到:
火山引擎免费开放顶级Seedream 4.0生图模型，API支持4K与去水印-向阳乔木火山引擎现已免费开放其顶级Seedream 4.0生图模型，用户无需API或积分即可使用。该模型在架构上与Nano Banana类似，具备4K高清图片生成能力，并提供出色的中文支持。Seedream 4.0被认为具有巨大潜力，在多个场景下表现不俗。最值得关注的是，火山引擎还支持API接入，允许用户直接生成4K图片并去除水印，预计将催生大量基于此模型的AI原生产品。该模型已通过多种案例展示其强大的图像生成能力，包括设计乐队海报、可视化解数学题、生成衍纸艺术绘本、模拟烹饪过程、创建Q版玩偶蓝图以及生成表情包和手办。 Claude AI助手上 …

阅读更多
2025.09.11.20 过去4小时全球AI发生了什么？
Sep 11, 2025 · 1 分钟阅读 ·
分享到:
PaddleOCRv5 在 Hugging Face Hub 发布，性能卓越并支持40种语言-merve PaddleOCRv5 已在 Hugging Face Hub 上正式发布，并采用 Apache-2.0 许可证。该模型体积小巧，仅 70M，但其基准测试结果显示其性能令人印象深刻，超越了许多最新模型。PaddleOCRv5 支持 40种语言，并且具备极高的部署灵活性。作者还提供了一个包含所有检查点和演示的集合，方便开发者和用户进行测试和应用。豆包Seedream 4.0 与 Gemini Nano Banana 图像模型深度对比-小互用户“小互”分享了对豆包 Seedream 4.0 图像模型和 Gemini Nano …

阅读更多
2025.09.07.16 过去4小时全球AI发生了什么？
Sep 7, 2025 · 1 分钟阅读 ·
分享到:
即梦 (Seedream) 4 图片模型在复杂提示词理解方面显著提升-歸藏(guizang.ai) 即梦 (Seedream) 4 图片模型在复杂提示词理解方面取得了显著进步。该模型不仅能处理复杂的空间关系和材质构成，尤其在生成高级PPT图表时表现出色，且生成成功率大幅提高。此外，其应用范围广泛，用户可以利用它创作高质量的抽象艺术作品、游戏或动漫角色图标，以及富有质感的个性化头像，展现出高还原度和独特的笔触效果。这一进展使得AI图像生成更加精细和用户友好。李继刚分享AI时代核心问题与Prompt工程新理论“势能式”-宝玉知名专家李继刚提出了创新的Prompt工程方法“势能式”，旨在通过构建“结构网”的高度差，引导AI算力流向特 …

阅读更多
2025.09.03.20 过去4小时全球AI发生了什么？
Sep 3, 2025 · 1 分钟阅读 ·
分享到:
Nano Banana实现随机图片到一致故事分镜的转化-歸藏(guizang.ai) AI模型 Nano Banana 展示了其在图像一致性方面的强大能力。用户通过提供一个特定提示词，可以让模型将几张随机图片转化为一系列连续的故事分镜。该模型能够精确参考原图片的画风和角色，确保生成的分镜在美学表现、场景和人物方面保持高度一致性。这一功能为视频内容创作提供了新的可能性，用户可以利用生成的连续分镜，结合如可灵2.1的首尾帧或即梦的智能多帧技术，直接生成视频内容，大幅简化了创作流程。 Stability AI招聘AI内容作家与故事讲述者-Emad Emad Mostaque 公开表示，Stability AI 正在伦敦积极招聘 AI 内 …

阅读更多