2025.09.09.20 过去4小时全球AI发生了什么?

  1. Transformers库升级,引入SAM2、KOSMOS2.5、Florence-2等模型-merve

    transformers库迎来了重要的升级,此次更新集成了包括SAM2KOSMOS2.5Florence-2在内的多款高性能AI模型。这些模型的加入极大地扩展了transformers库的功能和应用范围,预示着开发者和研究人员将能利用更强大的工具进行图像理解、多模态处理等任务,进一步推动AI领域的技术进步和创新。

  2. 字节跳动Seedream 4.0图像创作模型教程发布及能力详解-歸藏(guizang.ai)

    归藏(guizang.ai)发布了关于Seedream 4.0图像创作模型万字教程,详细介绍了该模型的功能和使用方法。Seedream 4.0连续分镜生成人脸ID保持方面表现出色,即使在生成6张连续图片后,角色面部特征仍能保持高度一致,使其非常适合创建小剧场视频。模型支持通过提示词对角色的面部、发型、服装和复杂妆造进行精细调整,尽管对于过于细微的发型层次或眼线等细节仍有挑战。该模型已在火山引擎全量上线API,并且是目前唯一支持4K图片直出的渠道,同时也可通过即梦或豆包平台体验。教程还提供了详细的提示词模板和测试案例,显著降低了个人或团队的开发成本。