2025.09.11.20 过去4小时全球AI发生了什么?
PaddleOCRv5 在 Hugging Face Hub 发布,性能卓越并支持40种语言-merve
PaddleOCRv5 已在 Hugging Face Hub 上正式发布,并采用 Apache-2.0 许可证。该模型体积小巧,仅 70M,但其基准测试结果显示其性能令人印象深刻,超越了许多最新模型。PaddleOCRv5 支持 40种语言,并且具备极高的部署灵活性。作者还提供了一个包含所有检查点和演示的集合,方便开发者和用户进行测试和应用。
豆包Seedream 4.0 与 Gemini Nano Banana 图像模型深度对比-小互
用户“小互”分享了对豆包 Seedream 4.0 图像模型和 Gemini Nano Banana 的详细对比测试。总体来看,这两款模型在图像编辑和推理方面的能力非常接近,不相上下。测试结果表明,Gemini Nano Banana 在推理能力上可能略微强大一些,但 Seedream 4.0 在中文处理能力上表现显著更优,更适合中国用户的使用习惯。通过文字提示和参考图,模型展示了强大的自动合成和图像编辑能力,能够实现美颜、发型修改、物体合成等复杂操作。