2025.09.21.16 过去4小时全球AI发生了什么?

在过去4小时内,AI领域讨论聚焦于不同大型语言模型的性能评估和未来展望。有观点指出特定模型在编程能力方面的表现,以及对新版本发布所寄予的期望。

  1. GPT-5-Codex 模型表现强劲 - 宝玉

    有分析指出,在模型选择上,GPT-5-Codex 模型被认为非常强大,尤其是其high版本。尽管目前Codex在工具集成方面可能稍显不足,但其核心模型的性能得到了高度肯定。这一观点强调了模型底层能力的重要性,即便外部工具链有待完善,强大的模型基础仍是关键。

  2. Gemini 2.5 Pro 编程能力突出但 Agentic 能力受限 - 宝玉

    针对Gemini Pro系列模型,有用户评价Gemini 2.5 Pro在编程能力方面表现出色,但其在Agentic能力(即作为智能体执行复杂任务的能力)方面仍显不足,使其目前仍处于第二梯队。因此,业界正密切关注Gemini 3.0 Pro的发布,期待其能在Agentic能力上带来显著提升,以进一步增强模型的综合表现。