2025.09.21.16 过去4小时全球AI发生了什么？

Sep 21, 2025 · 1 分钟阅读 ·

分享到:

在过去4小时内，AI领域讨论聚焦于不同大型语言模型的性能评估和未来展望。有观点指出特定模型在编程能力方面的表现，以及对新版本发布所寄予的期望。

GPT-5-Codex 模型表现强劲 - 宝玉
有分析指出，在模型选择上，GPT-5-Codex 模型被认为非常强大，尤其是其high版本。尽管目前Codex在工具集成方面可能稍显不足，但其核心模型的性能得到了高度肯定。这一观点强调了模型底层能力的重要性，即便外部工具链有待完善，强大的模型基础仍是关键。
Gemini 2.5 Pro 编程能力突出但 Agentic 能力受限 - 宝玉
针对Gemini Pro系列模型，有用户评价Gemini 2.5 Pro在编程能力方面表现出色，但其在Agentic能力（即作为智能体执行复杂任务的能力）方面仍显不足，使其目前仍处于第二梯队。因此，业界正密切关注Gemini 3.0 Pro的发布，期待其能在Agentic能力上带来显著提升，以进一步增强模型的综合表现。