2025.10.05.12 过去4小时全球AI发生了什么?

  1. Claude Agent SDK 推荐-宝玉

    宝玉推荐使用 Claude Agent SDK,因为它内置了 Claude Code 所需的所有工具,能够完成大部分普通 Agent 的任务。开发者只需根据需求编写新的提示词或添加少量工具,即可快速完成原型开发。这一推荐强调了 SDK 在简化 AI Agent 开发流程方面的优势,特别是对于需要快速验证概念或搭建原型项目的情况。

  2. 如何编写 prompt 才能让大模型更好地理解工具?-宝玉

    关于如何编写能让大模型更好地理解工具的 Prompt,宝玉分享了一个有效方法:让模型自己来写并优化 Prompt。具体步骤包括:首先让 Claude Code 基于设计系统完成一个任务(如制作登录页面),让模型自行收集所需信息。随后,利用当前会话上下文,让 Claude Code 为一个 Coding Agent 生成 System Prompt,使其能像模型一样理解设计系统、检索文档和了解最佳实践。最后,通过测试生成的 Prompt 并迭代优化,以达到最佳效果。

  3. 最近大量使用 Codex 修 Bug 的一点经验分享-宝玉

    宝玉分享了利用 Codex 修复 Bug 的经验,强调提供正确反馈的重要性,而非复杂的提示词结构。关键在于:1. 通过截图或错误日志清晰展示 Bug 如何重现及其现象;2. 若无法修复,要求模型在关键路径打印日志并提供给它;3. 告知模型相关代码范围以提高成功率;4. 让模型利用工具(如自动化测试、PlayWright/Chrome Dev Tool)自行收集反馈;5. 提供能正常运行的参考代码,让模型对照分析。

  4. 新开会话切换模型-宝玉

    在使用大模型进行开发和调试时,如果遇到问题,可以尝试切换不同的模型新开会话。例如,如果 Codex 不奏效,可以尝试 Claude Code;对于 GPT-5-Codex media 不理想的情况,可以尝试 high 版本或 GPT-5 high。此外,当上下文过长时,新开一个会话往往能显著改善模型表现。

  5. 如果你只是 POC 或者原型,我不推荐 Gemini cli-宝玉

    针对概念验证(POC)或原型项目,宝玉不推荐使用 Gemini CLI,因为目前 Gemini 2.5 Pro 的 Agentic 能力尚显不足,效果不佳。他建议在这些场景下,选择 GPT-5/GPT-Code-5Claude 4.x 等模型能获得更好的效果。尽管 Gemini CLI 可以进行代码魔改,但相应的开发工作量较大,不适用于快速原型开发。