如何为 Agent 写好提示词-宝玉 该推文分享了一篇关于如何为AI Agent编写高质量提示词的指南或文章。随着人工智能技术,特别是AI Agent系统的快速发展,有效的提示词工程已成为确保Agent能够准确理解用户意图、高效执行复杂任务并产出预期结果的关键。此内容旨在为开发者和用户提供实用的策略和技巧,以优化与AI Agent的交互,提升其工作效率和表现。
阅读更多Gary Marcus 对Sora 2能力提出质疑及能源消耗担忧-Gary Marcus 知名AI研究者Gary Marcus对OpenAI的Sora 2模型表达了多方面质疑。他认为,尽管投入了巨量计算资源,Sora 2仍未能展现通用人工智能(AGI)的能力。Marcus指出,Sora 2在应对新颖、富有挑战性的提示词时,常出现物理法则和组合性方面的错误,并提供了“驴子骑贝斯手”等复杂场景下的失败案例(如物体消失或出现“无实物手”)。他认为,模型在某些特定提示词上的表现出色,可能是因为在这些已知例子上进行了**“应试训练”。此外,Marcus还对OpenAI因模型扩展而带来的电力消耗问题**表示担忧。 OpenAI Sora 2 …
阅读更多Claude Agent SDK 推荐-宝玉 宝玉推荐使用 Claude Agent SDK,因为它内置了 Claude Code 所需的所有工具,能够完成大部分普通 Agent 的任务。开发者只需根据需求编写新的提示词或添加少量工具,即可快速完成原型开发。这一推荐强调了 SDK 在简化 AI Agent 开发流程方面的优势,特别是对于需要快速验证概念或搭建原型项目的情况。 如何编写 prompt 才能让大模型更好地理解工具?-宝玉 关于如何编写能让大模型更好地理解工具的 Prompt,宝玉分享了一个有效方法:让模型自己来写并优化 Prompt。具体步骤包括:首先让 Claude Code 基于设计系统完成一个任务(如制作登录页 …
阅读更多今日全球AI领域动态纷呈,呈现出模型开源、硬件竞赛与应用深化三大主线。阿里巴巴与IBM相继开源新模型,推动技术普惠的同时,也凸显了架构创新与多模态能力的竞争焦点。伴随模型进步,从Nvidia与富士通的战略合作到惠普、华硕等厂商的新品发布,AI算力基础设施的竞争正向行业级乃至端侧设备全面渗透。应用层面,OpenAI计划商业化Sora,而AI在学术研究、游戏策略等领域的自主能力正达到新高度,预示着AI正从辅助工具向自主智能体加速演进。同时,行业巨头间的法律纠纷与内部动荡也反映出该领域白热化的竞争格局。 通义千问开源Qwen3-VL-30B-A3B模型,获华为昇腾0day …
阅读更多以下是过去4小时全球AI领域的动态摘要: X聊天功能升级并计划集成加密货币 - Emad Emad Mostaque指出,X的聊天功能已显著改进,支持群组、语音和视频,并提供独立于账户访问的聊天PIN码以增强安全性。他预计未来X平台将集成更多加密货币相关功能,进一步提升用户体验和平台多功能性。这一更新旨在让用户对X聊天功能的强大感到惊喜。 ChatGPT对Reddit数据使用率骤降导致Reddit股价下跌 - 宝玉 数据显示,ChatGPT对Reddit数据来源的使用率在9月份从月初的约15%急剧下降至月底的近5%,直接导致Reddit股价下跌12%。这一变化引发了市场对Reddit作为AI数据供应商是否不可或缺的重新评估,表明其可 …
阅读更多以下是过去四小时全球AI领域的一些重要动态和热门讨论: Sora 2用户体验、市场影响及潜在风险观察-orange.ai 围绕OpenAI的Sora 2产品,社区内反响热烈,多位用户分享了其使用体验和市场观察。一位用户指出,Sora 2具有极强的成瘾性,甚至超过了抖音,导致其在国庆假期沉迷两天。该用户还提到,OpenAI的估值已超越字节跳动,并惊叹于全模态输入和推理模型在2025年就已实现并能免费使用(每天100次),认为其商业化前景广阔,唯一不足是可能存在对抖音数据的过拟合。另有用户分享了将Sora 2与电影台词及个人形象结合,创造特定角色的创意用法。然而,也有用户警告称,尝试删除Sora应用账户可能会导致ChatGPT账户丢失并 …
阅读更多Replit Agent 3 发布:与社区共建-Amjad Masad Replit CEO Amjad Masad转发了关于Replit Agent 3的发布消息,强调了其“与社区共建”的理念。这表明Replit的AI编程助手正在通过社区协作来进一步发展,可能引入了增强的协作功能或更开放的开发模式,旨在提升AI在软件开发中的应用效率和用户体验。 Clement Delangue:呼吁普及模型微调与开源AI-clem 🤗 Hugging Face CEO Clement Delangue强烈倡导普及VLM、VLA及各类模型的微调,并建议企业应微调自己的模型,而非依赖闭源黑盒模型。他指出,这就像软件公司不写自己的软件一样不可取。得益 …
阅读更多以下是过去4小时全球AI领域的重要动态: Amjad Masad 投入“Agent 4”开发,实现超长编码-Amjad Masad Replit的CEO Amjad Masad表示,他连续6小时不间断地编码,正在积极开发**“Agent 4”**。这标志着Replit在AI代理技术方面取得了显著进展,显示出其AI辅助编程工具和智能体开发的高度集中与效率。长时间的集中开发也暗示了该项目的重要性及其对未来编码工作流的潜在影响。 文本转视频AI能耗研究:长度翻倍,能耗翻两番-Gary Marcus 一项新的研究表明,文本转视频(text-to-video)生成器的能耗随着视频长度的增加而非线性增长。具体而言,当生成的视频长度翻倍时,其所需 …
阅读更多以下是过去4小时全球AI领域的关键动态: Hugging Face Inference Providers 支持 Qwen3-VL 视觉语言模型-merve Hugging Face的推理服务平台,由Novita Labs提供支持,现已集成并支持Qwen3-VL,一款前沿的视觉语言模型。该模型参数规模庞大,其中220亿为活跃参数,总参数量达2350亿,此次集成将极大便利研究人员和开发者体验和利用这款强大的多模态AI模型,进一步推动视觉-语言理解领域的发展。 GPT-5 在解决开放性数学问题上展现潜力-Sam Altman Sam Altman转发Sebastien Bubeck的观点指出,GPT-5在解决一些非核心的开放性数学问题方 …
阅读更多Meta 发布 32B 参数开源代码世界模型 (CWM)-宝玉 Meta AI 发布了全新的开源代码世界模型 (Code World Model, CWM),该模型拥有 32B 参数。与传统大语言模型不同,CWM 利用“世界模型”让 AI 智能体学会推理和规划,通过模拟代码执行的后果来提升代码生成能力。这使得模型能够理解代码运行时的动态世界,而非仅仅进行“代码模仿”。在多任务强化学习测试中,CWM 在 LiveCodeBench v5 上达到 67.6%,在 AIME24 上达到 76%,在 SweBench Verified 上通过推理扩展达到 65.8%,表现出色。 Google AI 提升 Gemini CLI/Code …
阅读更多