过去4小时全球AI动态一览 以下是过去4小时内全球AI领域的重要进展和热点讨论: Andrew Ng 推出新课程:使用工具执行构建编码智能体-Andrew Ng 深度学习专家 Andrew Ng 宣布推出一门名为“使用工具执行构建编码智能体”的新课程,由 E2B 的 @tereza_tizkova 和 @FraZuppichini 教授。这门短期课程旨在教授学员如何构建能够编写和执行代码来完成任务的 AI 智能体,从而能够访问完整的编程语言生态系统,而不是局限于固定的工具集。学员将学习在沙盒云环境中安全运行智能体生成的代码,并掌握构建数据分析智能体(使用 Pandas 探索和可视化数据)和全栈智能体(构建完整的 Next.js …
阅读更多AI 行业动态与技术进展 Andrew Ng 发布 E2B 编码代理新课程,赋能AI执行代码 吴恩达宣布推出与 E2B 合作的“使用工具执行构建编码代理”新课程。该课程旨在教授如何构建能编写、执行代码以完成任务的 AI 代理,突破了传统 AI 代理仅限于预定义函数调用的局限。学习者将掌握在沙盒云环境中安全运行代理生成代码的技能,并能创建数据分析和全栈开发代理,处理复杂任务。 Mistral AI 发布多模态模型 Ministral 3,支持免费微调 Mistral AI 推出了其最新多模态模型家族 Ministral 3。据悉,这些模型功能强大,并且用户可以在 Colab 上免费进行微调。这一举措有望降低多模态 AI 模型的使用门 …
阅读更多Surge AI测试揭示AI客服智能体能力金字塔及局限性 - 宝玉 Surge AI进行了一项测试,雇佣包括 GPT-5 和 Claude Sonnet 4.5 在内的9个AI模型,在一个模拟电脑配件公司处理150个真实客服任务。结果显示,即使是表现最好的模型,仍有超过40%的任务失败。测试提出了“Agent能力金字塔”框架,将智能体能力分为基本功、适应性、抓地力(避免幻觉)和常识推理。当前AI智能体在前三层表现尚可,但在常识推理层面仍有显著不足,例如无法将“包裹到达几小时”与“退货”关联,或采取低效的穷举搜索方式,以及误解用户意图。这表明2025年作为“Agent元年”的意义在于能测试AI在常识层面的笨拙,而非已拥有通用的工作 …
阅读更多以下是过去4小时全球AI领域的一些重要动态: Google发布《Introduction to Agents》白皮书 - 向阳乔木 Google于11月发布了名为「Introduction to Agents」的最新白皮书。这份白皮书作为「Google x Kaggle 5天AI智能体强化课程」的开篇,旨在为开发者提供从概念验证到生产级智能体系统的完整指导框架。内容深度聚焦于AI智能体的设计、开发与部署,为业界提供了关于构建和扩展AI智能体应用的重要参考。 Kimi AI通过提示词优化实现营销创新 - 向阳乔木 Kimi AI展示了其强大的营销策略,通过鼓励用户在社群中讨论如何优化提示词以实现“砍价”功能。这种互动模式不仅激发了用户 …
阅读更多以下是过去4小时全球AI领域的最新动态: RT @Sh_tha403: Replit Agents & Automation 试用-Amjad Masad Replit创始人Amjad Masad转发的推文显示,Replit的实验性Agents & Automation功能正在被用户积极测试。一位用户在Replit直播中体验了该功能的预览版,并尝试了由AI bot提议并稍作修改的创意。这表明Replit正致力于将AI代理能力集成到其开发环境中,旨在帮助开发者自动化工作流程并生成创意,提升编程效率和用户体验,预示着AI辅助编程工具的进一步发展和普及。 AI编程向垂直方向发展及实时生成软件展望-向阳乔木 有观察者指出,AI编程正呈现向 …
阅读更多高效Markdown转换提示词发布,解决LLM排版难题-宝玉 宝玉发布了一个名为“Text to Markdown Prompt”的提示词,旨在将纯文本内容(如推文、微博)转换为格式良好、结构清晰的Markdown博客文章。该提示词的核心亮点在于其借助思维链机制,能够先提取文章的要点、金句和备选标题,再进行选择和高亮显示。此外,它成功解决了大型语言模型(LLM)在加粗带有标点符号的中文文字时可能出现的格式失效问题,显著提升了LLM生成Markdown内容的专业性和可读性。 对“2025年是AI智能体之年”的质疑-Gary Marcus 知名AI研究员Gary Marcus对“2025年将是AI智能体(agents)之年”的说法表示 …
阅读更多揭秘“AI 智能体” (Agentic AI) 到底如何工作:给孩子的科普指南-宝玉 这篇文章以科普指南的形式,详细解释了AI 智能体(Agentic AI)的工作原理。它将AI智能体比作一个超级聪明的帮手,能够自主做决定、定计划并执行任务。文章阐述了AI智能体的三大核心能力:记忆力、思考力和行动力,并区分了任务型智能体和自主型智能体。通过举例日本旅行规划,以及AI如何拆解任务、利用工具(如搜索引擎、邮件)和通过反馈机制学习进步,清晰地展示了AI智能体在自动化会议预订、日历管理、邮件撰写乃至业务流程运营等方面的实际应用。 斯坦福大学论文揭示 AI 智能体失败根源及调试方案-宝玉 斯坦福大学的论文《WHERE LLM AGENTS …
阅读更多微软发布 Copilot 一系列重磅更新,打造全能私人AI助手-小互 微软宣布对 Copilot 进行一系列重大更新,旨在将其打造成一个全能的私人AI助手。Copilot现已深度集成并打通微软旗下几乎所有产品,其核心由微软与OpenAI整合的全新版本 GPT-5 驱动,并全面升级了视觉和语音能力。主要新功能包括:Copilot Vision 赋予其理解图像和现实场景的能力;Connectors 支持跨应用搜索文档和邮件;Groups 实现多人实时协作;Edge 中的 Copilot 模式 升级为AI浏览器;Learn Live 提供语音交互式学习;Copilot for Health 聚焦医疗健康信息;Mico 虚拟伴侣 提升语音 …
阅读更多以下是过去四小时内全球AI领域的重要动态: Gary Marcus 反思LLM发展困境及AGI预期 - Gary Marcus AI研究员Gary Marcus近期总结了多项对大型语言模型(LLM)实现通用人工智能(AGI)前景构成打击的进展。他引用了苹果和亚利桑那州立大学(ASU)等机构的论文,证实LLM仍然无法解决分布偏移问题。此外,他指出GPT-5的表现未能达到预期,图灵奖得主Rich Sutton也认同他对LLM的批评。值得关注的是,Andrej Karpathy表示当前AI代理远未成熟,无法胜任人类同事或实习生角色,并预测AGI的实现仍需十年之久。DeepMind的Demis Hassabis也据称驳斥了OpenAI关 …
阅读更多OpenAI发布AgentKit,赋能AI Agent快速开发-小互 OpenAI正式发布了AgentKit,这是一个旨在帮助开发者快速创建AI Agent的全功能开发平台。该平台将AI开发流程从传统的“Prompt工程”提升为更高效的“Agent工程”,使得Agent的构建如同搭积木般简单,无需大量复杂代码。AgentKit包含四大核心组件:用于嵌入式对话的ChatKit、可视化的拖拽式流程设计工具Agent Builder、保障内容安全的Guardrails,以及用于评估性能和质量的Evals工具,致力于标准化并加速AI Agent的开发与部署。 定制化AI Agent的优势:超越通用LLM的效率与权限-宝玉 宝玉详细阐述了为 …
阅读更多