以下是过去4小时全球AI领域的最新动态: RT @Sh_tha403: Replit Agents & Automation 试用-Amjad Masad Replit创始人Amjad Masad转发的推文显示,Replit的实验性Agents & Automation功能正在被用户积极测试。一位用户在Replit直播中体验了该功能的预览版,并尝试了由AI bot提议并稍作修改的创意。这表明Replit正致力于将AI代理能力集成到其开发环境中,旨在帮助开发者自动化工作流程并生成创意,提升编程效率和用户体验,预示着AI辅助编程工具的进一步发展和普及。 AI编程向垂直方向发展及实时生成软件展望-向阳乔木 有观察者指出,AI编程正呈现向 …
阅读更多高效Markdown转换提示词发布,解决LLM排版难题-宝玉 宝玉发布了一个名为“Text to Markdown Prompt”的提示词,旨在将纯文本内容(如推文、微博)转换为格式良好、结构清晰的Markdown博客文章。该提示词的核心亮点在于其借助思维链机制,能够先提取文章的要点、金句和备选标题,再进行选择和高亮显示。此外,它成功解决了大型语言模型(LLM)在加粗带有标点符号的中文文字时可能出现的格式失效问题,显著提升了LLM生成Markdown内容的专业性和可读性。 对“2025年是AI智能体之年”的质疑-Gary Marcus 知名AI研究员Gary Marcus对“2025年将是AI智能体(agents)之年”的说法表示 …
阅读更多揭秘“AI 智能体” (Agentic AI) 到底如何工作:给孩子的科普指南-宝玉 这篇文章以科普指南的形式,详细解释了AI 智能体(Agentic AI)的工作原理。它将AI智能体比作一个超级聪明的帮手,能够自主做决定、定计划并执行任务。文章阐述了AI智能体的三大核心能力:记忆力、思考力和行动力,并区分了任务型智能体和自主型智能体。通过举例日本旅行规划,以及AI如何拆解任务、利用工具(如搜索引擎、邮件)和通过反馈机制学习进步,清晰地展示了AI智能体在自动化会议预订、日历管理、邮件撰写乃至业务流程运营等方面的实际应用。 斯坦福大学论文揭示 AI 智能体失败根源及调试方案-宝玉 斯坦福大学的论文《WHERE LLM AGENTS …
阅读更多微软发布 Copilot 一系列重磅更新,打造全能私人AI助手-小互 微软宣布对 Copilot 进行一系列重大更新,旨在将其打造成一个全能的私人AI助手。Copilot现已深度集成并打通微软旗下几乎所有产品,其核心由微软与OpenAI整合的全新版本 GPT-5 驱动,并全面升级了视觉和语音能力。主要新功能包括:Copilot Vision 赋予其理解图像和现实场景的能力;Connectors 支持跨应用搜索文档和邮件;Groups 实现多人实时协作;Edge 中的 Copilot 模式 升级为AI浏览器;Learn Live 提供语音交互式学习;Copilot for Health 聚焦医疗健康信息;Mico 虚拟伴侣 提升语音 …
阅读更多以下是过去四小时内全球AI领域的重要动态: Gary Marcus 反思LLM发展困境及AGI预期 - Gary Marcus AI研究员Gary Marcus近期总结了多项对大型语言模型(LLM)实现通用人工智能(AGI)前景构成打击的进展。他引用了苹果和亚利桑那州立大学(ASU)等机构的论文,证实LLM仍然无法解决分布偏移问题。此外,他指出GPT-5的表现未能达到预期,图灵奖得主Rich Sutton也认同他对LLM的批评。值得关注的是,Andrej Karpathy表示当前AI代理远未成熟,无法胜任人类同事或实习生角色,并预测AGI的实现仍需十年之久。DeepMind的Demis Hassabis也据称驳斥了OpenAI关 …
阅读更多OpenAI发布AgentKit,赋能AI Agent快速开发-小互 OpenAI正式发布了AgentKit,这是一个旨在帮助开发者快速创建AI Agent的全功能开发平台。该平台将AI开发流程从传统的“Prompt工程”提升为更高效的“Agent工程”,使得Agent的构建如同搭积木般简单,无需大量复杂代码。AgentKit包含四大核心组件:用于嵌入式对话的ChatKit、可视化的拖拽式流程设计工具Agent Builder、保障内容安全的Guardrails,以及用于评估性能和质量的Evals工具,致力于标准化并加速AI Agent的开发与部署。 定制化AI Agent的优势:超越通用LLM的效率与权限-宝玉 宝玉详细阐述了为 …
阅读更多AI Agent工具管理策略探讨及Codex新功能-宝玉 AI代理工具的MCP路由方案受到质疑,指出其在Prompt Cache利用、LLM对工具能力的透明度以及决策上下文方面的局限性。专家建议采用更可靠的策略:精简工具数量(建议不超过20个);通过多智能体协同分摊工作,有效管理上下文长度;以及多使用通用工具,如Bash脚本或Codex CLI进行Python代码动态生成。此外,Codex (0.44+) 版本现已支持自定义Prompt模板,允许在模板内定义变量,进一步提升了开发灵活性。 FactoryAI的Droid在应用与机器人开发中的表现-Ben Tossell FactoryAI推出的Droid工具在AI应用和机器人开发领 …
阅读更多OpenAI Sora 推出IP版权精细控制与商业化分成模式-Sam Altman OpenAI 正为视频生成模型 Sora 推出两项重要调整。首先,OpenAI 将允许IP版权方对人物角色的创作提供更细粒度的控制,版权方可以精细设定允许/不允许、允许的场景及可能的限制,甚至放开大尺度创作,以促进“互动式粉丝创作”并吸引更多版权方参与。其次,鉴于用户创作量远超预期导致成本上升,OpenAI 计划探索商业化路径,推出收入分享模式,如果用户创作的视频涉及版权方的角色,OpenAI 将与版权方分享相应的收入。Sam Altman 强调团队将像ChatGPT早期一样进行快速迭代,并特别提及日本内容生态的强大创意表现力,暗示日本动漫/角色可 …
阅读更多过去4小时全球AI动态摘要 OpenAI 发布全新多模态生成模型 Sora 2,引领视频生成新时代 OpenAI 正式发布了其多模态生成模型 Sora 2,被誉为视频领域的“GPT-3.5 时刻”。Sora 2 不仅能生成高质量视频,还能同步生成语音和环境音效,并首次支持将用户“插入”视频成为主角。模型亮点包括支持多个镜头的连续生成、更物理真实与可控的世界状态、真人的Cameo登场、以及写实、动漫、电影等多种风格切换。同时,Sora 2 的新版 iOS App 已上线,提供 remix、个性化推荐和青少年保护等功能,目前限美国/加拿大 iOS 用户试用,未来还将开放 API 接入。市场普遍认为,Sora 2 有潜力改变现有视频内容生 …
阅读更多Hyper3D Rodin Gen-2:一款可“无限炸裂”的SOTA 3D模型-orange.ai 一款名为 Hyper3D Rodin Gen-2 的图生3D模型在云栖大会上亮相,展示了其独特的“组件分解”能力,支持3D模型的无限炸裂式拆解,将复杂模型分解为简单组件。这项技术显著提升了3D模型的精度和可用性,尤其适用于精细化3D打印、高精度游戏、影视制作及工业设计等领域。该模型被认为是当前3D模型效果的SOTA(State-Of-The-Art)。用户可通过提供的链接尝试该模型。 商业本质:AI作为扩展与利用的双重性-向阳乔木 有观点指出,一切商业活动都围绕着利用或解除人类的各种限制和短板。技术进步如显微镜、望远镜、汽车、飞机和 …
阅读更多