OpenAI GPT-5.2 Codex发布,Agentic Coding能力显著提升-Sam Altman Sam Altman宣布推出GPT-5.2 Codex,该模型专为Agentic Coding和终端使用进行训练,并在OpenAI内部取得了巨大成功。Django框架联合创始人Simon Willison的案例进一步证明了其能力,他仅用8条提示词和GPT-5.2 Codex将一个纯Python库转换成约9000行JavaScript代码,并成功通过9200多个测试用例。这突出显示了AI代理在跨语言“翻译”、自动化测试以及在既定架构下“填空”的优势。Amjad Masad补充指出,编码代理会犯错,因此必须在支持操作可逆的基础 …
阅读更多OpenAI推出GPT-5.2-Codex,Coding Agent能力凸显-Sam Altman OpenAI首席执行官Sam Altman宣布发布GPT-5.2-Codex,该模型专为Agentic编码和终端使用进行训练。Django框架联合创始人Simon Willison利用Codex CLI + GPT-5.2,成功将一个9000行Python库移植到JavaScript,仅使用了约8条提示词。Willison分析称,Coding Agent的“舒适区”在于语言翻译、拥有完整测试集、预设架构,并通过专家操作形成“智能体闭环”,从而高效完成复杂任务。 Google发布FunctionGemma与T5Gemma …
阅读更多Sam Altman宣布GPT-5.2-Codex发布,并探讨AI在网络安全中的作用 OpenAI首席执行官Sam Altman宣布推出 GPT-5.2-Codex,该模型专门针对智能体编码和终端使用进行了训练,并已在OpenAI内部取得巨大成功。Altman还提到,上周有安全研究人员利用其前代模型发现并披露了React的一个漏洞,但他坚信随着模型不断改进,AI将对网络安全产生净积极影响。OpenAI正开始探索针对防御性网络安全工作的信任访问计划,并正在为Codex团队招聘,以加速其发展。 Simon Willison利用GPT-5.2将Python库转换为JavaScript Django框架联合创始人Simon …
阅读更多西方国家对AI信任度普遍较低,中国则更为乐观-Andrew Ng 根据Edelman和Pew Research的报告显示,美国及欧洲、西方世界大部分地区民众对AI普遍不信任且不感到兴奋。在美国,49%的人拒绝AI的增长使用,而中国有54%的人接受。这种广泛的不信任可能阻碍AI的进步,导致个人采纳缓慢、有价值的项目受阻,并增加限制AI发展的立法风险。吴恩达呼吁AI社区认真对待公众担忧,坦诚讨论AI的益处和危害,并积极解决问题,以重建社会信任。 OpenAI研究推出“告解室”机制,提升AI诚实度-向阳乔木 OpenAI最新研究开发了一种名为“confessions”(告解)的方法,旨在提高AI的诚实度。该方法让AI在给出主回答后,单独 …
阅读更多以下是过去4小时内全球AI领域的动态汇总: Andrew Ng:西方世界对AI缺乏信任,AI社区需努力重建信任-Andrew Ng Edelman和Pew Research的报告显示,美国及欧洲大部分西方国家民众对AI普遍不信任且缺乏热情,与中国等国家形成鲜明对比。报告指出,在美国有49%的人拒绝AI的广泛应用,仅17%支持。这种普遍的不信任可能阻碍AI的进步,导致个人采纳缓慢、关键项目受阻以及民粹主义立法限制AI发展。Andrew Ng呼吁AI社区正视这些担忧,真实地宣传AI的利弊,积极解决问题,并避免过度炒作AI的危险性,以赢回社会信任。 OpenAI推出“告解”机制,提升AI诚实度-向阳乔木 OpenAI最新研究引入了一种名 …
阅读更多Radical Numerics发布RND1,最强大的扩散语言模型 Radical Numerics公司推出了RND1,声称这是迄今为止最强大的基础扩散语言模型(DLM)。该模型旨在推动AI在语言理解和生成领域的最新进展,可能为内容创作、代码生成及其他AI应用带来新的可能性。 Emad M.呼吁社会核心模型全面开放与合成化 Emad M.强调,驱动社会运行的模型需要实现完全开放,包括数据和权重。他指出,这些模型应趋向于完全合成和聚焦,并透露其团队正致力于政府、金融和健康领域的开放模型开发,预计很快将有更多公告发布。 Gary Marcus批判AI炒作及大模型局限性 AI研究员Gary Marcus对当前AI领域的过度炒作表示担忧, …
阅读更多在过去4小时内,AI领域出现了多项技术更新与讨论,涵盖了AI Agent的成本、安全漏洞、模型优化以及中文AI工具的开源进展。 Replit 披露 JavaScript 新型蠕虫“Shai-Hulud”及应对措施 - Amjad Masad Replit首席执行官Amjad Masad发布警报,指出JavaScript世界中出现了一种名为“Shai-Hulud”的新型蠕虫,能够秘密窃取用户凭证。Replit已针对受影响的用户开发环境进行了修补,并发布了免费的部署扫描工具,以帮助用户检测和防御此威胁。此举凸显了AI时代下,开发平台在保护用户代码和数据安全方面面临的持续挑战和责任,强调了运行时控制在安全防护中的重要性。 腾 …
阅读更多今日AI领域呈现出深度集成与应用落地两大趋势。开发者工具成为新战场,OpenAI的GPT-5-Codex与Anthropic的Claude全面融入主流IDE,预示着软件工程范式的变革。具身智能持续火热,Figure AI获巨额融资,而国内的导盲犬、空翻机器人展示了其在特定场景的突破。在消费端,苹果正式推送Apple Intelligence,将AI无缝嵌入操作系统,提升用户体验。同时,AI正深入垂直行业,从加速材料科学研究到赋能生物回收,展现出解决复杂问题的巨大潜力。Mira Murati对LLM确定性的探索和谷歌为AI代理支付制定的新标准,则从底层技术和生态规则上推动行业走向成熟。 OpenAI 推出 GPT-5-Codex, …
阅读更多Libin图像生成基准发布,挑战AI精确控制能力 - Gary Marcus Gary Marcus介绍了名为**“Libin图像生成基准”的新评估工具,旨在测试AI模型在生成图像时对精确细节的控制能力。该基准要求模型根据提示词准确生成包含十七本大小各异、标题和作者清晰可读**的真实英文书籍的书架图像,并指定其中一本封面为红色。这突显了当前图像生成AI在处理复杂、具体指令时,尤其是在需要精确数字和属性匹配的场景中,仍面临挑战。 马来西亚推出全球首家AI驱动银行Ryt - Peter H. Diamandis, MD 马来西亚正式推出了全球首家AI驱动型银行Ryt。这家创新银行旨在利用人工智能技术,为用户提供无等待的金融服务。Ryt …
阅读更多