Sam Altman宣布GPT-5.2-Codex发布,并探讨AI在网络安全中的作用 OpenAI首席执行官Sam Altman宣布推出 GPT-5.2-Codex,该模型专门针对智能体编码和终端使用进行了训练,并已在OpenAI内部取得巨大成功。Altman还提到,上周有安全研究人员利用其前代模型发现并披露了React的一个漏洞,但他坚信随着模型不断改进,AI将对网络安全产生净积极影响。OpenAI正开始探索针对防御性网络安全工作的信任访问计划,并正在为Codex团队招聘,以加速其发展。 Simon Willison利用GPT-5.2将Python库转换为JavaScript Django框架联合创始人Simon …
阅读更多OpenAI发布GPT-5.2-Codex,编程代理能力显著提升 OpenAI首席执行官Sam Altman宣布,专门针对代理编程和终端使用训练的GPT-5.2-Codex正式发布,并已在OpenAI内部取得巨大成功。Django框架联合创始人Simon Willison的一个案例展示了其强大能力:他仅用8条提示词,就将一个Python库JustHTML成功移植为纯JavaScript库,通过9200多个html5lib-tests用例,最终生成约9000行代码,历经43次提交。这一成功案例突显了AI代理在语言翻译、拥有完整测试集、架构已设计好以及由高手操作等“舒适区”的巨大潜力。Simon将此过程称为“设计智能体闭环”,通 …
阅读更多Google发布Gemini 3 Flash模型:性能超越Pro版,速度与效率显著提升-小互 Google正式发布了Gemini 3 Flash模型,该模型在保持Pro级智能的同时,实现了Flash级速度,性能超越了Gemini 2.5 Pro并达到3倍速度,而成本仅为Pro版的零头。新模型具备博士级逻辑与推理能力,能在处理复杂任务时“自我调节思考时间”,平均可减少30%的token使用量。Gemini 3 Flash在MMMU-Pro多模态理解基准测试以及SWE-bench verified和ARC-AGI-2等测试集中甚至超越了Gemini 3 Pro。该模型现已作为Gemini App和AI Mode in Search的默 …
阅读更多Google发布Gemini 3 Flash模型,性能超越Pro版且速度更快-小互 Google正式发布了 Gemini 3 Flash 模型,其性能在MMMU-Pro、SWE-Bench Verified和Arc-AGI-2等多模态理解基准测试中超越了Gemini 3 Pro,同时速度提升三倍,成本大幅降低。该模型具备博士级逻辑与推理能力,能根据问题复杂度动态调节思考时间,并平均减少30%的tokens使用。Gemini 3 Flash现已成为Gemini App和AI Mode in Search的默认模型,适用于实时交互式应用、快速编码、高并发API请求及低延迟多模态AI场景。 xAI Grok语音代理迅速移植到Reachy …
阅读更多OpenAI Images 1.5 及 GPT-5.2 Pro 发布,图像生成与知识工作自动化能力大幅提升-Sam Altman OpenAI 正式发布了 Images 1.5 模型,现已在 ChatGPT 和 API 中推出。该模型提供了显著优化的图像生成能力,不仅速度更快,还新增了强大的编辑功能。同时,有消息指出 GPT-5.2 Pro 带来了重要的范式转变,能够自动化高达 71%的知识工作,大幅提升企业生产力5-10倍,并可能引发历史性的企业结构变革。AI智能成本在三年内下降近1000倍,使得创新前所未有的便捷。 Google创始人谢尔盖·布林斯坦福大学演讲:回顾Google历史,展望AI未来与教育-向阳乔木 Google …
阅读更多NVIDIA发布Nemotron 3系列开源模型,性能与效率均实现突破 - nvidianewsroom NVIDIA推出了全新的Nemotron 3系列开放模型、数据和库,旨在提供透明高效的AI解决方案。该系列首款模型Nemotron 3 Nano (30B-3A) 是一款混合SSM模型,具备100万上下文长度,专为智能体应用设计。该模型在多个基准测试中表现领先,并实现了2.2至3.3倍的速度提升,超越了GPT-OSS和Qwen3-30B。此次发布还包含了训练数据集、强化学习环境及训练代码,并支持商业用途,预示着未来还将推出Super和Ultra版本。 IBM推出开源企业级智能体CUGA,赋能任务自动化 - merve IBM发 …
阅读更多OpenAI 发布 GPT-5.2,智能与效率再创新高 - Sam Altman Sam Altman 宣布 GPT-5.2 已正式上线,可通过 ChatGPT 及 API 访问。该模型被誉为全球最智能的通用模型,尤其在处理实际知识工作任务上表现出色。GPT-5.2在GDPval指标上获得了70%的专家偏好率,远超GPT-5的38%。同时,模型在SWE-Bench Pro、ARC-AGI-2和Frontier Math等多个基准测试中表现强劲,并且在一年内实现了390倍的成本降低。Sam Altman表示,即使不考虑新的文件输出功能,GPT-5.2也是一次意义重大的升级,并预告下周将发布更多“圣诞惊喜”。 迪士尼与OpenAI达成 …
阅读更多以下是过去4小时内全球AI领域的重要动态: Replit Agent 推出定制MCP集成 - Amjad Masad Replit Agent 宣布推出定制多协议通信(MCP)集成,显著增强了其解决实际业务问题的能力。这项创新使得Replit Agent能够连接到远程MCP服务器,确保了安全性和易用性。此举标志着Replit Agent正逐步发展成为一个更强大的通用型AI代理,为开发者提供了更灵活、强大的工具来构建和部署AI应用。 AI在文档批注中的应用:Nano Banana Pro 提供创意批注功能 - 歸藏(guizang.ai) AI工具在文档批注方面展现出多样化应用。用户可以通过Nano Banana Pro为孩子的作业添 …
阅读更多Mistral AI 发布 Mistral 3 系列模型-小互 Mistral AI 重磅发布了其 Mistral 3 系列模型,包括大型稀疏专家混合(MoE)模型 Mistral Large 3(总参数675B,活跃参数41B),以及面向端侧设备的小型稠密模型系列(3B、8B、14B)。这些模型在性能上超越了Kim 2,并支持图像输入与分析、原生函数调用、结构化JSON输出,且原生支持十余种主流语言。Mistral Large 3 还提供了 256K tokens 的超长上下文窗口。在 LMArena 榜单中,Mistral Large 3 在开源非推理模型中排名第二,在开源总体模型中排名第六。 炸裂 Anthropic 红队利 …
阅读更多家庭人形机器人研发取得进展-Emad 深圳MindOne Robotics公司正在Unitree G1平台上测试其开发的机器人大脑,这一进展预示着家庭人形机器人距离大规模应用更近一步。该项技术旨在将复杂的人形机器人能力带入日常生活环境,为未来智能家居和个人助理机器人奠定基础。 FactoryAI Droid CLI与GPT-5.1性能卓越-Ben Tossell FactoryAI的Droid CLI工具因其在编码和调试方面的强大功能而受到广泛关注。有用户报告称,GPT-5.1在2分钟内成功解决了Sonnet 4.5在10分钟内未能解决的调试问题,彰显了其卓越性能。Droid CLI以其快速开发迭代著称,支持ChatGPT …
阅读更多