OpenAI 发布 GPT-5.2,智能与效率再创新高 - Sam Altman Sam Altman 宣布 GPT-5.2 已正式上线,可通过 ChatGPT 及 API 访问。该模型被誉为全球最智能的通用模型,尤其在处理实际知识工作任务上表现出色。GPT-5.2在GDPval指标上获得了70%的专家偏好率,远超GPT-5的38%。同时,模型在SWE-Bench Pro、ARC-AGI-2和Frontier Math等多个基准测试中表现强劲,并且在一年内实现了390倍的成本降低。Sam Altman表示,即使不考虑新的文件输出功能,GPT-5.2也是一次意义重大的升级,并预告下周将发布更多“圣诞惊喜”。 迪士尼与OpenAI达成 …
阅读更多以下是过去4小时内全球AI领域的重要动态: Replit Agent 推出定制MCP集成 - Amjad Masad Replit Agent 宣布推出定制多协议通信(MCP)集成,显著增强了其解决实际业务问题的能力。这项创新使得Replit Agent能够连接到远程MCP服务器,确保了安全性和易用性。此举标志着Replit Agent正逐步发展成为一个更强大的通用型AI代理,为开发者提供了更灵活、强大的工具来构建和部署AI应用。 AI在文档批注中的应用:Nano Banana Pro 提供创意批注功能 - 歸藏(guizang.ai) AI工具在文档批注方面展现出多样化应用。用户可以通过Nano Banana Pro为孩子的作业添 …
阅读更多Mistral AI 发布 Mistral 3 系列模型-小互 Mistral AI 重磅发布了其 Mistral 3 系列模型,包括大型稀疏专家混合(MoE)模型 Mistral Large 3(总参数675B,活跃参数41B),以及面向端侧设备的小型稠密模型系列(3B、8B、14B)。这些模型在性能上超越了Kim 2,并支持图像输入与分析、原生函数调用、结构化JSON输出,且原生支持十余种主流语言。Mistral Large 3 还提供了 256K tokens 的超长上下文窗口。在 LMArena 榜单中,Mistral Large 3 在开源非推理模型中排名第二,在开源总体模型中排名第六。 炸裂 Anthropic 红队利 …
阅读更多家庭人形机器人研发取得进展-Emad 深圳MindOne Robotics公司正在Unitree G1平台上测试其开发的机器人大脑,这一进展预示着家庭人形机器人距离大规模应用更近一步。该项技术旨在将复杂的人形机器人能力带入日常生活环境,为未来智能家居和个人助理机器人奠定基础。 FactoryAI Droid CLI与GPT-5.1性能卓越-Ben Tossell FactoryAI的Droid CLI工具因其在编码和调试方面的强大功能而受到广泛关注。有用户报告称,GPT-5.1在2分钟内成功解决了Sonnet 4.5在10分钟内未能解决的调试问题,彰显了其卓越性能。Droid CLI以其快速开发迭代著称,支持ChatGPT …
阅读更多人形机器人:未来生活不可或缺,价格亲民将加速普及-Peter H. Diamandis, MD Peter H. Diamandis博士预测,人形机器人将成为我们日常生活中不可或缺的一部分。他指出,如果这些机器人的价格能够达到一辆经济型汽车的水平,将极大加速其普及进程。这一观点强调了成本效益在推动未来技术广泛应用中的关键作用,预示着人形机器人可能很快从科幻走向现实,并在不同领域发挥重要作用。 Kimi K2 Thinking:深度代理在客户支持领域表现超预期-clem 🤗 Hugging Face CEO Clement Delangue转发了一则关于Kimi K2 Thinking的积极评价。原推文作者Omar Sar表 …
阅读更多Google发布第七代TPU Ironwood,性能大幅提升 - Demis Hassabis Google首席执行官Sundar Pichai和DeepMind首席执行官Demis Hassabis宣布,其第七代TPU Ironwood即将全面上市(GA)。该款TPU是迄今为止性能最强大的产品,与上一代TPU v5p相比,峰值性能提升了十倍。这一重大硬件突破预计将极大地加速大规模人工智能模型的训练和推理能力,为AI领域的进一步发展提供关键的算力支持,尤其在处理复杂和计算密集型AI任务时将展现出显著优势。 AI对就业市场的影响及北美科技公司裁员趋势 - 宝玉 Revelio lab的数据分析显示,自2023年1月以来,北美科技行业 …
阅读更多OpenAI Atlas浏览器正式发布,Agent模式可执行复杂任务 OpenAI 正式发布其 Atlas 浏览器,所有用户均可使用,其中付费用户可体验强大的 Agent 模式。该浏览器支持对网页进行提问、在输入时提供建议,并能控制标签页的开启与关闭。Agent 模式尤其令人印象深刻,用户测试显示它能完成复杂的跨页面多步操作,例如自动订购苹果设备,甚至能自我纠错(如识别预售状态后更换订购产品)。此外,Atlas 浏览器还支持添加浏览器插件,预示着 AI 驱动的浏览器将为用户带来更智能、高效的网页交互体验。 AI写作能力获认可,但高知群体仍持批判性视角 有观点指出,当前 AI 的写作能力已达到无需怀疑的水平,一篇由 AI 生成但数据 …
阅读更多宇树发布 | Unitree H2 天命觉醒!-宝玉 宇树(Unitree)公司正式发布了其新款仿生人形机器人 Unitree H2。这款机器人高180厘米,重70公斤,旨在为用户提供安全友好的服务。H2的发布标志着宇树在人形机器人领域的又一重要进展,未来有望在各种场景中为人类提供协助,进一步推动仿生机器人技术的实用化和商业化。 \n\n Andrej Karpathy 澄清强化学习(RL)在AI发展中的关键作用-宝玉 知名AI专家 Andrej Karpathy 澄清了外界对他“唱衰强化学习(RL)”的误解,强调RL并非可替代的技术,而是通向通用人工智能(AGI)过程中不可或缺的“分层”之一。他将AI开发比作多层蛋糕,指出基础模 …
阅读更多过去4小时全球AI要闻速览: AI驱动的全栈开发与部署平台迎来突破 - Emad & 小互 AI工具在全栈开发和产品部署领域取得显著进展。II-Agent 宣布支持通过单个提示词构建全栈网站并交付可编辑幻灯片,同时能调用 OpenAI Codex 处理复杂代码。另一方面,Bolt new 发布 V2 版本,深度集成了所有后端服务,包括服务器托管、数据库、API、支付和认证,使用户能够从零开始快速构建和上线完整产品。该平台提供可扩展的云端后端,支持百万级用户规模,并实现自动部署、调试和资源分配。它集成了 Claude Code、Cody、Codex 等顶级AI编码代理,内置深度规划功能,并能进行完全自主的调试,将错误率降低98%。这 …
阅读更多OpenAI 发布专为编程优化的 GPT-5-Codex 模型-宝玉 OpenAI 正式推出 GPT-5-Codex,这是基于 GPT-5 进一步强化的编程优化模型。该模型在真实项目数据上进行训练,旨在提升软件开发效率,能够从零开始构建工程、添加功能、编写测试、调试及进行大规模代码重构。GPT-5-Codex 显著提升了代码审查能力,能够在软件上线前识别关键漏洞。目前,该模型已全面上线,成为云端任务和代码审查的默认选择,并可通过 Codex CLI 和 IDE 扩展在本地使用。 微软加入世界核能协会,押注核能为 AI 时代供电-Peter H. Diamandis, MD 微软成为首家加入世界核能协会的科技巨头,此举表明其正将赌注 …
阅读更多