OpenAI 发布 GPT-5.2,智能与效率再创新高 - Sam Altman Sam Altman 宣布 GPT-5.2 已正式上线,可通过 ChatGPT 及 API 访问。该模型被誉为全球最智能的通用模型,尤其在处理实际知识工作任务上表现出色。GPT-5.2在GDPval指标上获得了70%的专家偏好率,远超GPT-5的38%。同时,模型在SWE-Bench Pro、ARC-AGI-2和Frontier Math等多个基准测试中表现强劲,并且在一年内实现了390倍的成本降低。Sam Altman表示,即使不考虑新的文件输出功能,GPT-5.2也是一次意义重大的升级,并预告下周将发布更多“圣诞惊喜”。 迪士尼与OpenAI达成 …
阅读更多以下是过去4小时内全球AI领域的重要动态: Replit Agent 推出定制MCP集成 - Amjad Masad Replit Agent 宣布推出定制多协议通信(MCP)集成,显著增强了其解决实际业务问题的能力。这项创新使得Replit Agent能够连接到远程MCP服务器,确保了安全性和易用性。此举标志着Replit Agent正逐步发展成为一个更强大的通用型AI代理,为开发者提供了更灵活、强大的工具来构建和部署AI应用。 AI在文档批注中的应用:Nano Banana Pro 提供创意批注功能 - 歸藏(guizang.ai) AI工具在文档批注方面展现出多样化应用。用户可以通过Nano Banana Pro为孩子的作业添 …
阅读更多Nano Banana Pro 推出多功能AI提示词模板,赋能万物锐评与可视化-歸藏(guizang.ai) 歸藏(guizang.ai) 近期发布了一系列围绕 “Nano Banana Pro” 的强大提示词模板,旨在帮助用户对世间万物进行锐评并生成高度可视化的信息图表。这些模板包括:基于实时网络搜索生成“从夯到拉”的五级产品评价榜单,采用“Bento Grid”布局;用于商品购买决策的3D四象限决策矩阵海报;以及以可爱黏土风格展示任何爱好或职业进阶之路的地图海报。该工具强调AI生成的意外话题度和美观性,并能针对特定领域如《无畏契约》皮肤进行锐评。 Andrej Karpathy:将LLM视为模拟器而非实体-Andrej …
阅读更多Nano Banana Pro 推出“夯到拉”锐评系统,可对万物进行五级打分-歸藏(guizang.ai) Nano Banana Pro 近期推出了一个热门的AI锐评系统,能够针对任何领域的产品进行“从夯到拉”的五级评价。该系统通过实时网络搜索和顶尖数据可视化设计,生成Bento Grid布局的信息图表,具有强烈的视觉层级落差感。这种AI工具旨在通过生成出人意料且具话题性的评价,用于引战、反串或钓鱼等目的,甚至可以锐评如《无畏契约》皮肤等具体内容。其核心提示词详细定义了调研和可视化阶段的要求以及各等级的视觉表现。 NeurIPS研讨会聚焦基础模型与具身智能,首届BEHAVIOR挑战赛结果公布-Fei-Fei Li NeurIPS …
阅读更多国内纯AI作品《箭头》发布,展示多模态AI创作新高度-宝玉 国内B站创作者DiDi_OK利用Nano Banana、VEO3、Runway等AI工具,并由Suno生成音乐,创作了一部名为**《箭头》的纯AI短片。该作品以“如果世界是程序,你会继续当NPC吗?”为主题,探讨人类在假想“屏幕世界”中的存在意义。这部作品被评价为国内纯AI创作的新高度,展现了AI在视频生成和音乐创作**方面的强大整合能力与叙事潜力。 Nano Banana Pro 在视觉创作与Prompt工程中的广泛应用-宝玉 Google的Nano Banana Pro模型在多种视觉生成任务中展现了其强大的能力。用户通过精心设计的Prompt,可以创作出高对比度 …
阅读更多今日全球AI领域风起云涌,竞争格局愈发激烈。OpenAI因谷歌Gemini的迅猛追赶而宣布进入“红色警报”状态,战略重心回归核心模型能力,显示出市场领先者已感受到巨大压力。与此同时,亚马逊AWS全线出击,发布自研AI芯片、全新Nova 2系列模型及定制服务,并推出能自主编程数日的AI智能体,意图在AI基础设施和应用层构建完整闭环。此外,从商汤开源多模态架构到米哈游推出个性化AI伴侣,再到AI与健康、自动驾驶的深度融合,技术落地和生态构建正成为各方角逐的焦点。 OpenAI因谷歌Gemini用户激增宣布进入“红色警报”状态 据内部备忘录泄露,面对谷歌Gemini在3个月内激增2亿用户的强劲势头,OpenAI CEO萨姆·奥特曼已宣布公 …
阅读更多以下是过去一段时间全球AI领域的重要动态,根据提供的X/Twitter数据整理。请注意,虽然标题提及“过去4小时”,但部分内容的时间戳显示其发布时间早于此。 DeepSeek-Math-V2 开源:超越GPT-5与Gemini,实现IMO金牌水平 - 小互 DeepSeek 开源了数学推理大模型 DeepSeek-Math-V2,其在答案准确率和推理严谨性方面表现出色,超越了GPT-5-Thinking和Gemini 2.5 Pro。该模型核心创新在于“生成+验证+复审”的自我验证系统,能自动生成数学证明并自行检查和修正错误。在IMO 2025、CMO 2024和Putnam 2024等高难度数学竞赛 …
阅读更多DeepSeek 开源数学推理大模型 DeepSeek-Math-V2,超越 Gemini 获得 IMO 金牌-小互 DeepSeek发布了开源数学推理大模型 DeepSeek-Math-V2,其核心创新在于一个“生成+验证+复审”的自我验证系统。该模型在国际数学奥赛(IMO 2025)中解出6题中的5题,达到金牌水平,在中国数学奥赛(CMO 2024)和普特南数学竞赛(Putnam 2024)中也表现优异。它全面超越了 GPT-5-Thinking 和 Gemini 2.5 Pro,展现出高准确率和严谨的推理能力,能够自动生成数学证明并自行检查和修正错误。 神秘视频模型 Whisper Thunder (aka) David 登 …
阅读更多AI 评论家 Gary Marcus 重申对 LLM 及 OpenAI 的长期警告 AI 评论家 Gary Marcus 再次强调了他对大型语言模型(LLMs)的长期批判观点,指出它们无法导向通用人工智能(AGI),并将面临经济困境,甚至可能需要救助。他同时表达了对 Sam Altman 的不信任,并预测 OpenAI 将失去其主导地位,GPT-5 也无法实现 AGI 承诺,幻觉及泛化能力不足等问题将持续存在。 Gary Marcus 炮轰 Yann LeCun 剽窃其对 LLM 限制的预测 AI 评论家 Gary Marcus 严厉指责 Yann LeCun 盗用他 2022 年 3 月提出的观点,即 LLM 的扩展将遇到瓶颈, …
阅读更多今日AI领域呈现出模型竞争白热化与应用落地加速两大趋势。谷歌Gemini 3凭借强大性能获得行业领袖背书,直接挑战OpenAI的领先地位,而Anthropic则通过发布Opus 4.5并大幅降低API价格,加剧了市场竞争。与此同时,AI正从云端走向终端和实体,微软发布专为PC操作设计的端侧小模型Fara-7B,OpenAI的AI硬件原型也已亮相。在应用层面,蚂蚁集团推出代码生成助手,人形机器人公司优必选获得巨额订单,标志着AI商业化进程正迈入新阶段。政策层面,北京出台具体措施支持AI在医疗领域的深度应用。 从 AI 潜在牺牲品到赢家,谷歌在 ChatGPT 冲击下逆袭 谷歌在AI竞赛中正强势反击,其最新发布的Gemini 3模型在多 …
阅读更多