OpenAI GPT-5.2 Codex发布,Agentic Coding能力显著提升-Sam Altman Sam Altman宣布推出GPT-5.2 Codex,该模型专为Agentic Coding和终端使用进行训练,并在OpenAI内部取得了巨大成功。Django框架联合创始人Simon Willison的案例进一步证明了其能力,他仅用8条提示词和GPT-5.2 Codex将一个纯Python库转换成约9000行JavaScript代码,并成功通过9200多个测试用例。这突出显示了AI代理在跨语言“翻译”、自动化测试以及在既定架构下“填空”的优势。Amjad Masad补充指出,编码代理会犯错,因此必须在支持操作可逆的基础 …
阅读更多Nano Banana Pro推出论文/作业涂鸦批注功能-歸藏(guizang.ai) Nano Banana Pro推出了一项创新功能,允许用户通过手写中文批注、涂鸦和剪贴画来注释论文或作业。这项功能旨在帮助用户更直观地理解复杂的学术内容,尤其适合大学水平的学生,通过个性化的视觉批注来阐释原理和细节。 fal启动欧洲创业项目,旨在帮助雄心勃勃的开发者-Emad fal公司在欧洲推出了其首个创业项目,旨在支持有雄心壮志的创业者和开发者。此举表明AI领域对欧洲创新生态系统的重视,以及对新兴AI技术和应用的持续投入。 Nano Banana Pro生成电影级跨时代场景融合图像-宝玉 Nano Banana Pro展示了一项强大的图像生 …
阅读更多编者按: 本报告整理了过去一段时间全球AI领域的热点动态。请注意,根据提供的数据,所有内容均发布于格林尼治时间2025年12月7日16:00(北京时间2025年12月8日00:00),因此严格意义上不属于报告所限定的“过去4小时”时间窗内。然而,为了向您提供最新可用的AI趋势信息,我们将这些重要更新进行了梳理。 Nano Banana Pro多功能AI提示词及应用揭示-歸藏(guizang.ai) & 向阳乔木 & 宝玉 & Orange AI Nano Banana Pro被展示为一款功能强大的AI工具,其多样化的提示词能够帮助用户生成各种创意内容和数据可视化。核心应用包括:“夯到拉”产品评价图表,通过网络调研生成3D四象限决策矩 …
阅读更多以下是过去一段时间全球AI领域的重点新闻和进展: 谷歌Gemini 3 Deep Think的预测及2026年AI行业趋势分析-歸藏(guizang.ai) 谷歌发布了由Gemini 3驱动的Deep Think模型,并基于OpenRouter的报告分析了2026年AI行业发展趋势。预测指出,推理成本将大幅降低,云厂商的商业模式可能从“按Token收费”转向“按任务结果收费”,企业将更愿意为实际解决问题的成果付费。此外,AI基础设施将重构,全面支持有状态架构,使AI Agent能保持数小时甚至数天的“工作记忆”和上下文环境,无需重复上传数据,从而提升Agent的实用性和效率。 阿里巴巴发布Qwen3-TTS语音合成模型-小互 阿里巴 …
阅读更多Mistral AI 发布 Mistral 3 系列模型-小互 Mistral AI 重磅发布了其 Mistral 3 系列模型,包括大型稀疏专家混合(MoE)模型 Mistral Large 3(总参数675B,活跃参数41B),以及面向端侧设备的小型稠密模型系列(3B、8B、14B)。这些模型在性能上超越了Kim 2,并支持图像输入与分析、原生函数调用、结构化JSON输出,且原生支持十余种主流语言。Mistral Large 3 还提供了 256K tokens 的超长上下文窗口。在 LMArena 榜单中,Mistral Large 3 在开源非推理模型中排名第二,在开源总体模型中排名第六。 炸裂 Anthropic 红队利 …
阅读更多以下是过去一段时间全球AI领域的重要动态: Runway 发布 Gen-4.5 视频生成模型,注重物理与视觉精度 - 歸藏(guizang.ai) Runway 推出了其最新视频生成模型 Gen-4.5。虽然该版本未带来范式革新,但其在多方面进行了显著升级,包括提升了物理与视觉精度,能够处理更复杂场景与详细构图。模型在物理准确性方面有所增强,并能生成更富有表现力的角色。此外,Gen-4.5 也优化了风格化与风格一致性,使其在生成电影感与真实日常场景时表现更佳。 国产AI视频生成应用内测,音画同步但风格抽象 - 向阳乔木 一项国产AI视频生成应用目前正在进行内测。该应用声称能够实现音画同步,这是一项重要的技术突破。然而,测试用户反馈其 …
阅读更多Ilya Sutskever澄清AI扩展定律的局限性 - 宝玉 OpenAI联合创始人Ilya Sutskever对其早前访谈内容进行澄清和补充,指出当前通过堆叠算力、数据和训练环境的AI扩展方法仍能带来进步,模型会持续变强,但这种路径缺乏“真正的泛化能力”和“高效学习”。他强调,有些“重要的东西”是单纯的规模化无法获得的,例如从少量经验中快速学习并在新场景下稳定可靠的能力,以及人类学习效率远超当前AI的效率。 报告显示AI企业采用率趋于平缓 - 宝玉 一份来自Apollo Academy的报告《AI 采用率开始趋于平缓》指出,企业对AI的采用速度并未呈现指数级增长,甚至在美国大型企业中出现了停滞甚至下滑的迹象。该报告引用了美国人 …
阅读更多Google AI负责人Jeff Dean分享AI快速发展历程-向阳乔木 Google AI负责人Jeff Dean在一场分享中回顾了AI从2012年到2024年的指数级发展。他指出,AI的强大是过去十五年技术叠加的产物,包括2012年Google Brain的无监督学习(识别猫)、Word2Vec提升语言理解、2015年TPU(Tensor Processing Unit)解决算力危机(比CPU/GPU快15-30倍,能效高30-80倍),以及2017年Transformer架构的诞生。Dean还介绍了稀疏模型、蒸馏和思维链等训练技巧。他强调,AI从2022年解决初中数学题(15%准确率)到2024年Gemini 2.5 Pro …
阅读更多AI对全球就业市场影响的深度分析揭示结构性变化-宝玉 一项基于2023年至2025年10月近1.8亿份全球招聘启事的分析显示,2025年全球总招聘岗位数量比2024年同期下降8%。其中,创意执行岗位受AI影响最大,计算机图形艺术家、摄影师和作家等职位降幅高达28%-33%,远超基线。然而,创意总监和平面设计师等创意策略岗位则表现稳定。从职级来看,AI赋能高层领导(-1.7%),但一线员工(-9.0%)和中层管理者(-5.7%)受冲击较大。值得注意的是,客服(-4.0%)和软件工程师(尤其是后端)岗位降幅小于大盘,显示出人类同理心和复杂问题处理能力的重要性。机器学习工程师需求激增40%,成为AI淘金热中的核心岗位。此外,网红营销专员 …
阅读更多Meta发布SAM 3论文:实现通过概念进行图像分割 Meta发布了SAM 3(Segment Anything with Concepts)论文,在SAM 1和SAM 2的基础上,实现了对自然语言的语义理解,用户可通过口头描述(如“黄色校车”)批量识别并分割图像中符合概念的物体。这一突破解决了之前版本需要手动点击或画框的局限,大大提升了操作效率。其短期落地场景广泛,包括电商批量抠图、视频内容理解、工业质检、内容审核及数据标注提效等。在测试评分上,SAM 3表现显著,如LVIS基准上达到47.0 AP,超越现有最佳的38.5 AP,并在视频跟踪等任务上也有显著提升。 nanochat:由Karpathy开发的ChatGPT开源“教 …
阅读更多