2025.11.26.04 过去4小时全球AI发生了什么？

Nov 26, 2025 · 1 分钟阅读 ·

分享到:

FLUX.2图像生成与编辑模型发布 - merve
FLUX.2是一款功能强大的图像生成与编辑模型，现已发布。该模型采用单一文本编码器（Mistral Small 3.1）和DiT架构，并支持不同的量化方案，适用于推理和训练（QLoRA），在需要80GB以上显存的场景下尤其有用。FLUX.2还提供了对Diffusers的即日支持，并支持使用SAM3掩码进行图像修复和视频修复。有用户测试发现其2K分辨率版本一致性较好，甚至优于Banana模型，但在中文和提示词遵循上仍存在问题。它对设计师友好，能精准控制色值，但LLM部分在世界知识和多模态推理上不如Banana。
AI在研究领域的应用速度提升显著 - Peter H. Diamandis, MD
AI驱动的研究方法如今比传统方法快500倍，这预示着未来科研效率的巨大飞跃。同时，彼得·戴曼迪斯指出，随着人们对失业的担忧日益加剧，中小型企业和大型公司将需要引入“技能提升伙伴”，结合人类和AI来提升员工技能，这为创业者提供了巨大的商业机会。他还强调，全球32个国家最关注的问题是生活成本、失业和不平等，这些问题需要利用指数级技术来解决。
Hugging Face庆祝Genesis任务，呼吁开放科学模型和数据集 - clem 🤗
Hugging Face的Clement Delangue对Genesis任务表示祝贺，并强调美国在2017-2021年间的开放与合作是当前AI繁荣和领导地位的关键（例如Google发布Transformers助力OpenAI创建ChatGPT）。他呼吁回归这种开放协作精神，将其应用于科学、能源、机器人等AI领域，并希望未来几个月能有更多联邦机构（如美国能源部）在Hugging Face上开放模型和数据集。
关于Gen AI的过度应用和质疑 - Gary Marcus
Gary Marcus引用Emilie Syverson的观点，质疑生成式AI（Gen AI）被过度应用于各个领域，无论是否合理、有效或带来实际改进。他此前也曾发表评论，认为OpenAI被高估，且如果GPT-5在2025年底前未能取得决定性突破，OpenAI的领先地位将受损，甚至可能导致整个AI领域的热情消退。他进一步指出，人们正在逐渐意识到Google可能最终会赢得AI竞赛。
“LLM理事会”Github项目通过多模型匿名互评提升答案质量 - 向阳乔木
一个名为“LLM Council”（大模型理事会）的Github项目在短时间内获得5000多个Star。该项目由AK开发，通过一次性调用多个不同大模型，进行匿名互评和排名（根据准确性和洞见打分），以消除偏见，最终由“主席模型”综合输出质量最优的答案。其工作流程包括：并行收集各模型回答、匿名互评与排名、主席模型综合输出。
AI辅助安装部署Github开源项目 - 向阳乔木
对于不熟悉如何安装和部署开源Github应用的用户，现在可以使用Claude Code作为助手。只需向Claude Code输入：“一步步带我安装部署这个开源github项目 [Github URL]”，AI即可引导用户完成整个操作过程。Claude Code新增的Plan Mode能先生成计划文件再执行，并支持在桌面应用中同时运行多个本地和远程session。
Anthropic发布Claude Opus 4.5，性能提升且价格下调 - 歸藏(guizang.ai)
Anthropic发布了Claude Opus 4.5，其最大亮点是将价格降至原来Opus 4.1的三分之一，定价为每百万token输入$5，输出$25。Opus 4.5在编程任务基准SWE-bench Verified上排名世界第一，并在内部性能工程师入职考试中超越所有人类候选者。该模型还引入了“努力程度”（effort）参数，在medium effort模式下能用24%的输出token达到Sonnet 4.5的最佳分数，显示出更高的效率和成本节省潜力。
AI在教育领域应用的思考与教学策略建议 - Andrej Karpathy
Andrej Karpathy分享了对AI在学校中应用的看法，指出AI作业检测器注定失败，学校应假定所有课外作业都使用了AI。他建议将大部分评分工作转移到课堂内，由教师亲自监督学生完成，以激励学生在没有AI辅助的情况下学习解决问题。目标是让学生熟练使用AI，但也能在没有AI的情况下独立完成任务，这要求教学重心从课外作业转向课堂测试。
顶尖数学家陶哲轩利用AI解决经典数学问题 - 宝玉
世界顶级数学家陶哲轩在解决Erdős的第367号经典数学问题时，全程以AI作为助手。他将数学家Wouter van Doorn提出的反例草案中未完全证明的恒等式交由Google的Gemini Deepthink模式，Gemini在十分钟内给出了完整证明。随后，陶哲轩将AI的证明简化，并由Boris Alexeev使用Aristotle工具（基于AI+Lean）完成形式化证明。整个过程体现了“人类提出猜想 → AI暴力证明 → 人类简化优化 → AI辅助形式化验证”的人机协作模式。
NotebookLM辅助知识管理，从信息囤积到深度思考 - 向阳乔木
NotebookLM被赞为将“信息囤积”转化为“真正知识”的工具。用户可以将大量文章扔给它，让它总结核心观点、找出观点间的矛盾。它不再是传统意义上的笔记工具，而是通过对话和提问的方式，强制用户进行深度思考，从而实现更有效的学习。
Word2Vec核心概念：AI理解语义的关键 - 向阳乔木
Word2Vec通过将词汇定位在向量空间中，使意思相近的词位置接近。它通过分析词的上下文来学习其语义，例如“苹果”（水果）和“苹果”（公司）会有不同的向量。这种方法不依赖语言的语法规则和分词，而是通过统计模式让机器学会理解语义。Word2Vec证明了任何语言，只要有足够的数据，机器都能学会其统计模式，从而让NLP技术取得了突破性进展。
HunyuanOCR开源，腾讯多模态OCR模型发布 - merve
腾讯开源了HunyuanOCR，这是一个基于Hunyuan原生多模态架构的专业端到端OCR模型。该模型的发布预计将为OCR领域带来新的技术突破和应用可能。
Hugging Face发布电脑使用代理，支持Qwen3-VL模型 - merve
Hugging Face上周发布了一个电脑使用代理（computer use agent），该代理基于多种Qwen3-VL模型和E2B沙盒构建，用户可以要求它执行任何任务。该代理会展示每个思考步骤，并提供用户界面来尝试不同的模型。
打卡照生成工具支持双人及多人合照 - 歸藏(guizang.ai)
一款打卡照生成工具现已更新，支持生成双人以及多人合照。用户上传多人合照时，工具也会相应生成多人的合照，并已修复人像变胖的问题。
ChatGPT“购物研究”功能可能预示OpenAI的应用商店模式 - 小互
ChatGPT的“购物研究”功能实际上调用了一个应用，尽管官方称其是基于GPT 5mini专门训练的。这一现象可能意味着OpenAI正在封装更多应用，允许GPT进行调用，从而打造一个应用商店模式。
NPM蠕虫“Shai Hulud”再次活跃，窃取API密钥 - Amjad Masad
NPM蠕虫“Shai Hulud”再次活跃，并实时窃取受感染用户的API密钥和秘密，将其上传至新的GitHub仓库。这提醒开发者需警惕代码安全问题。
AI生成PPT提示词和风格指南 - 歸藏(guizang.ai)
用户分享了一个详细的AI生成PPT提示词范例，旨在根据文章为中学生制作一套“Anthropic/Claude 风格”的温暖学术人文主义设计PPT。该提示词涵盖了PPT大纲、内容规划、统一风格、背景、字体、配色、视觉元素（抽象手绘线条画、卡片布局）和图表样式，强调文字和图像均由Nano Banana Pro生成，且每页一张图。
Adobe Photoshop Chrome扩展提供12个月免费试用 - 小互
Adobe推出了Photoshop Chrome扩展，用户无需安装桌面软件即可在浏览器中编辑图片。现在下载该扩展可享受12个月免费试用Photoshop网页版，功能包括裁剪、背景移除和色彩调整等，活动有效期至2025年12月8日。
用AI生成短视频脚本和内容 - 向阳乔木
用户分享了不露脸、不剪辑，3步生成口播短视频的方法：首先用提示词生成文案脚本，然后将文案发送给Listenhub新功能“Explainer Video”，最后选择自己的声音TTS，一分钟即可生成视频。此外，还提到利用AI生成“认知偏误”主题的抖音脚本。
研究论文的“Agentic Reviewer”达到人类水平性能 - Andrew Ng
吴恩达发布了一个新的**“Agentic Reviewer”工具，旨在帮助研究人员加速论文迭代。该系统在ICLR 2025评审中进行测试，AI与人类审稿人之间的斯皮尔曼相关系数为0.42，与两位人类审稿人之间的相关系数（0.41）接近，表明AI审稿能力已接近人类水平**。该代理通过搜索arXiv来提供反馈，特别适用于AI等领域。