2025.11.26.04 过去4小时全球AI发生了什么?

  1. FLUX.2图像生成与编辑模型发布 - merve

    FLUX.2是一款功能强大的图像生成与编辑模型,现已发布。该模型采用单一文本编码器(Mistral Small 3.1)和DiT架构,并支持不同的量化方案,适用于推理和训练(QLoRA),在需要80GB以上显存的场景下尤其有用。FLUX.2还提供了对Diffusers的即日支持,并支持使用SAM3掩码进行图像修复和视频修复。有用户测试发现其2K分辨率版本一致性较好,甚至优于Banana模型,但在中文和提示词遵循上仍存在问题。它对设计师友好,能精准控制色值,但LLM部分在世界知识和多模态推理上不如Banana。

  2. AI在研究领域的应用速度提升显著 - Peter H. Diamandis, MD

    AI驱动的研究方法如今比传统方法快500倍,这预示着未来科研效率的巨大飞跃。同时,彼得·戴曼迪斯指出,随着人们对失业的担忧日益加剧,中小型企业和大型公司将需要引入“技能提升伙伴”,结合人类和AI来提升员工技能,这为创业者提供了巨大的商业机会。他还强调,全球32个国家最关注的问题是生活成本、失业和不平等,这些问题需要利用指数级技术来解决。

  3. Hugging Face庆祝Genesis任务,呼吁开放科学模型和数据集 - clem 🤗

    Hugging Face的Clement Delangue对Genesis任务表示祝贺,并强调美国在2017-2021年间的开放与合作是当前AI繁荣和领导地位的关键(例如Google发布Transformers助力OpenAI创建ChatGPT)。他呼吁回归这种开放协作精神,将其应用于科学、能源、机器人等AI领域,并希望未来几个月能有更多联邦机构(如美国能源部)在Hugging Face上开放模型和数据集。

  4. 关于Gen AI的过度应用和质疑 - Gary Marcus

    Gary Marcus引用Emilie Syverson的观点,质疑生成式AI(Gen AI)被过度应用于各个领域,无论是否合理、有效或带来实际改进。他此前也曾发表评论,认为OpenAI被高估,且如果GPT-5在2025年底前未能取得决定性突破,OpenAI的领先地位将受损,甚至可能导致整个AI领域的热情消退。他进一步指出,人们正在逐渐意识到Google可能最终会赢得AI竞赛。

  5. “LLM理事会”Github项目通过多模型匿名互评提升答案质量 - 向阳乔木

    一个名为“LLM Council”(大模型理事会)的Github项目在短时间内获得5000多个Star。该项目由AK开发,通过一次性调用多个不同大模型,进行匿名互评和排名(根据准确性和洞见打分),以消除偏见,最终由“主席模型”综合输出质量最优的答案。其工作流程包括:并行收集各模型回答、匿名互评与排名、主席模型综合输出。

  6. AI辅助安装部署Github开源项目 - 向阳乔木

    对于不熟悉如何安装和部署开源Github应用的用户,现在可以使用Claude Code作为助手。只需向Claude Code输入:“一步步带我安装部署这个开源github项目 [Github URL]”,AI即可引导用户完成整个操作过程。Claude Code新增的Plan Mode能先生成计划文件再执行,并支持在桌面应用中同时运行多个本地和远程session。

  7. Anthropic发布Claude Opus 4.5,性能提升且价格下调 - 歸藏(guizang.ai)

    Anthropic发布了Claude Opus 4.5,其最大亮点是将价格降至原来Opus 4.1的三分之一,定价为每百万token输入$5,输出$25。Opus 4.5在编程任务基准SWE-bench Verified上排名世界第一,并在内部性能工程师入职考试中超越所有人类候选者。该模型还引入了“努力程度”(effort)参数,在medium effort模式下能用24%的输出token达到Sonnet 4.5的最佳分数,显示出更高的效率和成本节省潜力。

  8. AI在教育领域应用的思考与教学策略建议 - Andrej Karpathy

    Andrej Karpathy分享了对AI在学校中应用的看法,指出AI作业检测器注定失败,学校应假定所有课外作业都使用了AI。他建议将大部分评分工作转移到课堂内,由教师亲自监督学生完成,以激励学生在没有AI辅助的情况下学习解决问题。目标是让学生熟练使用AI,但也能在没有AI的情况下独立完成任务,这要求教学重心从课外作业转向课堂测试。

  9. 顶尖数学家陶哲轩利用AI解决经典数学问题 - 宝玉

    世界顶级数学家陶哲轩在解决Erdős的第367号经典数学问题时,全程以AI作为助手。他将数学家Wouter van Doorn提出的反例草案中未完全证明的恒等式交由Google的Gemini Deepthink模式,Gemini在十分钟内给出了完整证明。随后,陶哲轩将AI的证明简化,并由Boris Alexeev使用Aristotle工具(基于AI+Lean)完成形式化证明。整个过程体现了“人类提出猜想 → AI暴力证明 → 人类简化优化 → AI辅助形式化验证”的人机协作模式

  10. NotebookLM辅助知识管理,从信息囤积到深度思考 - 向阳乔木

    NotebookLM被赞为将“信息囤积”转化为“真正知识”的工具。用户可以将大量文章扔给它,让它总结核心观点、找出观点间的矛盾。它不再是传统意义上的笔记工具,而是通过对话和提问的方式,强制用户进行深度思考,从而实现更有效的学习。

  11. Word2Vec核心概念:AI理解语义的关键 - 向阳乔木

    Word2Vec通过将词汇定位在向量空间中,使意思相近的词位置接近。它通过分析词的上下文来学习其语义,例如“苹果”(水果)和“苹果”(公司)会有不同的向量。这种方法不依赖语言的语法规则和分词,而是通过统计模式让机器学会理解语义。Word2Vec证明了任何语言,只要有足够的数据,机器都能学会其统计模式,从而让NLP技术取得了突破性进展。

  12. HunyuanOCR开源,腾讯多模态OCR模型发布 - merve

    腾讯开源了HunyuanOCR,这是一个基于Hunyuan原生多模态架构的专业端到端OCR模型。该模型的发布预计将为OCR领域带来新的技术突破和应用可能。

  13. Hugging Face发布电脑使用代理,支持Qwen3-VL模型 - merve

    Hugging Face上周发布了一个电脑使用代理(computer use agent),该代理基于多种Qwen3-VL模型和E2B沙盒构建,用户可以要求它执行任何任务。该代理会展示每个思考步骤,并提供用户界面来尝试不同的模型。

  14. 打卡照生成工具支持双人及多人合照 - 歸藏(guizang.ai)

    一款打卡照生成工具现已更新,支持生成双人以及多人合照。用户上传多人合照时,工具也会相应生成多人的合照,并已修复人像变胖的问题。

  15. ChatGPT“购物研究”功能可能预示OpenAI的应用商店模式 - 小互

    ChatGPT的“购物研究”功能实际上调用了一个应用,尽管官方称其是基于GPT 5mini专门训练的。这一现象可能意味着OpenAI正在封装更多应用,允许GPT进行调用,从而打造一个应用商店模式

  16. NPM蠕虫“Shai Hulud”再次活跃,窃取API密钥 - Amjad Masad

    NPM蠕虫“Shai Hulud”再次活跃,并实时窃取受感染用户的API密钥和秘密,将其上传至新的GitHub仓库。这提醒开发者需警惕代码安全问题。

  17. AI生成PPT提示词和风格指南 - 歸藏(guizang.ai)

    用户分享了一个详细的AI生成PPT提示词范例,旨在根据文章为中学生制作一套“Anthropic/Claude 风格”的温暖学术人文主义设计PPT。该提示词涵盖了PPT大纲、内容规划、统一风格、背景、字体、配色、视觉元素(抽象手绘线条画、卡片布局)和图表样式,强调文字和图像均由Nano Banana Pro生成,且每页一张图。

  18. Adobe Photoshop Chrome扩展提供12个月免费试用 - 小互

    Adobe推出了Photoshop Chrome扩展,用户无需安装桌面软件即可在浏览器中编辑图片。现在下载该扩展可享受12个月免费试用Photoshop网页版,功能包括裁剪、背景移除和色彩调整等,活动有效期至2025年12月8日。

  19. 用AI生成短视频脚本和内容 - 向阳乔木

    用户分享了不露脸、不剪辑,3步生成口播短视频的方法:首先用提示词生成文案脚本,然后将文案发送给Listenhub新功能“Explainer Video”,最后选择自己的声音TTS,一分钟即可生成视频。此外,还提到利用AI生成“认知偏误”主题的抖音脚本。

  20. 研究论文的“Agentic Reviewer”达到人类水平性能 - Andrew Ng

    吴恩达发布了一个新的**“Agentic Reviewer”工具,旨在帮助研究人员加速论文迭代。该系统在ICLR 2025评审中进行测试,AI与人类审稿人之间的斯皮尔曼相关系数为0.42,与两位人类审稿人之间的相关系数(0.41)接近,表明AI审稿能力已接近人类水平**。该代理通过搜索arXiv来提供反馈,特别适用于AI等领域。