2025.12.23.06 过去4小时全球AI发生了什么?

  1. AI模型在CFA考试中表现卓越 - Peter H. Diamandis, MD

    Peter Diamandis指出,AI技术发展迅速。2023年GPT-3.5未能通过CFA考试,但到了2025年,Gemini 3.0 Pro已能取得97.6%的成绩,而GPT-5在二级考试中也达到了94.3%。目前已有五款AI模型能够通过CFA所有三个级别的考试,显示出AI在复杂金融领域推理能力的显著提升。

  2. GLM 4.7发布,在多任务上超越现有模型 - merve

    GLM 4.7已正式发布,被誉为开放前沿模型领域的一大飞跃。该模型在编码、复杂推理和工具使用方面取得了实质性改进,超越了DeepSeek V3.2,并在多项任务中表现优于部分闭源模型。目前,BF16和FP8检查点已可通过HuggingFace Transformers和推理服务提供商获取。

  3. AI提示词工程的快速演进 - 歸藏(guizang.ai)

    一位用户惊喜地发现,不到十个月前用于Claude生成小红书封面前端的提示词,现在在Nano Banana Pro上依然有效。这体现了AI技术发展的飞速,以及提示词工程在不同AI模型间的良好兼容性和持续有效性。

  4. AI时代认识论面临的实践问题 - sarah guo

    Sarah Guo探讨了AI时代下知识获取的挑战。她指出,当AI能够自信、连贯且详细地生成信息时,这些“知识”的来源和可靠性成为关键问题,因为表面上的信心和连贯性不再意味着与真实世界的接触。她呼吁在AI时代加强对认识论的研究,关注信息来源、明确不确定性并加速验证流程。

  5. “Vibe Coding”的兴起及其行业痛点 - 宝玉

    《A Year Of Vibes》一文指出,资深工程师Armin Ronacher描述了2025年编程工作模式的转变,即从“亲自敲键盘”到“指挥AI写代码”。这种“Vibe Coding”模式使得程序员凭直觉选择AI工具,而非传统工程经验,引发了版本控制(Prompt缺失)、代码审查(人机协作)、可观测性等深层行业问题,并探讨了人与AI之间可能形成的“单向亲密感”。

  6. Vibe Coding教程的难点在于传统软件工程知识 - 宝玉

    Vibe Coding的教学面临一大挑战:核心不在于教授AI,而在于巩固传统编码和软件工程知识。如果缺乏合理拆分任务、验证结果和调试问题的能力,即使是简单的提示词编写也难以有效,因为这些基础技能对于成功运用AI辅助编程至关重要。

  7. 民意调查显示美国民众对未来持悲观态度 - Peter H. Diamandis, MD

    2025年12月11日的一项皮尤调查显示,45%的美国成年人选择生活在过去,而只有14%选择未来。Peter Diamandis对此表示不解,并批评这种“怀旧偏见”,强调与一百年前相比,现代生活在电力、电话普及率和平均寿命等方面都有显著进步,过去的条件远不如现在。

  8. 小米MiMo论文揭示AI前端开发能力提升的关键 - 宝玉

    小米MiMo论文阐释了AI在前端开发领域能力显著提升的原因。其核心在于引入了基于视觉的验证器,通过评估录制的视频片段来综合考量视觉质量、功能准确性和可执行性。这种机制确保了奖励系统能够同时兼顾代码的外观表现和实际功能,从而有效训练AI生成高质量的前端代码。

  9. PromptFill:提示词填空器简化AI绘画创作 - 小互

    小互推荐了开源工具PromptFill,一款“提示词填空器”,旨在通过可视化、填空式交互简化AI绘画的提示词创作。该工具将Prompt拆解为变量,用户只需点选、拖拽和填空,即可自动生成结构化的完美提示词,避免记忆关键词和格式问题,并支持一键导出图像或文本,同时支持本地部署和文本编辑。

  10. AI产品中ARR比DAU更具本质性 - Orange AI

    Orange AI讨论了AI产品衡量标准的变化,认为相对于日活跃用户(DAU),年度经常性收入(ARR)更为重要。与传统互联网产品需要大量DAU才能盈利不同,当前的AI产品即使DAU较低,也能通过赋能“超级个体”创造可观收入,足以支撑小型团队,从而避免了“百团大战”式的竞争。

  11. Replit宣布2026年夏季Vibecon大会 - Amjad Masad

    Replit创始人Amjad Masad宣布,Vibecon大会将于2026年夏季在纽约市举行,并邀请感兴趣的用户申请邀请。此举预示着Replit社区将迎来一场重要的技术交流活动。

  12. HuggingFace上发布多模态SOTA模型Molmo 2和SAGE-MM - merve

    merve转发消息称,AI2的最新SOTA多模态模型Molmo 2和Allen AI的SAGE-MM模型演示版已在HuggingFace上发布。Molmo 2支持多图像推理,而SAGE-MM是用于长视频推理的智能任意视界智能体,这些模型的发布进一步推动了AI在处理复杂多模态数据方面的能力。

  13. 开源聊天机器人在动漫图像转换速度上超越ChatGPT - merve

    merve转发了一条推文,展示了一个100%开源的聊天机器人在将图像转换为动漫风格方面,比ChatGPT快得多。这表明开源AI在特定图像处理任务上已展现出强大的竞争力,甚至可能在速度上超越了主流闭源模型。

  14. Emad对AI在数学证明中的作用的看法 - Emad

    Emad表示,他认为目前AI自动进行数学证明的意义并不太大。他更感兴趣的是如何利用AI来激发像拉马努金那样的直觉和灵感。他建议将复杂的证明工作留给GPU,而人类则专注于探索和发挥创造力。