2025.12.23.06 过去4小时全球AI发生了什么？

Dec 23, 2025 · 1 分钟阅读 ·

分享到:

AI模型在CFA考试中表现卓越 - Peter H. Diamandis, MD
Peter Diamandis指出，AI技术发展迅速。2023年GPT-3.5未能通过CFA考试，但到了2025年，Gemini 3.0 Pro已能取得97.6%的成绩，而GPT-5在二级考试中也达到了94.3%。目前已有五款AI模型能够通过CFA所有三个级别的考试，显示出AI在复杂金融领域推理能力的显著提升。
GLM 4.7发布，在多任务上超越现有模型 - merve
GLM 4.7已正式发布，被誉为开放前沿模型领域的一大飞跃。该模型在编码、复杂推理和工具使用方面取得了实质性改进，超越了DeepSeek V3.2，并在多项任务中表现优于部分闭源模型。目前，BF16和FP8检查点已可通过HuggingFace Transformers和推理服务提供商获取。
AI提示词工程的快速演进 - 歸藏(guizang.ai)
一位用户惊喜地发现，不到十个月前用于Claude生成小红书封面前端的提示词，现在在Nano Banana Pro上依然有效。这体现了AI技术发展的飞速，以及提示词工程在不同AI模型间的良好兼容性和持续有效性。
AI时代认识论面临的实践问题 - sarah guo
Sarah Guo探讨了AI时代下知识获取的挑战。她指出，当AI能够自信、连贯且详细地生成信息时，这些“知识”的来源和可靠性成为关键问题，因为表面上的信心和连贯性不再意味着与真实世界的接触。她呼吁在AI时代加强对认识论的研究，关注信息来源、明确不确定性并加速验证流程。
“Vibe Coding”的兴起及其行业痛点 - 宝玉
《A Year Of Vibes》一文指出，资深工程师Armin Ronacher描述了2025年编程工作模式的转变，即从“亲自敲键盘”到“指挥AI写代码”。这种“Vibe Coding”模式使得程序员凭直觉选择AI工具，而非传统工程经验，引发了版本控制（Prompt缺失）、代码审查（人机协作）、可观测性等深层行业问题，并探讨了人与AI之间可能形成的“单向亲密感”。
Vibe Coding教程的难点在于传统软件工程知识 - 宝玉
Vibe Coding的教学面临一大挑战：核心不在于教授AI，而在于巩固传统编码和软件工程知识。如果缺乏合理拆分任务、验证结果和调试问题的能力，即使是简单的提示词编写也难以有效，因为这些基础技能对于成功运用AI辅助编程至关重要。
民意调查显示美国民众对未来持悲观态度 - Peter H. Diamandis, MD
2025年12月11日的一项皮尤调查显示，45%的美国成年人选择生活在过去，而只有14%选择未来。Peter Diamandis对此表示不解，并批评这种“怀旧偏见”，强调与一百年前相比，现代生活在电力、电话普及率和平均寿命等方面都有显著进步，过去的条件远不如现在。
小米MiMo论文揭示AI前端开发能力提升的关键 - 宝玉
小米MiMo论文阐释了AI在前端开发领域能力显著提升的原因。其核心在于引入了基于视觉的验证器，通过评估录制的视频片段来综合考量视觉质量、功能准确性和可执行性。这种机制确保了奖励系统能够同时兼顾代码的外观表现和实际功能，从而有效训练AI生成高质量的前端代码。
PromptFill：提示词填空器简化AI绘画创作 - 小互
小互推荐了开源工具PromptFill，一款“提示词填空器”，旨在通过可视化、填空式交互简化AI绘画的提示词创作。该工具将Prompt拆解为变量，用户只需点选、拖拽和填空，即可自动生成结构化的完美提示词，避免记忆关键词和格式问题，并支持一键导出图像或文本，同时支持本地部署和文本编辑。
AI产品中ARR比DAU更具本质性 - Orange AI
Orange AI讨论了AI产品衡量标准的变化，认为相对于日活跃用户（DAU），年度经常性收入（ARR）更为重要。与传统互联网产品需要大量DAU才能盈利不同，当前的AI产品即使DAU较低，也能通过赋能“超级个体”创造可观收入，足以支撑小型团队，从而避免了“百团大战”式的竞争。
Replit宣布2026年夏季Vibecon大会 - Amjad Masad
Replit创始人Amjad Masad宣布，Vibecon大会将于2026年夏季在纽约市举行，并邀请感兴趣的用户申请邀请。此举预示着Replit社区将迎来一场重要的技术交流活动。
HuggingFace上发布多模态SOTA模型Molmo 2和SAGE-MM - merve
merve转发消息称，AI2的最新SOTA多模态模型Molmo 2和Allen AI的SAGE-MM模型演示版已在HuggingFace上发布。Molmo 2支持多图像推理，而SAGE-MM是用于长视频推理的智能任意视界智能体，这些模型的发布进一步推动了AI在处理复杂多模态数据方面的能力。
开源聊天机器人在动漫图像转换速度上超越ChatGPT - merve
merve转发了一条推文，展示了一个100%开源的聊天机器人在将图像转换为动漫风格方面，比ChatGPT快得多。这表明开源AI在特定图像处理任务上已展现出强大的竞争力，甚至可能在速度上超越了主流闭源模型。
Emad对AI在数学证明中的作用的看法 - Emad
Emad表示，他认为目前AI自动进行数学证明的意义并不太大。他更感兴趣的是如何利用AI来激发像拉马努金那样的直觉和灵感。他建议将复杂的证明工作留给GPU，而人类则专注于探索和发挥创造力。