2025.12.23.12 过去4小时全球AI发生了什么?
智谱AI发布GLM-4.7:性能逼近顶尖模型,引入三层思考模式-mervenoyann & 小互 智谱AI正式发布了其最新一代开放前沿模型GLM-4.7,该模型在编码、复杂推理和工具使用方面取得了显著进步,超越了DeepSeek V3.2,并与GPT-5和Claude 4.5等顶尖封闭模型表现相当。GLM-4.7引入了创新的“三层思考模式”,能够在生成答案前进行内部推理、制定路径并预测障碍,并在多轮对话中记住思考过程。特别在编程任务中,其性能达到Claude Code的90%,但成本仅为其1/7,配额却是3倍,凸显了其高性价比。此外,GLM-4.7在前端审美方面大幅提升,能生成更具设计感的网页、幻灯片和海报。
“Vibe Coding”成为2025年AI编程新趋势,带来挑战与机遇-宝玉 资深工程师Armin Ronacher(Flask框架作者)在文章《A Year Of Vibes》中总结了2025年AI编程领域的“Vibe Coding”趋势。他指出,程序员的角色正从“亲自敲键盘”转变为“指挥AI写代码”,并主要依据对AI工具的“感觉”或“氛围”来选择。这一趋势带来了多重挑战,包括传统软件工程规范的失效、开发者对AI工具产生“单向亲密感”(parasocial bond),以及AI代码的版本控制(Prompt追踪)、代码审查和失败记忆保存等未解决的技术痛点。文章强调,有效的Vibe Coding仍需深厚的软件工程知识,而提示词编写仅是其中最简单的部分。
AI基准测试面临枯竭:顶级模型CFA考试表现显著提升-Peter H. Diamandis, MD AI模型能力的飞速发展正导致传统基准测试的效用不足。数据显示,在2023年GPT-3.5未能通过CFA考试,但到了2025年,Gemini 3.0 Pro在CFA考试中取得了97.6%的高分,而GPT-5则以94.3%的成绩通过了Level II。目前已有五款模型能够通过CFA所有三个级别的考试,这标志着AI在复杂专业知识领域的学习和应用能力取得了巨大突破。
Replit与ChatGPT实现官方集成,支持直接启动应用构建-Amjad Masad 代码协作平台Replit已正式作为一款应用集成到ChatGPT中。这意味着用户现在可以直接在ChatGPT对话界面中启动和管理应用程序的构建过程,极大地简化了从构思到实现的开发流程,提升了人机协作的效率。
Hugging Face成为AI职业加速器,谷歌开放模型发布提振社区-ClementDelangue Hugging Face被誉为AI领域的强大职业加速器,其团队成员备受OpenAI等主要AI公司青睐。同时,谷歌通过Hugging Face发布了一系列开放模型,覆盖智能体构建、医疗应用等多个领域,进一步巩固了Hugging Face在开源AI社区的核心地位,也预示着开源AI人才和技术交流的活跃。
AI时代知识论的实用挑战:从“似是而非的废话”中获取价值-sarah guo 面对AI能够按需草拟、解释和提出解决方案的能力,一个关键的生产力问题是如何将AI生成的“似是而非的废话”转化为实际工作。随着“认知姿态”(自信、连贯、细节)通过AI变得易于制造,其不再必然代表对底层事实的真实掌握。这要求实践者需调整,强调溯源、明确不确定性及快速验证。在AI时代,知识论(Epistemology)成为一个高度实际的问题,探讨如何从这种新型“知识”中获取有效杠杆。
AI数学研究新视角:重在激发人类直觉与灵感-Emad 在人工智能辅助数学研究的背景下,自动数学证明的意义被重新审视。Emad提出,最有趣的应用并非让AI自动完成证明,而是如何利用AI来激发和增强人类的直觉和灵感,就像数学家Srinivasa Ramanujan那样。他建议,人类应专注于探索和创造,而将繁重的计算和证明工作交给GPU等AI工具处理。
ChatGPT年度使用报告:手机客户端独享新功能-小互 ChatGPT用户现在可以通过在手机客户端中发送指令“show me my year with ChatGPT”来获取其年度使用报告。该功能目前仅支持手机客户端,网页版不可用,且在部分国家或地区可能因网络限制而无法访问。
AI创意工具与风格演进:前端提示词展现跨模型通用性-歸藏(guizang.ai) AI在创意和设计领域的应用持续演进,例如生成“流动科技蓝风格”和“极简格栅主义”的封面。令人惊喜的是,曾用于Claude模型的小红书封面前端提示词,在不到十个月的时间里,依然能在Nano Banana Pro等新AI工具上有效复用,这反映了AI在处理审美和生成特定风格方面能力的快速发展与一定程度的通用性。