2025.12.28.16 过去4小时全球AI发生了什么?

  1. Claude Code AI编程工具的惊人进展与产品哲学-宝玉

    Claude Code创始人Boris Cherny透露,AI编程工具在过去一个月取得了惊人进展,由Claude Code和Opus 4.5模型独立完成了259个PR和497次提交,代码变动近8万行,且AI能连续运行数天。Cherny指出,软件开发的瓶颈正从“执行”转向“思考”。知名AI专家Andrej Karpathy也分享了使用Claude Code成功接入并控制Lutron智能家居系统的案例,展现了其在自动化领域的强大能力。此外,Claude Code Now v1.6.1版本为追求“极致简单”,移除API切换器功能,专注于3秒内启动Claude Code,强调产品核心价值。

  2. VSCode 更名为“开源人工智能代码编辑器”-宝玉

    知名代码编辑器VSCode已正式更名为“开源人工智能代码编辑器”(The open source AI code editor),此举反映了其日益增长的AI集成能力。VSCode目前内置了多项AI相关原生功能,包括智能代码自动补全、AI辅助的代码修改确认等,旨在提升开发者的编码效率与体验,标志着AI在软件开发工具领域的主导地位进一步确立。

  3. Huggingface 12月热门论文显示中国开源模型崛起-向阳乔木

    据Huggingface论文频道显示,2025年12月的热门论文榜单中,来自中国的各种开源模型论文占据了显著份额。这一现象表明中国在开源AI模型研究和发展方面的活跃度和影响力正在迅速提升,成为全球人工智能领域不可忽视的重要力量。

  4. ezff: 用自然语言处理视频的命令行工具-向阳乔木

    一款名为ezff的命令行工具发布,旨在简化复杂的FFmpeg视频处理操作。用户只需通过简单的自然语言指令,如“ff convert video.mp4 to gif”或“ff speed up video.mp4 by 2x”,即可实现视频格式转换、压缩、分辨率调整、倍速调整及音频提取等功能。该工具的便捷性大幅降低了视频处理门槛。此外,ezff已被集成到Claude Code中作为一项“skill”,使得用户能够利用AI的自然语言理解能力,更高效地处理视频内容,例如自动添加配乐或截图。

  5. 用于Vibe Coding的百万网站截图网站-向阳乔木

    发现一个独特网站,其背景由一百万个网站截图组成,用户可以随机浏览或通过搜索功能查找特定网站的截图。这个平台被推荐为进行“Vibe Coding”的理想资源,开发者可以从中获取灵感,模仿和学习成熟且美观的网站设计风格,从而提升自身项目的视觉效果和用户体验。

  6. Gemini 对网络恶俗梗的伦理评价-宝玉

    谷歌的AI模型Gemini对一个流传的网络恶俗梗进行了伦理评估,并将其定义为“充满刻板印象、职业歧视、厌女色彩的叙事链”。Gemini进一步指出,该梗是典型的“物化女性”与“职业地图炮”相结合的产物。这一事件凸显了AI在内容审查和伦理判断方面的能力,以及其在识别和批判网络不当言论中的潜在作用。

  7. Dify 在2025年圣诞节GitHub Stars超越LangChain-Orange AI

    在2025年圣诞节,Dify在GitHub上的Stars数量成功超越了LangChain,标志着该项目发展历程中的一个重要里程碑。Dify最初被贴上“中国的LangChain”或“开源的Coze”等标签,但其创始人强调,Dify致力于构建独特的、超越简单类比的世界级开源项目。这一成就不仅展示了Dify在全球开源社区日益增长的影响力,也反映了其在AI应用开发领域的创新和领导地位。

  8. GLM 4.7 被认为是开源模型的质变时刻-Orange AI

    GLM 4.7被业界视为开源模型发展的一个“质变时刻”。这一版本的推出,有力证明了智谱AI所采用的RLVR(Reinforcement Learning from Very Relevant feedbacks)方法已经完全成熟并成功突破了传统的蒸馏能力限制。尽管智谱AI近期可能因上市事务而未充分宣传此项成就,但分析人士预测,GLM 5.0的发布有望在开源AI领域产生类似DeepSeek R1的重大影响,尤其是在DeepSeek R2尚未问世之前,GLM系列模型有望继续引领创新。

  9. Google 未能率先发布类ChatGPT产品的回顾-宝玉

    一篇回顾指出,Google早在2020年就开发出了一个在内部8万员工中广受欢迎的聊天机器人,但因公司对搜索产品“准确性”的执着,认为该机器人“会胡说八道”而未对外发布。Google当时未能预见用户对聊天机器人除事实查询外的多样化需求,如协助写作、总结和编写脚本等,这些场景并不需要100%的准确性。在2022年ChatGPT发布后,Google的Jeff Dean反思公司大模型团队过于分散,随后推动了Brain和DeepMind的合并,集中资源全力发展Gemini项目,以应对市场变化。

  10. 深度学习三巨头Hinton和Google Jeff Dean的对话与20年展望-宝玉

    一则报道回顾了深度学习领域的历史时刻,包括2012年NeurIPS会议前,Geoffrey Hinton及其两位学生Ilya Sutskever(OpenAI联合创始人)和Alex Krizhevsky(AlexNet开发者)被Google收购,奠定“深度学习三巨头”地位的事件。文章还提及了Hinton与Google的Jeff Dean之间的一段对话。Hinton问及Google是否后悔发表Transformer论文,Dean回应不后悔,认为其“对世界有好处”。在展望未来20年的世界时,Dean描绘了AI在上下文理解、硬件效率、科学发现及教育医疗领域的巨大潜力。Hinton则以一句警示意味浓厚的话作结:“要么我们从此幸福地生活在一起,要么我们全都死了”,引人深思。

  11. 将文章、故事转化为漫画脚本的提示词参考-宝玉

    一份详细的提示词参考被分享,旨在指导AI将文章或故事转化为多页原创知识传记漫画的脚本。这份指南涵盖了视觉风格的定义,包括Hergé《丁丁历险记》般的清晰线条(Ligne Claire)、分层色彩叙事以及打破第四面墙的“旁白者”角色。它还详细要求了封面设计的学术厚重感和视觉吸引力、页面布局的分镜数量与构图、视觉细节的生动描绘,包括角色姿态、场景光影、镜头角度,以及抽象科学概念的具体可视化方法。此外,提示词强调了叙事结构的非线性安排和对话文字的设计规范,旨在为AI生成高质量漫画图像提供精确指令。