2025.11.01.04 过去4小时全球AI发生了什么？

Nov 1, 2025 · 1 分钟阅读 ·

分享到:

以下是过去4小时全球AI领域的动态汇总：

Hugging Face发布214页的LLM训练手册《The Smol Training Playbook》- clem 🤗
Hugging Face发布了一份长达214页的**《The Smol Training Playbook》**，这份详细的指南被誉为LLM训练的“大师级课程”。该手册深入探讨了如何训练大型语言模型（LLMs），为开发者和研究人员提供了全面的资源和最佳实践，有望进一步降低LLM开发的门槛，推动开源AI社区的发展。
NVIDIA推出新的Nemotron RAG模型系列，包含多模态检索器- merve
NVIDIA发布了全新的Nemotron RAG模型家族，这其中包括了文本检索器、多模态检索器（支持图像-文本-音频）以及布局检测器。这些模型均具备商业许可，极大地扩展了检索增强生成（RAG）系统的应用范围，尤其是在处理复杂多模态数据时展现出强大潜力，为开发者提供了更灵活的AI解决方案。
开发AI Agent比想象中简单：使用CrewAI框架与Nextjs，10分钟完成基础开发- 向阳乔木
有开发者分享经验称，构建AI Agent的复杂性远低于预期。通过结合CrewAI框架和Nextjs，仅需10分钟即可完成基本需求的开发。这一发现表明，AI Agent的开发正变得日益模块化和易于上手，降低了技术门槛，使得更多人能够快速进入AI Agent的构建和迭代优化阶段。
“即梦”与ChatGPT Atlas探索页揭示有趣的生图提示词和风格选项- 向阳乔木
通过探索如“即梦”和ChatGPT Atlas等平台的图片生成页面，用户能够发现大量有趣且实用的生图提示词和风格选项，例如“戏剧化肖像”和“填色画册”。这些直观的工具和丰富的提示词资源，极大地促进了用户对AI图像生成技术的理解和应用，同时也是学习提示词工程的宝贵途径。
知名内容创作者PewDiePie构建10块4090显卡平台，用于本地运行和微调LLM- clem 🤗
YouTube知名内容创作者PewDiePie被发现已构建了一个搭载10块4090显卡的强大工作站，用于在本地运行Llama 70B、gpt-oss-120B和Qwen 245B等大型语言模型，并进行微调。这一现象预示着AI技术正逐渐从云端集中化走向个人化和去中心化，个人用户也开始有能力驾驭强大的AI模型。
Gary Marcus指出LLM在遵循安全护栏方面的固有挑战和不可预测性- Gary Marcus
著名AI研究者Gary Marcus强调，问题并非出在特定公司，而是LLMs本身。他指出，目前没有人知道如何可靠地指示LLMs遵循安全护栏，任何试图这样做的努力都可能导致一系列不同的、不可预测的意外后果。这凸显了当前LLM在可靠性和安全性方面仍面临着根本性的挑战。
Gary Marcus重申2019年著作观点：AI需超越统计和模式匹配，构建世界模型- Gary Marcus
Gary Marcus再次引用其2019年出版的《Rebooting AI》一书中的观点，强调了统计和模式匹配的局限性，并指出AI迫切需要世界模型（world models）。他认为，六年来AI领域的发展验证了这一预判，即仅依靠数据驱动的AI模型在理解世界和进行可靠推理方面存在根本性缺陷。
Peter Diamandis认为我们可能已身处技术奇点之中，只是感受其连续性- Peter H. Diamandis, MD
未来学家Peter H. Diamandis博士提出一个引人深思的观点：我们可能已经置身于技术奇点之中，只是其发展过程呈现出连续性，而非突然的爆发。他认为，如果将当前的技术进步冻结，仅是将过去两年内的发明投入实际运作，也需要数十年才能完全实现其潜力，这反映了技术发展速度的指数级增长。