2025.11.01.04 过去4小时全球AI发生了什么?
以下是过去4小时全球AI领域的动态汇总:
Hugging Face发布214页的LLM训练手册《The Smol Training Playbook》- clem 🤗
Hugging Face发布了一份长达214页的**《The Smol Training Playbook》**,这份详细的指南被誉为LLM训练的“大师级课程”。该手册深入探讨了如何训练大型语言模型(LLMs),为开发者和研究人员提供了全面的资源和最佳实践,有望进一步降低LLM开发的门槛,推动开源AI社区的发展。
NVIDIA推出新的Nemotron RAG模型系列,包含多模态检索器- merve
NVIDIA发布了全新的Nemotron RAG模型家族,这其中包括了文本检索器、多模态检索器(支持图像-文本-音频)以及布局检测器。这些模型均具备商业许可,极大地扩展了检索增强生成(RAG)系统的应用范围,尤其是在处理复杂多模态数据时展现出强大潜力,为开发者提供了更灵活的AI解决方案。
开发AI Agent比想象中简单:使用CrewAI框架与Nextjs,10分钟完成基础开发- 向阳乔木
有开发者分享经验称,构建AI Agent的复杂性远低于预期。通过结合CrewAI框架和Nextjs,仅需10分钟即可完成基本需求的开发。这一发现表明,AI Agent的开发正变得日益模块化和易于上手,降低了技术门槛,使得更多人能够快速进入AI Agent的构建和迭代优化阶段。
“即梦”与ChatGPT Atlas探索页揭示有趣的生图提示词和风格选项- 向阳乔木
通过探索如“即梦”和ChatGPT Atlas等平台的图片生成页面,用户能够发现大量有趣且实用的生图提示词和风格选项,例如“戏剧化肖像”和“填色画册”。这些直观的工具和丰富的提示词资源,极大地促进了用户对AI图像生成技术的理解和应用,同时也是学习提示词工程的宝贵途径。
知名内容创作者PewDiePie构建10块4090显卡平台,用于本地运行和微调LLM- clem 🤗
YouTube知名内容创作者PewDiePie被发现已构建了一个搭载10块4090显卡的强大工作站,用于在本地运行Llama 70B、gpt-oss-120B和Qwen 245B等大型语言模型,并进行微调。这一现象预示着AI技术正逐渐从云端集中化走向个人化和去中心化,个人用户也开始有能力驾驭强大的AI模型。
Gary Marcus指出LLM在遵循安全护栏方面的固有挑战和不可预测性- Gary Marcus
著名AI研究者Gary Marcus强调,问题并非出在特定公司,而是LLMs本身。他指出,目前没有人知道如何可靠地指示LLMs遵循安全护栏,任何试图这样做的努力都可能导致一系列不同的、不可预测的意外后果。这凸显了当前LLM在可靠性和安全性方面仍面临着根本性的挑战。
Gary Marcus重申2019年著作观点:AI需超越统计和模式匹配,构建世界模型- Gary Marcus
Gary Marcus再次引用其2019年出版的《Rebooting AI》一书中的观点,强调了统计和模式匹配的局限性,并指出AI迫切需要世界模型(world models)。他认为,六年来AI领域的发展验证了这一预判,即仅依靠数据驱动的AI模型在理解世界和进行可靠推理方面存在根本性缺陷。
Peter Diamandis认为我们可能已身处技术奇点之中,只是感受其连续性- Peter H. Diamandis, MD
未来学家Peter H. Diamandis博士提出一个引人深思的观点:我们可能已经置身于技术奇点之中,只是其发展过程呈现出连续性,而非突然的爆发。他认为,如果将当前的技术进步冻结,仅是将过去两年内的发明投入实际运作,也需要数十年才能完全实现其潜力,这反映了技术发展速度的指数级增长。