2025.12.05.00 过去4小时全球AI发生了什么?
过去4小时全球AI动态一览
以下是过去4小时内全球AI领域的重要进展和热点讨论:
Andrew Ng 推出新课程:使用工具执行构建编码智能体-Andrew Ng
深度学习专家 Andrew Ng 宣布推出一门名为“使用工具执行构建编码智能体”的新课程,由 E2B 的 @tereza_tizkova 和 @FraZuppichini 教授。这门短期课程旨在教授学员如何构建能够编写和执行代码来完成任务的 AI 智能体,从而能够访问完整的编程语言生态系统,而不是局限于固定的工具集。学员将学习在沙盒云环境中安全运行智能体生成的代码,并掌握构建数据分析智能体(使用 Pandas 探索和可视化数据)和全栈智能体(构建完整的 Next.js Web 应用程序)的技能。
Mistral AI 发布多模态模型 Ministral 3-merve
@MistralAI 发布了其全新的 Ministral 3 系列多模态模型。该系列模型的一大亮点是支持用户在 Colab 上免费进行微调。这一举措预示着 Mistral AI 在多模态技术方面的重大进步,并将进一步降低开发者使用和定制先进多模态模型的门槛,促进更广泛的创新和应用。
Kling AI 发布原生音画同步模型 VIDEO 2.6-小互
Kling AI 正式发布了其 原生音画同步模型 VIDEO 2.6,这一进展使其能够像 Veo 3 一样直接生成声音,无需依赖外部配音或后期合成。该模型支持中英双语多人物对话、环境音效(如风声、脚步声)以及情绪化声音,确保了声音与画面的天然同步,嘴型、节奏和气氛保持一致。VIDEO 2.6 在动作、镜头衔接和故事节奏上比前一代更稳定,支持 5 秒/10 秒的 1080P 生成,解决了传统 AI 视频中常见的“嘴型不对、情绪不连贯”等问题。
Replit 推出 Agent 3 应用测试工具及设计团队新成员-Amjad Masad
Replit 宣布推出先进的应用程序测试工具 Replit Agent 3,旨在解决多数 AI 编码工具在测试和调试方面的不足。Replit Agent 3 能够启动浏览器并进行端到端的应用测试,显著减轻开发者的工作负担。此外,Replit 的设计团队近期迎来了新成员 pallavi_benawri,她的加入将进一步推动 AI 编码工具的发展,以适应人工智能重塑软件开发的新范式。
AI 图像生成提示词与应用趋势:Nano Banana Pro 实践分享-宝玉
AI 创作者“宝玉”分享了一系列基于 Nano Banana Pro 的提示词及其广泛应用,展示了其在图像生成领域的强大能力:
- 漫画角色超现实转化:通过详细的提示词,将漫画角色转化为保持原始特征的超现实人类,营造电影级智能手机摄影效果。
- 手绘风格信息图卡片:生成具有温暖有机背景、醒目笔触标题和手绘插图的垂直信息图卡片,传递亲切的手工美学。
- 等距微缩股票场景:输入公司名称或股票代码及日期,生成一个精致的 3D Q 版微缩场景,并整合实时股票数据和走势图。
- 此外,还有结合 Nano Banana Pro 和 可灵o1 将头像转换为视频的应用,以及生成古今混搭幽默水墨插画等创意方向。这些实践案例强调了 AI 在内容创作和数据可视化方面的多功能性。
Ben Tossell 宣布了一个在消息应用中运行的 开源机器人 (droid) 项目,并提供了相应的代码仓库。该项目的开放性使得开发者能够轻松利用其代码基础,构建和定制自己的 AI 聊天机器人,进一步推动 AI 在日常通信和自动化场景中的普及与创新。
Gemini 3 Pro 在儿童学习应用中的实验-Ben Tossell
Ben Tossell 分享了使用 Gemini 3 Pro 模型在儿童学习游戏应用中进行实验的最新进展。这项探索性工作展示了先进 AI 模型在教育和儿童内容创作领域的巨大潜力,有望通过更智能、更具互动性的体验,为儿童带来个性化且引人入胜的学习方式。
AI 创作者“Orange AI”指出,在使用 AI 工具生成宠物图像时,经常会出现多一条腿等怪异情况。这一现象突显了当前 AI 图像生成模型在处理复杂生物结构和确保细节一致性方面仍面临的技术挑战和局限性。