2025.12.04.12 过去4小时全球AI发生了什么?

以下是过去一段时间全球AI领域的重要动态汇总:

  1. Andrew Ng发布AI编码代理新课程:Building Coding Agents with Tool Execution-Andrew Ng Andrew Ng宣布推出一项新课程,专注于教授如何构建具备工具执行能力的AI编码代理。该课程旨在让AI代理超越预定义函数调用,能够编写和执行代码来完成复杂任务,访问完整的编程语言生态系统。学员将学习在沙盒云环境中安全运行代理生成的代码,并掌握构建数据分析代理(使用Pandas)和全栈Next.js Web应用代理的技能,从而更自主地处理文件和错误。

  2. MistralAI发布多模态模型Ministral 3系列-merve MistralAI公司发布了全新的多模态模型系列Ministral 3。这些模型具备多模态处理能力,并且用户可以在如Colab等平台上免费进行微调,这为AI研究人员和开发者提供了更便捷的工具来探索和定制先进的AI应用。此举标志着MistralAI在推动多模态AI模型的可访问性和应用范围方面迈出了重要一步。

  3. Replit设计团队迎来新成员:Pallavi Benawri将推动AI编码创新-Amjad Masad Pallavi Benawri近日宣布加入Replit的设计团队。Replit首席执行官Amjad Masad转发此消息并强调,AI编码正在从根本上重塑人们的构建方式。Pallavi的加入将有助于Replit进一步优化其AI编码工具的用户体验和设计,以适应AI时代软件开发的新范式,提升开发者效率。

  4. 开源消息应用机器人项目发布-Ben Tossell 一个基于消息应用的开源“机器人”(droid)项目已发布。该项目提供了一个开放平台,允许开发者在消息应用中集成和运行智能机器人。具体功能和应用场景可进一步查看其开源链接,但此发布预示着消息平台AI自动化工具的进一步发展和普及。

  5. Nano Banana Pro提示词揭示:漫画角色秒变超写实人类-宝玉 Nano Banana Pro展示了一项令人惊叹的提示词能力,能将漫画角色转化为超写实人类。该提示词详细指导AI在保持原始发型、服装、面部表情和角色身份的同时,创造出具有电影级、高分辨率智能手机摄影美学的图像。它强调深景深、清晰锐利的细节、戏剧性的光影对比,并明确排除了模糊背景、浅景深、卡通或CGI风格等负面提示。

  6. Nano Banana Pro新提示词:生成手绘风格信息图卡片-宝玉 Nano Banana Pro推出了一个新提示词,用于创建手绘风格的信息图卡片。该提示词旨在生成9:16垂直格式的卡片,具有温暖、有机的米色或米白背景,带有微妙的纸张纹理,营造出友好、手工制作的美学。卡片顶部采用大胆的笔触字体突出标题,所有文本均为流畅的手绘脚本风格,并辅以简单而吸引人的手绘插图或符号图标,以增强视觉兴趣和信息传达效率。

  7. Nano Banana Pro结合可灵o1实现头像视频化-向阳乔木 一项新的AI应用展示了Nano Banana Pro与可灵o1模型的协同能力,能够将静态头像转化为动态视频。这一结合利用了两种AI工具的优势,为用户提供了更丰富的视觉内容创作可能性,使得个人头像能够轻松拥有生动的动画效果,预示着短视频和个性化内容生成的新趋势。

  8. Anything Max推出“Vibe Coding”并完成1亿美元估值融资-Ben Tossell Anything Max公司宣布推出其创新性的“Vibe Coding”技术,并表示该技术在现有Lovable和Bolt等编码工具之上实现了显著飞跃。同时,该公司已成功完成一轮融资,估值达到1亿美元,这表明市场对“Vibe Coding”及其潜力抱有高度期待和信心,可能预示着编程方式的重大变革。

  9. Kling AI发布原生音画同步模型VIDEO 2.6,实现音视频一体化生成-小互 Kling AI重磅发布了原生音画同步模型VIDEO 2.6,该模型与Veo 3类似,能够直接生成声音,无需外部配音或后期合成。VIDEO 2.6支持中英双语多人物对白、环境音效(如风声、脚步声)和情绪化声音,实现声音与画面的天然同步,确保嘴型、节奏和气氛一致。模型在一次推理过程中完成画面和音频的生成,有效解决了传统AI视频中“嘴型不对、情绪不连贯”等问题,并支持5秒/10秒的1080P视频生成,在动作、镜头衔接和故事节奏上表现更稳定。

  10. Replit Agent 3推出端到端应用测试工具,简化AI编码调试流程-Amjad Masad Replit宣布,其投入研发的Replit Agent 3将集成一项先进的应用程序测试工具。该工具能够启动浏览器并执行应用的端到端测试,旨在自动化AI编码过程中繁琐的测试和调试工作。此举旨在减轻开发者的负担,提升AI辅助编程的效率和可靠性,确保AI生成的代码能够顺畅运行并符合预期功能。

  11. Nano Banana Pro新能力:实时股票数据结合3D微缩场景生成-宝玉 Nano Banana Pro再次展示了其图像生成的多样性,推出了一个可根据公司名称、股票代码和指定日期生成等距微缩3D股票场景的提示词。该提示词利用Cinema 4D渲染引擎,创建出精致的Q版场景,融合公司标志性建筑、产品和可爱人偶,并巧妙地将实时股市行情数据(包括股票代码、日期、价格区间及走势图)融入其中,以简洁的布局和柔和的光影,为用户提供直观且富有艺术感的股票信息展示。