2025.11.29.20 过去4小时全球AI发生了什么?
以下是过去一段时间全球AI领域的最新动态:
Nano Banana Pro PPT生成提示词发布-歸藏(guizang.ai)
归藏(guizang.ai)分享了一套用于Nano Banana Pro PPT生成的提示词,旨在创建高保真、未来科技感的16:9演示文稿幻灯片。该提示词强调融合Apple Keynote的极简主义、现代SaaS产品设计和玻璃拟态风格,通过电影级体积光、柔和光线追踪反射和极光渐变色营造高端沉浸氛围。内容排版采用Bento盒网格系统,模块化圆角矩形容器以磨砂玻璃质感呈现。同时,它智能整合了礼物质感的3D抽象物体和发光的3D图表,要求渲染质量达到虚幻引擎5、8K分辨率、超细节纹理的UX设计奖级别。
Kimi上线Nano Banana Pro PPT生成功能并提供限时免费-歸藏(guizang.ai)
国内AI助手Kimi宣布上线了支持Nano Banana Pro的PPT生成功能,并提供未来48小时免费使用。这一功能旨在利用先进的AI技术,帮助用户高效、快速地创建高质量演示文稿,进一步提升Kimi在办公自动化领域的实用性。用户现在可以体验通过AI智能生成专业且富有设计感的PPT,降低制作门槛,提高工作效率。
Apollo Academy发布了一份题为《AI 采用率开始趋于平缓》的报告,指出企业对AI技术的采用速度并非呈指数级增长。报告援引美国人口普查局和金融科技公司Ramp的数据,揭示了大型企业在AI采用方面出现停滞甚至下滑的迹象。这表明尽管AI热度高涨,但在实际的企业应用层面,其普及和深化面临着复杂性和实际效益的挑战,可能预示着市场对AI的期望正在回归理性。
Peter H. Diamandis谈AI的计算潜能、图像现代化与聊天机器人发展-Peter H. Diamandis, MD
Peter H. Diamandis强调了10吉瓦计算能力所蕴含的巨大潜力,认为许多人尚未 fully 意识到其可能带来的变革。他分享了利用Nano Banana等AI工具在节假日期间现代化旧家庭照片的愉快体验,这体现了AI在个人生活应用中的便利性。同时,他指出AI模型的小幅升级正促使聊天机器人变得更便宜、更快、更高效,并将其视为赋予用户构建无限可能(从副业到创新项目)的工具,而非替代人类。这反映了AI技术在赋能个人创造力和提升效率方面的积极发展趋势。
Don Tapscott新书《You to the Power of Two》发布,引入“Identic AI”概念-Peter H. Diamandis, MD
Peter H. Diamandis宣布Don Tapscott与Joseph Bradley合著的新书**《You to the Power of Two》已发布。该书引入了“Identic AI”(个体AI)的新概念,旨在阐述个人AI代理如何赋予每个人超能力。此书得到了包括FedEx和Edelman等公司CEO在内的广泛好评,并获得了Booklist Starred Review,预示着个性化AI代理**在未来社会中的重要角色和潜力。Diamandis本人也曾接受该书采访。
Andrew Ng分析AI泡沫风险与投资前景-Andrew Ng
知名AI专家Andrew Ng探讨了AI领域是否存在泡沫的问题,特别是在OpenAI万亿美元计划和英伟达万亿市值背景下。他将AI投资分为三类:AI应用层、推理基础设施和模型训练基础设施。Ng认为AI应用层存在投资不足,潜力巨大;推理基础设施仍需大量投资以满足需求;而模型训练基础设施风险最高,可能存在泡沫,尤其考虑到开源模型市场份额的增长和技术护城河的弱化。尽管存在担忧,Ng对AI的长期基本面保持乐观,并强调AI作为工具的重要性。
Ilya Sutskever澄清AI规模化发展与未来研究方向-宝玉
Ilya Sutskever澄清了他之前访谈中关于AI发展路径的观点。他强调,继续通过堆叠算力、数据和训练环境来扩展现有方法仍将带来持续改进,模型会变得更强,性能指标会继续提升。然而,他也指出这种规模化发展存在“重要的缺失”,即无法获得真正的泛化能力和高效学习能力。他以短跑和飞行的类比说明,当前的进步是线性的,但要实现质的飞跃需要完全不同的能力和研究方法,暗示了对AI未来发展方向的深层思考。
一位用户在观看影视飓风关于AI的视频后,对评论区中“AI只是实现梦想的工具,不应嫉妒它,它离开人的思想情感一钱不值”的观点深感共鸣。这条评论强调了AI的工具属性,认为其即使能创造出色的作品,也缺乏自主意愿和情感驱动,最终仍是人类创造力的延伸和辅助。这体现了对AI在艺术和创作领域角色的理性认知,即AI是赋能而非取代人类。
AI图像生成工具在内容审查方面的差异:Gemini与Labnana对比-Orange AI
有用户反馈在进行AI剧本故事和画面生成时,Gemini应用因涉及公众人物而无法出图或编辑,但Orange AI的Labnana工具则完全没有此限制,能够流畅地完成生成任务。这表明不同的AI图像生成工具在内容审查和编辑自由度上存在显著差异,Labnana在处理复杂或敏感内容方面展现出更大的灵活性和能力,为用户提供了更无缝的创作体验。
Google DeepMind机器人团队技术负责人谭捷谈Google Robotics与研究文化-宝玉
一期深入探讨机器人技术的播客节目邀请了Google DeepMind机器人团队的技术负责人谭捷作为嘉宾。节目内容聚焦于Google Robotics团队的思考模式和工作方式,并讨论了Google近年来研究文化的演变。这次访谈为听众提供了了解前沿机器人研究和大型科技公司内部创新机制的宝贵视角,特别是Google在AI和机器人融合领域的战略和进展。
Nvidia悄然发布Orchestrator-8B模型,在HLE基准测试中表现出色-clem 🤗
英伟达悄然发布了Orchestrator-8B模型,该模型在**“人类最后考试”(Humanity’s Last Exam, HLE)基准测试中取得了显著成就,获得高分。尽管发布低调,这一模型在工具编排方面的能力引人注目,预示着AI在自动化复杂任务和多工具协同**方面的新进展。它的推出可能进一步推动AI在需要高级逻辑推理和任务规划场景中的应用,展现了Nvidia在AI模型研发方面的持续投入。
Emad预测,随着大量令人惊叹的新型视频模型的涌现,视频像素生成问题有望在明年得到“解决”。这一大胆预测表明,AI在生成高质量、逼真视频内容方面的技术进步正以惊人速度发展。如果这一预测成真,将对影视制作、内容创作、虚拟现实等多个行业产生深远影响,大幅降低视频制作门槛并提升创作效率。
SAM3D-Body应用利用Rerun.io和Gradio完成构建-merve
Pablo Velagomez宣布,他已成功利用**@rerundotio和@Gradio完成了SAM3D-Body应用的构建。这款应用的界面设计简洁高效,预示着在3D人体建模或分析领域的AI工具取得了新进展。结合Rerun.io和Gradio的使用,该项目可能提供了一个交互式且可视化友好的解决方案**,便于用户进行3D数据处理和模型探索,展现了AI在三维空间理解和表示方面的实际应用潜力。
Replit通过AI实现零代码快速建站,并强调其“vibe coding”愿景-Amjad Masad
Replit的CEO Amjad Masad展示了其平台通过AI实现零代码快速构建应用的能力,例如用户仅用4分钟即可利用提示词创建一个自定义的YouTube转博客应用。Masad表示Replit致力于实现完全集成的“vibe coding”体验,并期待Google能追赶其十年的愿景。用户反馈也证实,与传统工具如WordPress模板相比,Replit在易用性和开发速度上更具优势。此外,Replit与Google Cloud的深度集成确保了企业级的可靠性。
一则关于AI客服的评论引发了讨论,有人工客服吐槽AI客服无法有效理解客户意图,导致原本情绪平稳的客户在与AI交互后,转到人工服务时已变得**“暴跳如雷”。这反映了当前AI客服在处理复杂情绪和个性化问题方面的局限性。尽管AI客服旨在提高效率,但其缺乏人类同理心和灵活应变的能力**,有时反而可能适得其反,加剧客户不满,强调了AI在客户服务领域仍需改进用户体验和情感智能。