2025.12.06.12 过去4小时全球AI发生了什么?
Google DeepMind Gemini 3 Deep Think 预测2026年AI行业趋势 - 歸藏(guizang.ai)
谷歌近日发布了其最强大的模式Gemini 3驱动的Deep Think,并利用其分析了2026年AI行业的发展趋势。预测指出,推理成本将大幅降低,达到“白菜价”,导致云厂商的商业模式从“按Token收费”转变为“按任务结果收费”,企业将为成功解决问题付费。此外,AI基础设施将重构以支持“长程记忆”服务,推理平台将全面支持有状态架构,允许AI Agent在云端保持数小时甚至数天的“工作记忆”和上下文环境,无需每次重复上传数据,这将显著提升AI应用的实用性。
宝玉分享Gemini与Nano Banana Pro整合实现创意视觉AI工作流 - 宝玉
一位名为“宝玉”的网友分享了将Nano Banana Pro的可视化能力、世界知识与Gemini的实时联网能力融合后的“魔法时刻”。他指出,在AI工作流中最困难的部分并非提示词或创意本身,而是理解AI模型的边界并找到创意与模型能力的最佳结合点。例如,他此前在GPT-4o上尝试的“城市天气”概念,因需要自定义API获取实时数据而受限,但通过Gemini与Nano Banana Pro的整合,模型现在能自动获取日期、天气并生成图像,大大增强了可玩性,并鼓励用户将其作为模板进行个性化创作。
有开发者发现,现在可以通过 quanto 库编译量化模型,尽管在处理如 Qwen3-VL 这样的大型视觉语言模型时可能会遇到内存占用增加的问题。此前,由于动态形状的限制,在视觉语言模型上尝试编译并非易事。这项进展意味着模型优化在实际部署中可能获得性能提升,但仍需解决特定模型下的资源消耗挑战。
Google DeepMind 为团队活动推出 Luma 页面 - Demis Hassabis
Google DeepMind 宣布为其团队参与的活动推出了一个 Luma 页面。此举旨在集中展示团队将参加的各类会议、讲座和研讨会信息,方便社区成员了解并参与到DeepMind的最新研究和合作中。这标志着Google DeepMind在加强社区互动和信息透明度方面迈出了新一步。
Reachy Mini 机器人亮相法国电视节目 - clem 🤗
Reachy Mini 机器人近日在法国电视节目中亮相,因其可爱的外观引起了广泛关注。这款机器人展示了其在人机交互和媒体展示方面的潜力,进一步推动了机器人技术在公众视野中的普及,并可能激发更多关于家用或服务型机器人的讨论和兴趣。
Peter Diamandis 展望AI:人人皆投资者,AI成企业家 - Peter H. Diamandis, MD
未来学家Peter H. Diamandis博士提出一个大胆愿景:未来世界中,每个人都将成为投资者,而人工智能将扮演企业家的角色。他认为AI将负责创新、创造价值和驱动经济增长,从而解放人类,让他们能够专注于投资和更高层次的活动。这一观点描绘了AI在未来经济结构中可能占据的核心地位。
Replit 推出多项新功能,加速全栈和AI应用开发 - Amjad Masad
Replit 近期发布了多项新功能,旨在帮助开发者更快地构建、更好地设计并从中获利。其中包括支持全栈 iOS 和 Android 应用开发的能力,以及通过 AI 进行“Vibe Coding”以快速构建特定用途应用,例如展示 SuiNetwork 区块链元素或为瑜伽教师提供学习工具。这些更新强调了 Replit 致力于简化开发流程,并赋能用户利用AI快速实现创新。
据《华尔街日报》报道,近期数十名在音频、手表设计、机器人和其他核心产品领域拥有专业知识的苹果工程师和设计师已离职并加入OpenAI。LinkedIn资料显示,超过50名苹果前员工在过去几个月内转投OpenAI,涵盖从可穿戴设备工业设计到iPhone、AirPods和Apple Watch音频技术,甚至机器人技术。此外,苹果公司近期还面临AI主管、UI设计主管和政策主管等多位高管的辞职。这一人才流动凸显了OpenAI对顶尖人才的强大吸引力,以及苹果在AI领域面临的挑战。
ListenHub AI智能生成演示文稿,效果令人惊叹 - Orange AI
ListenHub近期推出了其AI驱动的演示文稿(PPT)生成功能,用户只需导入长篇文章,AI便能自动创建出视觉效果和美学水平极高的PPT。该服务还提供讲解音频视频,并支持一键发布到YouTube和视频号。虽然单个PPT收费10元,但用户认为其效率和质量远超传统人工代做,展现了AI在内容创作和自动化办公领域的强大潜力与高性价比。