以下是过去一段时间全球AI领域的重要动态,主要事件发生在北京时间2025年12月29日凌晨左右。 Reachy Mini机器人探索多功能应用 clem 🤗 分享了关于 Reachy Mini 机器人的多个创新应用。其中包含一个将 Reachy Mini 用作游戏控制器进行操作的案例,展示了人机交互的趣味性和沉浸感。另一个项目则将 Reachy Mini 打造为 DJ 机器人,凸显了这款小型、富有表现力的开源机器人在娱乐和创意领域的巨大潜力。这些应用不仅在技术社区中引发了积极反响,也预示着机器人技术在日常生活和艺术表达中的更多可能性。 DeepMind纪录片《The Thinking Game》观看量破2亿 DeepMind CEO …
阅读更多Claude Skills的易用性与NotebookLM集成 Claude Skills因其基于Markdown和YAML的简洁性,被视为极大简化了LLM的开发和集成,甚至可以在Codex CLI或Gemini CLI等工具中直接使用,无需模型感知Skills系统。这种“扔文本就能用”的理念被赞为“简单是硬道理”。尤其值得关注的是,NotebookLM通过Claude Skill实现了文件上传、自动提问、获取答案并生成Markdown文件的强大功能,极大地强化了自动化学习能力。此外,名为“Superpowers”的Claude Skill在复杂项目开发中表现出色,能主动进行头脑风暴并提出精准问题以收敛技术方案,效果令人惊艳。 …
阅读更多Google发布Gemini 3 Flash模型,性能超越Pro版且速度更快-小互 Google正式发布了 Gemini 3 Flash 模型,其性能在MMMU-Pro、SWE-Bench Verified和Arc-AGI-2等多模态理解基准测试中超越了Gemini 3 Pro,同时速度提升三倍,成本大幅降低。该模型具备博士级逻辑与推理能力,能根据问题复杂度动态调节思考时间,并平均减少30%的tokens使用。Gemini 3 Flash现已成为Gemini App和AI Mode in Search的默认模型,适用于实时交互式应用、快速编码、高并发API请求及低延迟多模态AI场景。 xAI Grok语音代理迅速移植到Reachy …
阅读更多过去4小时全球AI要闻速览 Google Gemini 3 Deep Think 预测2026年AI行业趋势-歸藏(guizang.ai) 谷歌发布了其最强模式Gemini 3驱动的Deep Think,并基于OpenRouter报告分析了2026年AI行业发展趋势。主要预测包括:推理成本将大幅降低,云厂商计费模式可能从“按Token收费”转向“按任务结果收费”;同时,基础设施将重构以服务“长程记忆”,推理平台将全面支持有状态架构,使AI Agent能保持数小时甚至数天的“工作记忆”和上下文环境。 阿里巴巴发布 Qwen3-TTS 语音合成模型-小互 阿里巴巴发布了Qwen3-TTS文本转语音模型,重点优化了语音的自然度、韵律控制与 …
阅读更多西方国家对AI信任度普遍较低,中国则更为乐观-Andrew Ng 根据Edelman和Pew Research的报告显示,美国及欧洲、西方世界大部分地区民众对AI普遍不信任且不感到兴奋。在美国,49%的人拒绝AI的增长使用,而中国有54%的人接受。这种广泛的不信任可能阻碍AI的进步,导致个人采纳缓慢、有价值的项目受阻,并增加限制AI发展的立法风险。吴恩达呼吁AI社区认真对待公众担忧,坦诚讨论AI的益处和危害,并积极解决问题,以重建社会信任。 OpenAI研究推出“告解室”机制,提升AI诚实度-向阳乔木 OpenAI最新研究开发了一种名为“confessions”(告解)的方法,旨在提高AI的诚实度。该方法让AI在给出主回答后,单独 …
阅读更多今日AI领域呈现出技术跃进与商业落地并存的复杂图景。一方面,Runway、Mistral等公司发布的新一代模型在文生视频、开源语言模型等领域树立了新的标杆,快手“音画同出”模型也预示着多模态生成能力的进一步融合。另一方面,商业化进程中的挑战开始显现,亚马逊因AI配音质量不佳而撤回产品,微软罕见下调AI销售指标,揭示了从技术演示到创造真实客户价值的鸿沟。同时,AI正加速向工业、医疗、自动驾驶等实体产业渗透,而端侧AI的兴起和脑机接口的进展,则共同勾勒出下一代人机交互的未来轮廓。 Runway Gen-4.5 发布,大幅提升文本到视频AI生成质量 Runway 推出了其最新的文生视频模型 Gen-4.5,该模型在生成视频的真实感和物理一 …
阅读更多Mistral AI 发布 Mistral 3 系列多模态模型,性能超越 Kim 2-小互 Mistral AI 重磅发布了其最新的 Mistral 3 系列模型,包括大型稀疏专家混合(MoE)模型 Mistral Large 3(41B活跃参数/675B总参数)以及面向端侧运行的 Ministral 3 系列(3B, 8B, 14B稠密模型)。Mistral Large 3 支持图像输入与分析,原生支持十余种主要语言,对系统指令遵循度高,并具备原生函数调用和结构化JSON输出能力,其 256K tokens的超长上下文窗口在开源模型中名列前茅。在LMArena榜单中,Mistral Large 3 位列开源非推理模型第二,开源总 …
阅读更多今日AI领域呈现出从云端向物理世界加速渗透的趋势。具身智能成为焦点,小米和长安汽车相继宣布在人形机器人领域的重大布局,而清华系团队在核心的AI触觉感知技术上取得突破,为机器人的物理交互奠定了基础。同时,AI在各行业的应用持续深化,货拉拉展示了AI如何优化物流效率,Adobe则将AI更深度地集成到创意工具中。然而,亚马逊员工的联名信也揭示了AI快速部署背后,关于工作流程、效率与员工负担的现实矛盾,凸显了技术落地过程中的挑战。 雷军:未来5年,人形机器人将大面积在小米工厂上岗 小米创始人雷军表示,未来五年内,人形机器人将在小米的工厂中被大规模应用。他认为人工智能将深刻变革传统产业,所有行业都值得利用AI进行重塑。该消息还提及,淘宝的即时 …
阅读更多Deepmind 拿下 buildwith.ai 域名并指向 AI Studio Build 模式 - 歸藏(guizang.ai) Deepmind 已经获取了 buildwith.ai 域名,并将其重定向至其 AI Studio 的 Build 模式。此举可能预示着 Deepmind 在 AI 开发工具和平台领域的新动向,旨在简化或强化用户构建和部署 AI 解决方案的体验,进一步整合其生态系统。 Hugging Face PRO 订阅提供每日 500 次 Z-Image-Turbo 生成 - merve Hugging Face PRO 订阅服务以每月 9 美元的价格,提供每日约 500 次 Z-Image-Turbo 图像生 …
阅读更多今日AI领域的焦点呈现出两大趋势:规范化与实用化。一方面,美国政府正式推出AI系统审计框架,标志着行业正在从野蛮生长迈向有章可循的成熟阶段。另一方面,高效的开源模型和专用的端侧硬件不断涌现,极大地推动了AI技术在药物研发等垂直领域的深度应用和商业落地。这预示着AI的竞争正从模型参数的比拼,转向全链路的工程化和产业化效率的较量。 美国商务部发布AI模型审计框架,强制要求高风险系统进行第三方评估 美国商务部国家标准与技术研究院(NIST)今日正式发布了《人工智能安全与问责框架》。该框架为AI系统,特别是那些应用于金融、医疗和关键基础设施等高风险领域的系统,制定了明确的审计标准和流程。新规要求相关企业必须委托独立的第三方机构进行定期审计, …
阅读更多