2025.09.10.04 过去4小时全球AI发生了什么?


  1. Apple AirPods Pro 3 新功能曝光:实时翻译和心率监测

    苹果的下一代 AirPods Pro 3 预计将集成多项由AI驱动的创新功能。据爆料,新耳机将支持实时语言翻译内置心率传感器。此外,AirPods Pro 3 在主动降噪(ANC)性能上比前代提升两倍,电池续航时间在ANC模式下可达8小时,并维持249美元的售价。这些功能预示着个人智能设备在健康监测和跨语言交流方面的进一步智能化。

  2. 阿联酋推出320亿参数开源推理模型 K2 Think

    阿联酋(UAE)在人工智能领域迈出重要一步,发布了K2 Think模型。这是一个拥有320亿参数的开源推理模型,其性能表现“远超同等量级模型”。该模型已在Hugging Face平台上线,旨在推动AI研究和应用的发展,并进一步巩固阿联酋在全球AI创新版图中的地位。

  3. Hugging Face 宣布与 Mattt 合作,加速端侧AI部署

    Hugging Face 宣布与 Mattt 展开合作,共同致力于将AI直接部署到用户设备上。此次合作旨在通过利用MLX、Core ML和Swift Transformers等技术,优化模型在终端设备上的运行效率和用户体验。Mattt 强调,当前AI最大的机遇并非仅是提升模型10%的性能,而是要“与用户所处的设备环境相结合”,从而让AI能力更贴近实际应用。

  4. 腾讯混元大模型发布 HunyuanImage 2.1,并宣布开源

    腾讯正式发布并开源了其最新文本到图像模型HunyuanImage 2.1。该模型致力于提供更优质的图像生成能力。此次开源标志着腾讯在推动AI技术普惠和开放生态建设方面的重要努力,将赋能更多开发者和研究人员利用先进的文生图技术。

  5. Gemini Canvas 更新“选择并提问”功能,实现视觉化网页应用编辑

    Gemini Canvas 推出了一项名为“选择并提问”(Select and Ask)的新功能。用户现在只需点击网页应用的任何元素并进行描述,即可对其进行视觉化编辑。这项更新极大地简化了网页应用的开发和修改流程,使得非技术用户也能通过自然语言交互实现复杂的界面调整,提升了开发效率和易用性。

  6. GLiNER 新增阿拉伯语模型

    GLiNER 宣布已推出其阿拉伯语模型。这一新增功能将为阿拉伯语用户和开发者提供强大的命名实体识别能力。该模型的推出进一步扩展了GLiNER的语言支持范围,有助于促进跨语言AI应用和研究的发展,特别是在处理阿拉伯语文本数据方面。

  7. 开源AI机器人开发套件问世

    一款专为AI原生机器人设计的开源开发套件正式发布。该套件集成了主导臂和摄像头等组件,提供了一体化的解决方案,旨在降低AI机器人开发的门槛。这一工具的出现将加速机器人技术与人工智能的融合,为研究者和开发者提供更便捷的实验和创新平台。

  8. AI 领域专家 Gary Marcus 持续批评 LLM 局限性

    著名AI领域批评家 Gary Marcus 再次强调了大型语言模型(LLMs)的局限性,并指出“LLMs等于AGI(通用人工智能)的假设正在逐渐瓦解”。他认为,过度依赖LLMs可能导致一种“LLM依赖综合症”,并倡导通过编写简单代码来替代一些LLM功能,从而节省成本。Marcus长期以来一直对深度学习及其局限性持批判态度,并认为历史将记住他的观点。

  9. Peter Diamandis 强调自动驾驶汽车的安全性优势

    未来学家 Peter Diamandis 援引统计数据,指出自动驾驶汽车相比人类驾驶具有显著的安全性优势。他表示,在美国,人类司机每年导致约40,000人死亡,而自动驾驶汽车在数千起事故中仅造成1起死亡。Diamandis认为,尽管自动驾驶技术尚未完美,但其安全性已得到验证,数据清晰地表明其优越性。