2025.09.30.00 过去4小时全球AI发生了什么?

以下是过去4小时全球AI领域的重要动态:

  1. 新基准评估LLM在44个职业中的表现 - merve

    一项新的基准测试对大型语言模型(LLM)在9个行业部门的44个不同职业中的能力进行了评估,结果显示LLM距离实现全面胜任还有很长的路要走。这项全面的评估旨在衡量AI在现实世界工作场景中的实用性,揭示了当前模型在复杂任务和专业知识方面仍存在的显著不足。

  2. 特斯拉擎天柱机器人展望:2040年每家一台 - Peter H. Diamandis, MD

    Peter Diamandis预测,到2040年,每个家庭都将拥有一个机器人,特斯拉的目标是每年生产一百万台擎天柱(Optimus)机器人。他预计每台擎天柱的成本约为3万美元,这意味着用户每天只需支付约10美元即可拥有,预示着个人机器人将变得普及且经济实惠。

  3. DeepSeek V3.2发布:降价超75%并提升效率 - 歸藏(guizang.ai)

    DeepSeek发布了其V3.2 Exp版本,带来了超过75%的大幅降价,使得模型输入和输出的价格几乎持平。此次降价得益于细粒度超稀疏注意力机制的实现,该机制在不牺牲模型输出质量的前提下,显著降低了训练和推理成本,极大地提升了AI服务的性价比。

  4. AI专家Emad Mostaque探讨后AGI经济前景 - Emad

    AI专家Emad Mostaque在最近的@CogRev_Podcast访谈中与@labenz分享了他对后AGI(通用人工智能)经济前景的深刻见解。此次讨论聚焦于AGI将如何重塑全球经济结构、劳动力市场以及价值创造方式,暗示了智能系统在未来经济中可能扮演的变革性角色。

  5. 即梦Omnihuman 1.5上线:用AI生成乔布斯卖拖鞋视频 - 歸藏(guizang.ai)

    即梦(Jimo)在Web端上线了其数字人平台Omnihuman 1.5版本,该版本显著提升了控制能力。作者展示了一个利用AI生成**史蒂夫·乔布斯“推销破拖鞋”**的视频教程,详细说明了如何通过图像模型配合,精确定义视频中人物的表演和动作,彻底改变了表演类AI视频的制作逻辑。

  6. Claude成功生成吴京采访梗提示词 - 宝玉 (RT @cellinlab)

    一位用户成功利用Claude生成了一个用于制作吴京采访梗短视频的提示词,该提示词迅速在社交平台走红。通过名为“#吴京采访梗台词生成器”的模板,用户可以输入任意角色或场景,让AI自动生成模仿吴京采访风格的定制台词脚本,极大地降低了内容创作门槛。

  7. OpenAI发布300+免费提示词工程指南 - 宝玉 (RT @tig88411109)

    OpenAI推出了超过300份免费的提示词工程指南,涵盖销售、产品、工程、经理和高管等多个职业岗位。这些指南旨在帮助职场人士入门或提升AI对话技巧,并强调随着模型日益智能化,提示词的复杂性可能不再是关键,而更注重其清晰度和意图。

  8. ChatGPT Pulse工作机制与Letta的Sleep-time Compute相似 - 宝玉 (RT @dongxi_nlp)

    @dongxi_nlp指出,ChatGPT Pulse的工作机制与AI IDE公司Letta的Sleep-time Compute概念非常相似。该机制将用户的查询作为“唤醒阶段”的分界线,旨在优化模型在接收到查询后的计算效率,体现了AI在资源管理和响应速度方面的最新进展。

  9. OpenAI的gdpval数据集登上HuggingFace热门榜首 - clem 🤗

    OpenAI发布的**gdpval数据集**本周在HuggingFace平台荣登热门榜首。这表明该数据集获得了AI社区的广泛关注和兴趣,有望为研究人员和开发者在模型训练、验证或微调方面提供有价值的资源。

  10. AI自GPT-4以来未能实现100倍改进 - Gary Marcus

    著名AI研究员Gary Marcus转发并认同了一个观点,即自GPT-4发布以来,没有其他AI模型能实现预期的“100倍改进”。这一评论引发了对当前AI模型发展速度和突破性进展的思考,暗示在实现下一个重大飞跃方面可能面临挑战。

  11. FactoryAI助力LMS系统重构优化 - Ben Tossell

    @iAmDon_eth对使用**@FactoryAI进行“大规模重构”以优化其学习管理系统(LMS)**表示高度满意。这突显了FactoryAI在提升复杂系统效率和结构方面的强大能力,可能通过AI驱动的代码分析和优化工具实现。

  12. Vercel Agent模板与droid exec测试中 - Ben Tossell

    Ben Tossell正在积极测试Vercel的Agent模板与droid exec的结合使用。这表明正在探索将AI Agent集成到部署平台和执行环境中,旨在简化开发工作流或实现更具动态性和AI驱动的Vercel应用程序。

  13. 开源项目Refund Swatter Lite助iOS开发者应对恶意退款 - 宝玉 (RT @GitHub_Daily)

    一位iOS开发者在遭受大规模恶意退款导致严重损失后,开发并开源了Refund Swatter Lite项目。该项目旨在帮助其他开发者解决类似的恶意退款问题,可能基于Supabase作为后端支持,为iOS应用创建者提供了一个重要的社区驱动解决方案。