2025.09.10.00 过去4小时全球AI发生了什么?
以下是过去4小时全球AI领域发生的一些重要事件:
Stability AI首席执行官Emad发起了一项讨论,询问到2027年底训练一个GPT-5级别模型可能需要多少成本,并特别指出要排除数据及其他相关成本,假设拥有相同质量的数据集。这一讨论反映了业界对未来AI模型开发所需资源投入的广泛关注。
Google Gemini API发布Veo 3和Veo 3 Fast通用版本 - Demis Hassabis
Google的Gemini API现已正式推出Veo 3和Veo 3 Fast的通用版本(GA)。根据开发者反馈,此次更新还新增了对垂直格式的支持,进一步增强了Gemini API在视频生成方面的能力,为开发者提供了更灵活的工具。
有观点认为,AI编程的兴起将使两类程序员受益:一是拥有多年手动编码经验的35岁以上“老程序员”,他们凭借深厚的“手感”能更好地进入“vibe coding”状态,从而成为更高级别的专家;二是新毕业的“小白”程序员,他们可以利用AI工具快速入门并提升效率。
Seedream 4在应用图标设计方面展现强大能力 - 歸藏(guizang.ai)
AI模型Seedream 4在应用图标设计方面表现出色,被认为可以与GPT-4o在用户界面设计领域一较高下。用户演示了如何通过提示词生成高质量的智能手表应用图标,突显了该模型在视觉创作领域的潜力。
过去一周,开放大型语言模型(LLM)领域取得了显著进展。Google发布了一个新的拥有3亿参数的嵌入模型,Kimi-K2获得了更新,OpenBMB也推出了MiniCPM的80亿参数开源版本。此外,大量的Qwen-Image和Kontext LoRAs模型也相继发布,丰富了开放LLM社区。
知名AI研究者Gary Marcus强调了“神经符号方法”(neurosymbolic approach)和“世界模型”(world models)在AI发展中的重要性,指出其核心在于建模“符号”而非像素。他认为这一理论的被采纳,是对他2020年发表的《AI的下一个十年》一文观点的绝对验证。
Emad指出,曼哈顿计划在今天约合400亿美元,而Anthropic已筹集270亿美元,OpenAI更是高达640亿美元。这一比较突显了当前人工智能领域的投资规模之巨大,远超历史上一些最具影响力的科学工程项目。
开源AI代理正在持续改进,其生成的所有输出,包括幻灯片、网站和图像等,现在都支持编辑。这一进展提高了开源AI工具的灵活性和实用性,使用户能够更好地控制和优化AI生成的内容。
Artificial Analysis获《经济学人》专题报道 - clem 🤗
Artificial Analysis公司在《经济学人》杂志上获得专题报道,该文章探讨了AI智能的提升以及对“智能分析”日益增长的需求。这表明AI智能评估和分析领域正受到主流媒体的广泛关注和认可。