以下是过去一段时间全球AI领域的重要动态: Runway 发布 Gen-4.5 视频生成模型,注重物理与视觉精度 - 歸藏(guizang.ai) Runway 推出了其最新视频生成模型 Gen-4.5。虽然该版本未带来范式革新,但其在多方面进行了显著升级,包括提升了物理与视觉精度,能够处理更复杂场景与详细构图。模型在物理准确性方面有所增强,并能生成更富有表现力的角色。此外,Gen-4.5 也优化了风格化与风格一致性,使其在生成电影感与真实日常场景时表现更佳。 国产AI视频生成应用内测,音画同步但风格抽象 - 向阳乔木 一项国产AI视频生成应用目前正在进行内测。该应用声称能够实现音画同步,这是一项重要的技术突破。然而,测试用户反馈其 …
阅读更多Ilya Sutskever澄清AI扩展定律的局限性 - 宝玉 OpenAI联合创始人Ilya Sutskever对其早前访谈内容进行澄清和补充,指出当前通过堆叠算力、数据和训练环境的AI扩展方法仍能带来进步,模型会持续变强,但这种路径缺乏“真正的泛化能力”和“高效学习”。他强调,有些“重要的东西”是单纯的规模化无法获得的,例如从少量经验中快速学习并在新场景下稳定可靠的能力,以及人类学习效率远超当前AI的效率。 报告显示AI企业采用率趋于平缓 - 宝玉 一份来自Apollo Academy的报告《AI 采用率开始趋于平缓》指出,企业对AI的采用速度并未呈现指数级增长,甚至在美国大型企业中出现了停滞甚至下滑的迹象。该报告引用了美国人 …
阅读更多Google AI负责人Jeff Dean分享AI快速发展历程-向阳乔木 Google AI负责人Jeff Dean在一场分享中回顾了AI从2012年到2024年的指数级发展。他指出,AI的强大是过去十五年技术叠加的产物,包括2012年Google Brain的无监督学习(识别猫)、Word2Vec提升语言理解、2015年TPU(Tensor Processing Unit)解决算力危机(比CPU/GPU快15-30倍,能效高30-80倍),以及2017年Transformer架构的诞生。Dean还介绍了稀疏模型、蒸馏和思维链等训练技巧。他强调,AI从2022年解决初中数学题(15%准确率)到2024年Gemini 2.5 Pro …
阅读更多AI对全球就业市场影响的深度分析揭示结构性变化-宝玉 一项基于2023年至2025年10月近1.8亿份全球招聘启事的分析显示,2025年全球总招聘岗位数量比2024年同期下降8%。其中,创意执行岗位受AI影响最大,计算机图形艺术家、摄影师和作家等职位降幅高达28%-33%,远超基线。然而,创意总监和平面设计师等创意策略岗位则表现稳定。从职级来看,AI赋能高层领导(-1.7%),但一线员工(-9.0%)和中层管理者(-5.7%)受冲击较大。值得注意的是,客服(-4.0%)和软件工程师(尤其是后端)岗位降幅小于大盘,显示出人类同理心和复杂问题处理能力的重要性。机器学习工程师需求激增40%,成为AI淘金热中的核心岗位。此外,网红营销专员 …
阅读更多Meta发布SAM 3论文:实现通过概念进行图像分割 Meta发布了SAM 3(Segment Anything with Concepts)论文,在SAM 1和SAM 2的基础上,实现了对自然语言的语义理解,用户可通过口头描述(如“黄色校车”)批量识别并分割图像中符合概念的物体。这一突破解决了之前版本需要手动点击或画框的局限,大大提升了操作效率。其短期落地场景广泛,包括电商批量抠图、视频内容理解、工业质检、内容审核及数据标注提效等。在测试评分上,SAM 3表现显著,如LVIS基准上达到47.0 AP,超越现有最佳的38.5 AP,并在视频跟踪等任务上也有显著提升。 nanochat:由Karpathy开发的ChatGPT开源“教 …
阅读更多TRL团队成功复现LoRA,提升模型性能-Clement Delangue TRL团队宣布成功复现了LoRA(Low-Rank Adaptation)技术,旨在帮助开发者在TRL框架中充分利用LoRA的强大性能,以熟悉的方式实现模型性能的最大化。此举意味着研究人员和开发者将能更高效地进行大语言模型的微调,进一步优化模型在特定任务上的表现,同时降低计算资源的需求,推动AI应用领域的快速发展和迭代。 AI时代软件开发与编程基础的重要性-宝玉 关于AI在软件开发中的应用,专家强调,尽管AI工具日益普及,但缺乏编程经验的用户若想开发复杂的系统,仅靠自然语言通常只能构建出勉强运行的原型,难以达到生产标准。他指出,要善用如Codex等AI编程 …
阅读更多AI Agents赋能短视频创作流程标准化-orange.ai 用户@dontbesilent12(由@oran_ge转推)发布了一份长达6000字的SOP(标准操作程序),详细阐述了如何利用四个AI Agent完成短视频创作中80%的工作。该作者强调,这并非简单的“AI一键出爆款”,而是通过将自媒体创作流程细化,形成一套可重复验证的方法论。这表明AI正被用于构建更加系统化和高效的创作工作流,为内容生产者提供了实现流程自动化和规模化生产的有效途径。 Emad Mostaque预测AI将重塑软件开发-Emad Stability AI创始人Emad Mostaque预测,在未来几年内,AI代码模型将变得极其高效,能够从零开始重写任何 …
阅读更多在过去4小时内,AI领域讨论聚焦于不同大型语言模型的性能评估和未来展望。有观点指出特定模型在编程能力方面的表现,以及对新版本发布所寄予的期望。 GPT-5-Codex 模型表现强劲 - 宝玉 有分析指出,在模型选择上,GPT-5-Codex 模型被认为非常强大,尤其是其high版本。尽管目前Codex在工具集成方面可能稍显不足,但其核心模型的性能得到了高度肯定。这一观点强调了模型底层能力的重要性,即便外部工具链有待完善,强大的模型基础仍是关键。 Gemini 2.5 Pro 编程能力突出但 Agentic 能力受限 - 宝玉 针对Gemini Pro系列模型,有用户评价Gemini 2.5 Pro在编程能力方面表现出色,但其 …
阅读更多OpenAI 重置 GPT-5-Codex 使用限额 - 宝玉 OpenAI 已重置所有用户的 GPT-5-Codex 使用限额,以弥补此前因部署额外GPU导致的模型速度减慢。此举旨在让用户能更充分体验新模型。此外,OpenAI 本周将继续增加算力,确保系统运行流畅性和稳定性,这对于依赖该模型进行编码工作的开发者而言是一个重要利好消息。 AI 编程时代程序员如何发展 - 宝玉 随着AI编程能力日益增强,程序员的价值焦点正从基础编码技能转向架构能力、技术管理能力。面对AI辅助编程带来的效率提升与潜在的维护困难,专家建议开发者应以自身为主导,利用AI辅助编程加速任务交付,同时将重心放在复杂任务的抽象拆分、多Agent协作管理及结果验收 …
阅读更多AI对软件工程师就业的影响:从“Vibe Coding”到“Vibe Coding Cleanup Specialist”-Gary Marcus Gary Marcus关注了AI对软件工程就业的影响,并转发了一条推文指出AI并非取代软件工程师,而是创造了更多新岗位,例如“Vibe Coding Cleanup Specialist”(氛围编码清理专家)。这表明随着AI在代码生成中的应用,新的专业角色正在出现,以处理AI生成代码的质量、一致性及优化问题,反映了人机协作模式下劳动力市场的新变化。 旧金山科技圈“996”工作文化加剧,数据揭示周末加班新常态-宝玉 旧金山科技圈的“996”工作模式正日益普遍,这一趋势得到了企业信用卡消费 …
阅读更多