2025.09.26.12 过去4小时全球AI发生了什么?
OpenAI九月份的一篇论文深入探讨了大语言模型产生“幻觉”的根本原因。研究指出,即使训练数据无误,模型在优化目标下仍可能因无法区分事实与错误而自然产生幻觉,且训练数据中“单例事实”越多,幻觉率越高。核心问题在于现有评测机制的激励错位,鼓励模型“猜测”而非表达不确定性。为解决此问题,论文建议修改评测标准,让模型在不确定时选择“我不知道”也能获得分数,并设定“信心阈值”,从而从根本上减少幻觉,提升AI系统的可信度。
人口仅1.6万的加勒比海小岛国安圭拉共和国,因其国家顶级域名“.ai”与“人工智能”的缩写不谋而合,意外成为全球科技公司和AI爱好者争相注册的热门域名。在1980年代,国际互联网号码分配局(IANA)随意分配了“.ai”给安圭拉,当时并无特殊意义。然而,随着AI技术的爆发,该域名价值飙升。据悉,仅2023年一年,“.ai”域名注册费就为安圭拉带来了3900万美元的收入,相当于该国GDP的四分之一,使其成为AI时代一个独特的受益者。
小道消息:谷歌Gemini 3或将提前于十月初发布-歸藏(guizang.ai)
有未经证实的小道消息指出,谷歌的下一代大型语言模型Gemini 3有望提前发布,预计将在今年十月初面世。这一潜在的提前发布表明谷歌可能正加速其在AI领域的布局和产品迭代,以应对日益激烈的市场竞争。Gemini系列作为谷歌在大语言模型领域的重要进展,其新版本的发布预计将带来性能上的显著提升和多模态功能的进一步拓展。
OpenAI首席研究官Mark Chen:编程正走向“凭感觉编程”-宝玉
OpenAI首席研究官Mark Chen表示,AI技术正在深刻改变编程的默认方式,未来可能演变为“凭感觉编程”(vibe coding)。他分享与高中生交流时,他们普遍认为默认的编程方式就是依靠AI的辅助,而非从头实现所有机制。Chen认为,亲手从零开始编程对年轻一代而言已是奇怪概念。他预见未来研究领域也可能出现“凭感觉做研究”(vibe researching),强调AI在创造性工作中的辅助作用将日益增强,使人类更专注于高层次的思考和创造。
科技巨头Meta再次从竞争对手OpenAI挖角,成功招募到华人顶尖研究员宋飏(Yang Song)。宋飏在AI圈内被公认为“超级大牛”,拥有“最强大脑”级别的实力。此次人才流失是Meta从OpenAI挖到的最重量级人才之一,显示出各大公司在AI领域对高端人才的激烈争夺。宋飏的加入无疑将进一步增强Meta在AI研究,特别是在生成模型和扩散模型等前沿技术方面的实力。
国产AI视频工具将实现“一图变演员”,支持20+语言-向阳乔木
一款强大的国产AI视频工具即将于国庆节后正式发布,该工具能够通过一张图片,让任意AI角色变身为“演员”,并支持用户通过文本描述来控制表演和声音。该工具支持超过20种语言,并且对中文的本地化支持表现完美。这一进展显示出中国在AI视频生成领域的快速发展,有望为内容创作带来新的可能性,降低视频制作门槛,实现更灵活的叙事和表现形式。
“即梦”平台近期推出了一项便捷的图片去水印功能。用户在AI生成图片后,只需点击想要的图片,选择“去画布进行编辑”,然后在编辑界面中右键保存图片即可获得无水印版本。这项功能旨在提升用户体验,让用户更方便地获取和使用AI生成的图片素材,无需额外工具进行后期处理,确保了图片内容的干净完整性和可用性。
Google DeepMind发布全新机器人模型:能主动思考与泛化-小互
Google DeepMind发布了全新的Gemini Robotics 1.5机器人模型,它能够主动思考、理解环境、自主规划步骤并执行任务。该模型由两个核心部分组成:Gemini Robotics 1.5 (VLA)负责把视觉和语言指令转化为实际动作,而Gemini Robotics-ER 1.5 (VLM)则专注于推理、任务规划和外部工具调用。这一创新系统在15个学术基准测试中达到了SOTA(最优性能),并允许学习到的技能在不同机器人平台间迁移,极大提升了机器人完成复杂任务的能力和泛化性。
Emad Mostaque:AGI路径或在于模拟经济而非物理世界-Emad
Stability AI的CEO Emad Mostaque提出一个引人深思的观点,认为实现通用人工智能(AGI)的路径,可能不是模拟物理世界,而是模拟经济系统。他区分了“体力劳动AGI”和“知识工作AGI”,暗示通过理解和模拟复杂的经济交互与知识流转,或许能更快地实现高级认知智能。这一视角为AGI的研究提供了新的方向,强调了社会和经济环境对智能发展的重要性。
NVIDIA在Hugging Face发布大规模ESM-2 Uniref蛋白质预训练数据-clem 🤗
NVIDIA近期在Hugging Face平台上发布了ESM-2 Uniref预训练数据集。这份大规模数据集包含超过1.87亿条蛋白质序列,旨在推动蛋白质结构预测和功能理解方面的研究。ESM-2 Uniref数据集的公开,将为全球AI研究人员提供丰富的生物信息学资源,加速生物AI领域的发展,尤其是在药物发现和生物材料设计等应用场景中,有望为新型蛋白质设计和疾病治疗带来突破。