2025.12.22.00 过去4小时全球AI发生了什么?

  1. Redis之父Salvatore Sanfilippo:2025年AI反思八大观点-宝玉

    Redis之父Salvatore Sanfilippo发表了对AI的年终反思,包含八项主要观点。他认为,“随机鹦鹉”说法已不再被广泛接受,因为LLM在专业考试中表现出色并展现出内部概念表征。思维链(CoT)被低估,它通过内部表征采样和强化学习来提升推理能力。算力扩张瓶颈因可验证奖励的强化学习而打破,使模型能在特定任务上自我提升。程序员对AI辅助编程的态度从怀疑转向接受,因其高投入产出比。Salvatore对Transformer架构持开放态度,认为它仍有潜力达到AGI。他强调思维链并未改变LLM的本质,而ARC测试从反LLM立场转为支持。最后,他指出AI未来20年的根本挑战是避免灭绝

  2. Codex AI编程工具引入Skills机制-歸藏(guizang.ai)

    Codex AI编程工具正式引入了Skills机制,旨在解决其长期存在的对“Plan模式”支持不足的问题。现在,用户只需在提示词中加入$plan即可调用内置的规划技能,或使用execplan实现更复杂的任务规划。这一更新显著提升了AI在编程任务中的自主性和效率,使得模型能够更好地理解和执行多步骤的复杂指令,从而改善开发者体验和代码生成质量。此前来自宝玉的转发也印证了这一重要更新。

  3. Nano Banana Pro提示词分享与模型“降智”现象讨论-歸藏(guizang.ai) / Orange AI

    “Nano Banana Pro”发布了有价值的提示词,例如通过详细描述为家乡生成城市数字艺术海报,能自动根据城市调整艺术风格、字体装饰、地理信息、景观和建筑等元素,展示了其强大的定制化渲染能力。然而,也有用户指出,如同GPT4和Sora等其他大模型一样,Nano Banana Pro也出现“出道即巅峰,随后降智”的现象,即模型效果在早期达到顶峰后逐渐下降,这可能是由于审核、量化或成本控制等原因,进而影响用户留存。

  4. 利用Gemini生成高质量信息图的技巧-宝玉

    宝玉分享了使用Google Gemini生成高质量信息图的几项关键技巧。首先,建议利用Gemini在生成前进行推理、信息提炼和提示词优化,以充分发挥大语言模型的潜力。其次,由于模型出图具有随机性,需要通过“抽卡”方式获取满意结果。最后,获得初步成果后,进行必要的微调是提升最终质量的重要步骤。这些技巧揭示了在实际应用中获得优质AI生成内容的策略,强调了人机协作的重要性,并暗示成功背后可能有多次尝试。

  5. Ranke-4B:一个基于历史数据训练的语言模型-宝玉

    Ranke-4B被描述为一个“时光琥珀LLM”,其独特之处在于仅使用1913年之前的数据进行训练。这意味着该模型虽然掌握了语言结构,却对后续的重大历史事件(如世界大战、西班牙大流感)一无所知。这种“时间胶囊”式的训练方法为研究人员提供了一个有趣的工具,可以探索与该模型讨论现代性话题时,其生成内容与当今认知的差异,从而深化对语言模型知识边界和推理能力的理解,为历史语言学和AI哲学研究提供了新视角。

  6. AI加速游戏开发效率-Fei-Fei Li

    一条转发消息强调了AI在加速内容创作方面的显著能力,提到有团队在短短8周内开发完成了一款游戏,而这在传统技术下通常需要12个月。这一案例突显了人工智能技术,特别是生成式AI,在游戏开发流程中带来的颠覆性效率提升。通过自动化和优化多项开发任务,AI使得小型团队也能实现此前需大型企业和政府级别资源才能完成的项目,极大降低了创作门槛并加速了产品上市周期,展示了AI对创意产业的深远影响。

  7. AI领域未来趋势预测-merve

    Merve分享了对未来AI发展的多项预测,指出2026年将是AI for Science的关键一年,Google DeepMind、Periodic Labs等将成为前沿实验室,CERN等科学机构也将发布模型和数据集。此外,预测还包括强化学习环境(如OpenEnv库)和训练即服务(TaaS)的普及。在模型层面,将出现更小、能力更强且幻觉更少的Omni模型,它们将具备更强的推理能力。同时,设备端多功能控制器(MCP)智能代理有望控制手机,以及计算机视觉机器人技术将走向主流,特别是基于视觉/文本提示的基础模型和能解决分割任务的VLM。

  8. AI辅助PPT制作方案-宝玉

    宝玉分享了关于AI辅助PPT制作方法的资源链接,包括“更好的方案来了”和“Slide Deck”等,这反映了利用人工智能工具来简化和优化演示文稿创作流程的趋势。AI技术可以协助用户在内容生成、设计布局、视觉元素选择以及排版优化等方面,提高PPT制作的效率和专业水平。这些工具能够让即使没有专业设计背景的用户也能快速产出高质量、具有吸引力的演示文稿,从而节省大量时间和精力。