2025.11.07.12 过去4小时全球AI发生了什么?
Google 推出 File Search Tool,RAG 系统集成至 Gemini API-小互
Google 近期推出了File Search Tool,这是一个完全托管的RAG系统,现已直接集成到Gemini API中。此工具将传统RAG系统复杂的流程(如文件分块、向量嵌入、数据库存储和语义检索)简化为一行API调用。用户可以上传PDF、Word、TXT、JSON及各类源代码文件,Gemini将自动进行索引、向量嵌入与语义检索,并基于文件内容生成带引用来源的答案。其计费模式为:首次建立索引(生成嵌入)收费,$0.15/100万tokens,而上传、存储和后续无限次查询均免费,极大地降低了开发者和企业构建基于私有知识库AI应用的门槛。
Moonshot AI 发布开源推理导向型语言模型:Kimi K2 Thinking-小互
Moonshot AI发布并开源了其新一代推理导向型语言模型Kimi K2 Thinking,该模型被定位为具备长期思考、决策与多工具协同能力的思考型智能体(Thinking Agent),而非传统生成式模型。它能够以接近人类的方式进行逐步推理,自动调用多种外部工具,并执行长时间、连续、结构化的复杂任务。K2 Thinking的核心流程是“思考—执行—检验—再思考”,可在无人干预下连续执行200-300次工具调用,维持数百步的逻辑连贯推理。该模型拥有1万亿总参数(32B激活参数)和256K tokens的上下文长度,尤其适用于科研、学术、金融、数学以及写作和编程等强推理场景。
AI 专家 Gary Marcus 批评《金融时报》误导性 AGI 报道-Gary Marcus
知名AI研究员Gary Marcus严厉批评《金融时报》一篇题为“AI先驱声称人类水平通用智能已经到来”的报道,指其标题存在严重误导。Marcus指出,文中引用的Yoshua Bengio、Yann LeCun和李飞飞等知名学者,实际上并不认为通用人工智能(AGI)已经实现。他强调,仅仅机器在某些特定任务上达到人类水平,并不意味着其具备通用智能。Gary Marcus呼吁媒体在报道AI进展时,应保持更高的严谨性和准确性,避免过度夸大事实。
Gary Marcus 质疑大规模计算资源投入的必要性-Gary Marcus
Gary Marcus对“为美国和民主广泛利益构建大量计算能力至关重要”这一普遍假设提出质疑。他认为,目前尚不清楚美国已投入的巨大计算量是否已带来明显的军事、生产力、科学或教育优势。他进一步反思,大规模模型是否是未来AI发展的唯一方向,并提出通过有限资源实现像DeepSeek那样重要进展的可能性。Marcus警告,在可能迅速贬值的芯片上投入数万亿美元进行投机性投资,长远来看可能并非明智之举。
AI 发展趋势趋于娱乐化,与大众渐行渐远-Orange AI
有评论指出,当前AI发展正经历一个高度娱乐化的阶段。业界热点围绕OpenAI的官司、国内AI炒股热潮以及B站上流行的AI生成音乐等话题。这种现象使得大语言模型(LLM)、智能体(Agent)和操作系统(OS)等核心技术讨论,似乎离普通大众的认知越来越远。观察者担忧,这种娱乐化倾向可能预示着AI领域正处于一个巨大的泡沫之中,引发了对未来走向和潜在后果的深思。
有用户表达了对Twitter上日益增多的AI编造小故事的厌恶。这些故事被认为利用了人类的好奇心和注意力机制,使得用户一旦开始阅读就难以停止,从而严重干扰了专注力。尽管这类AI生成内容可能吸引大量用户,但发布者个人感受到极度不适,并认为其过度消耗了注意力。该用户表示考虑全面屏蔽此类AI生成内容,以避免持续的干扰和负面体验。
针对书籍写作中配图的挑战,有作者推荐使用napkin.ai这一AI工具。该工具的操作流程便捷:首先,可利用其他AI工具(如Dia)总结章节或段落的核心内容,随后将文本复制到napkin.ai。用户只需选中文本并点击闪电图标,即可快速生成相关的插图。此工具还支持调整图片样式、删减元素,并可直接下载或截图使用。尽管该工具过去曾提供免费无限使用,目前已调整为付费提升额度模式。