Meta推出REFRAG技术显著提升RAG性能-宝玉 Meta超级智能实验室发布了名为REFRAG(Make RAG Great Again)的检索增强生成(RAG)优化方案,旨在解决传统RAG速度慢、检索精度不高的问题,回应了“RAG已死”的行业担忧。该方案通过在检索时仅返回少量关键文本内容和大部分文本块的向量,将首次生成延迟缩短了30.85倍,并使上下文长度增加16倍,同时降低2-4倍的token使用量。这标志着对现有RAG技术的重大改进,使其在摘要、多轮对话和检索问答等场景下表现更优,且无精度损失,并可能引发模型间通信方式的变革。 Reddit官方推出AI问答功能以挖掘用户需求-宝玉 Reddit官方近期推出了一项AI问答功 …
阅读更多ChatGPT将放宽内容限制,支持个性化及成人内容-Sam Altman OpenAI首席执行官Sam Altman宣布,ChatGPT计划在未来几周内放宽内容限制,以提供更具人情味的个性化体验,使其更接近用户喜爱的4o版本。Altman表示,在成功缓解了严重的心理健康问题风险并开发出新工具后,公司认为可以安全地放松此前的严格限制。此外,到今年12月,随着年龄验证功能的全面上线,ChatGPT将对通过验证的成年用户进一步放宽限制,允许提供如情色内容(erotica)等。这一举措旨在“将成年用户视为成年人对待”,并满足用户对更具表达力、甚至使用表情包或朋友般交互方式的需求,前提是用户主动选择。 阿里云发布Qwen3-VL 4B和8B …
阅读更多Nanonets 发布 Nanonets-OCR2:全新的 3B VLM 智能识别模型-merve Nanonets 近日推出了 Nanonets-OCR2,这是一款全新的 3B 视觉语言模型 (VLM),专为光学字符识别 (OCR) 任务设计。该模型具备强大的功能,能够识别包括 LaTeX 方程式、表格、手写文字、图表在内的多种复杂内容,并支持多语言处理。此次发布显著提升了 OCR 的能力,使其在处理复杂文档理解任务时更加灵活和高效。 Google AI 中心在印度安得拉邦维沙卡帕特南启动-Demis Hassabis Google 在印度安得拉邦的维沙卡帕特南市设立并启动了其新的 AI 中心。印度总理纳伦德拉·莫迪对此多方面举 …
阅读更多全球AI动态概览 在过去的几个小时内,AI领域涌现出多项进展和重要讨论。技术更新方面,Google对其AI产品NotebookLM进行了升级,集成了Gemini模型以增强视频概述功能;同时,新的AI工具和连接器也相继发布,进一步拓展了AI的应用边界。在开源生态方面,知名研究员Andrej Karpathy发布了新的nanochat项目,展示了开源资源在模型训练和优化中的关键作用。此外,行业领导者也对AI代理的快速发展及其对就业和创业的深远影响表达了看法。 Google NotebookLM升级,融入Gemini图像生成能力 - Demis Hassabis Google正在对其NotebookLM的视频概述功能进行升级, …
阅读更多过去4小时全球AI进展摘要 Suno音乐AI中文发音及歌词遵循能力显著提升-向阳乔木 AI音乐创作工具Suno在中文发音方面取得了显著进步,用户表示其中文歌曲的发音质量大幅提升,能够创作出更具“土俗流行”风格的音乐。此外,Suno在处理复杂歌词时也表现出极高的遵循度,用户能轻松让AI创作出符合特定歌词意境的作品,例如一首感慨AI发展速度的冲浪乐。这表明Suno在多语言支持和内容理解方面正持续优化,为用户提供了更强大的创作工具。 Emad Mostaque提出AI在全球政策制定和政府治理中的潜力-Emad Stability AI的CEO Emad Mostaque呼吁将“通过人类反馈强化学习”(RLHF)的方法应用于全球政策制定,暗 …
阅读更多Sora 2 动漫视频生成技巧与水印机制揭秘-歸藏(guizang.ai) 归藏(guizang.ai) 分享了利用 Sora 2 生成动漫风格视频的详细方法。该教程强调通过优化提示词并上传首帧图片来精确控制画面风格和角色设计,从而创作出更精美的动画视频。文中提供了具体的提示词示例,旨在生成具有“图形设计启发的高风格化美学”的动漫开场视频,特点包括高对比度、黑白与强调色结合、动态排版及抽象几何形状,以及快节奏的剪辑和流畅的“sakuga”动画效果。此外,作者还提到,Sora 2 的 Pro 会员在进行图生视频时会带有水印,而文生视频则没有水印。 Gary Marcus 批评“AI 影响力”与科学的差异-Gary Marcus …
阅读更多以下是过去4小时内全球AI领域的一些重要动态: 人工智能技术飞速发展引人深思 - Peter H. Diamandis, MD 彼得·H·戴曼迪斯博士(Peter H. Diamandis, MD)指出,AI技术在短短两年内取得了惊人的进步,这促使人们思考未来十年AI将发展到何种程度。他强调了技术演进的指数级速度,预示着一个充满无限可能性的未来。 Replit用户利用平台构建个人CRM,彰显AI编码工具价值 - Amjad Masad Amjad Masad转发用户Jarett Gross的推文,展示了Replit在个性化开发中的强大作用。该用户在Replit上构建了一个客户关系管理(CRM)系统,并认为每月25美元的订阅费用物有所 …
阅读更多Claude Code 有望成为 Coding Agent 的事实标准-宝玉 Anthropic的 Claude Code 正被视为未来 Coding Agent 的事实标准,预计除了OpenAI和Gemini之外,会有越来越多的模型采用其进行训练并兼容。这与之前Anthropic提出的MCP(多模型协调协议)被广泛采纳的情况类似。对于需要强大且即时可用Agent的用户,Claude Agent SDK 被推荐为最佳选择,它内置了Claude Code的所有工具,并支持集成国产模型以控制成本,同时允许额外开发工具或连接MCP。对于需要精细控制的开发者,AI SDK 提供了最大的灵活性,但需要自行编写所有工具。Claude Code …
阅读更多以下是过去4小时全球AI领域的主要动态: AI采用速度超越加密货币和互联网-Emad Emad援引RaoulGMI的观点指出,人工智能的普及速度惊人,是加密货币采用速度的3倍,而加密货币的采用速度又是互联网的2倍。这凸显了AI技术当前指数级增长的态势及其对社会和经济的深远影响。 ToB AI Agent在企业落地中的挑战-宝玉 宝玉转发的讨论指出,尽管企业领导者积极拥抱AI,但ToB AI agent在实际落地中面临技术与业务目标之间的内在冲突。老板们一方面追求AI带来的未来感,另一方面又必须兼顾业务KPI和利润,使得技术和业务在agent实施过程中难以完全协同,这揭示了企业AI转型中的复杂性和阻力。 OpenAI被指控对批评者采取 …
阅读更多OpenAI DevDay 2025:Sam Altman 开场演讲核心回顾-宝玉 OpenAI在两年一度的开发者大会(OpenAI DevDay 2025)上公布了多项重大进展。ChatGPT用户从1亿增至8亿,每周活跃开发者翻倍至400万,API每分钟处理Token量增长20倍。大会重点发布了ChatGPT内置应用生态,推出Apps SDK,首批合作伙伴应用已上线,并支持即时结账。同时,AI智能体构建工具AgentKit全面亮相,包含Agent Builder、ChatKit,并升级了Evals评估工具和发布了开源安全模块Guardrails。AI编码工具Codex正式进入商用阶段,使用量显著增长。API方 …
阅读更多