以下是过去四小时全球AI领域的重要动态: DeepSeek-OCR:通过图像实现文本光学压缩,解决AI长上下文问题-宝玉 DeepSeek-AI实验室发布了一项名为DeepSeek-OCR的创新技术,通过将千字文本压缩成“图片”来显著提升AI处理长文本的能力。该模型能够以10:1的压缩比和97%的准确率重建原始文本,有效解决了AI面临的“长上下文”瓶颈。这种“光学压缩”方法不仅为AI提供了“无限”记忆的新途径,还可能模仿人类的遗忘机制,让AI更高效地处理信息,仅保留关键要点。宝玉分享了一个为Gemini 2.5 Pro模型设计的提示,用于处理该论文PDF并生成结果。 AI Dev 25 x NYC大会议程公布-Andrew Ng …
阅读更多everyone shafts @SchmidhuberAI, even AI: - Gary Marcus AI研究者Gary Marcus评论了AI先驱Jürgen Schmidhuber在AI历史贡献方面受到的关注不足。他指出,即便在AI领域内部,Schmidhuber的成就也常被忽视,并引用了一篇讨论AI发展史与贡献归属的文章,反映了AI社区对于知识产权归属和历史叙述的持续争论。 RT @xiaokedada: #分享 大脑和工具之间的抽象:Skills - 宝玉 宝玉转发xiaokedada的分享,深入探讨了Anthropic新推出的“Skills”功能,并将其与Cursor Rules的设计理念进行了对比。他观察 …
阅读更多Nanonets AI在识别复杂任务上取得新进展-merve 社交媒体上的一条推文对AI公司Nanonets的新能力表示赞赏,指出其在某项“新解锁的任务”中表现出色,甚至达到了人眼无法辨别的精度。尽管推文没有透露具体任务内容或所采用的AI技术细节,但这暗示着Nanonets的AI解决方案可能在需要高精度识别或精细模式分析的领域取得了显著突破。此次进展突显了人工智能在处理复杂且对人类而言极具挑战性的问题上的持续进步。
阅读更多Google推出AI学习平台“Google Skills”,整合顶尖资源并提供官方认证 - 小互 Google近日推出了名为“Google Skills”的AI学习平台,旨在向公众开放Google旗下DeepMind AI研究、Google Cloud、Gemini AI模型开发及Google Education等顶尖团队的内部实训资源。该平台提供真实且可验证的数字证书,据称获得了超过82%招聘方的认可。此外,Google Skills还与150多家合作企业建立了招聘渠道,完成认证的用户有机会被纳入这些公司的“候选人库”并获得面试或实习机会。平台对Google Cloud用户免费开放所有课程和实验,非Cloud用户则可选择每月29 …
阅读更多Meta裁撤田渊栋,OpenAI、XAI、Anthropic等顶级AI实验室伸出橄榄枝-宝玉 据报道,Meta正在裁撤其知名AI研究员田渊栋。在他发布求职推文后,OpenAI、XAI和Anthropic等领先的AI研究机构迅速向他发出邀请,邀请其加入。这一事件不仅凸显了Meta内部的人事调整,更折射出全球AI领域对顶尖人才的激烈竞争和高度重视。同时,这也引发了业界对Meta内部AI项目进展及其策略的猜测。 AI产品具备神奇的留存微笑曲线,传统留存衡量标准不再适用-orange.ai 有观点指出,AI产品的留存曲线与移动互联网时代的产品截然不同,呈现出“微笑曲线”:产品发布之初数据可能最差,但未来几年会持续向好。这主要源于AI技术和 …
阅读更多今日全球AI动态呈现出两大核心趋势:硬件基础的加速与应用场景的纵深拓展。一方面,以特斯拉全力生产AI5芯片为代表,底层算力硬件的竞赛愈演愈烈,为上层应用提供了坚实基础。另一方面,AI正从云端走向终端,渗透至金融、游戏、汽车乃至个人生活等多个垂直领域。巴西将WhatsApp改造为银行柜员,展现了生成式AI在金融普惠上的巨大潜力。然而,微软默认收集玩家数据训练AI以及ChatGPT引发用户心理问题的报告,也为行业敲响了警钟,凸显了在AI大规模落地前,隐私与伦理边界亟待明确。 华为发布鸿蒙 HarmonyOS 6,多项功能迎来AI升级 华为正式发布其最新的操作系统 HarmonyOS 6。新版本引入了“智慧光感”设计理念,并在多个核心功能 …
阅读更多English Version News Discovery Time! Today we are going to explore… Bang! Pop! Wow! (Upbeat intro music)
Hello, super students, and welcome back to our weekly news express! Today, we have two amazing stories for you. First, we’ll sprint over to a university that has created a special class to help students get …
阅读更多Meta AI 部门大调整:将裁减 600 个职位-宝玉 Meta 官方证实将对其 AI 部门进行大规模调整,计划裁减约 600个职位。此次“瘦身”主要影响传统的 基础AI研究部门(FAIR) 和 AI产品与基础设施部门。尽管裁员,Meta 却仍在积极为新组建的“超级智能”团队 TBD Lab 招募人才,显示其战略重心正转向更集中的 AI 产品和基础设施发展。Meta AI负责人王海表示,此举旨在将 FAIR 的研究成果更快地整合到 TBD Lab 的大规模模型运行中,提升团队效率和影响力。 AI 未能降低软件开发成本,但改变了价值分布-宝玉 一项分析指出,尽管 AI 工具显著提升了开发者的效率,但并未降低软件开发项目的总体成本。 …
阅读更多Sonnet 4.5 架构分析-Ben Tossell Ben Tossell分享了由Sonnet 4.5模型进行的一项架构分析的有趣表格。该分析在充分的上下文支持下生成,体现了Sonnet 4.5在复杂数据分析和架构理解方面的强大能力。这表明AI模型在辅助专业领域决策和深入洞察方面正发挥越来越重要的作用,尤其是在需要大量背景信息进行推理的工作中,能够提供高效且精准的辅助。 将学术论文转化为科普文章的提示词-宝玉 宝玉分享了一个精心设计的“学术论文科普”提示词,旨在利用AI将晦涩难懂的学术论文转译成通俗易懂、引人入胜的科普文章。该提示词详细定义了AI作为科普作家的角色、工作流程(包括挖掘研究动机、消化论文核心要素、定位行业坐标 …
阅读更多以下是过去4小时内全球AI领域的重要动态: 百度飞桨发布PaddleOCR-VL:0.9B参数模型超越DeepSeek-OCR,登顶Huggingface趋势榜-小互 百度飞桨团队近日发布了 PaddleOCR-VL 模型,该 0.9B 参数的OCR模型在性能上超越了现有所有OCR模型,并在 Huggingface 全球模型趋势榜上持续登顶。用户实测显示,其在处理中日英多语种混排、复杂公式等复杂场景下表现卓越,甚至优于同期发布的 DeepSeek-OCR。PaddleOCR-VL不仅能够识别文字,更具备对复杂文档进行结构化理解与语义重建的能力,支持109种语言,能精确解析文本、表格、公式与图表,并自动识别版面布局以恢复阅读顺序,可直 …
阅读更多