ERNIE-4.5-21B-A3B-Thinking 登顶 Hugging Face 趋势榜-clem 🤗 百度文心ERNIE-4.5-21B-A3B-Thinking模型在全球领先的AI社区Hugging Face上荣登总榜第一,标志着其在大型语言模型领域的强大实力和广泛关注度。这一成就显示了国产AI模型在国际舞台上的竞争力,吸引了开发者和研究者对该模型的关注,进一步推动了其在AI应用和研究中的发展。 Claude 推出 AI 驱动的办公文件转换与生成功能-向阳乔木 Claude 上线了新的实验性功能,允许用户通过 AI 自动进行办公文件格式转换及内容生成,涵盖 Excel、Word、PPT 和 PDF 等。用户只需在设置中启 …
阅读更多今日全球AI动态聚焦于技术的深度融合与垂直应用落地。阿里巴巴推出的Qwen3-Next新架构,通过稀疏专家混合(MoE)技术展示了业界对大模型效率优化的新路径。同时,AI正加速渗透企业服务,Adobe推出面向客户体验的AI代理,PayPal则利用AI赋能跨境支付,金山办公与华为的合作也标志着AI办公进入一体化方案时代。在终端应用上,微软Edge浏览器测试的实时音频翻译功能,预示着AI向客户端的延伸,而汽车行业则在自动驾驶(东风日产)和VR培训(宝马)等领域,持续探索AI的边界。 Alibaba推出Qwen3-Next,作为一种更高效的LLM架构 阿里巴巴Qwen团队发布了Qwen3-Next,一种旨在提升超长上下文场景下训练和推理效 …
阅读更多Ling-mini-2.0:16B-A1B MoE LLM宣布开源-clem 🤗 Ling-mini-2.0,一个拥有 16B-A1B MoE(混合专家)架构的大型语言模型,已宣布开源。该模型经过 20万亿+ tokens 的训练,并结合了 SFT (监督微调)、RLVR (基于人类反馈的强化学习) 和 RLHF (人类反馈强化学习) 等多种训练方法。据称,其生成速度高达 300+ tokens/秒,比现有模型快 7倍。这一发布有望加速开源社区在MoE架构LLM领域的发展和应用。 ChatGPT与Claude记忆功能对比:两种截然不同的哲学-宝玉 宝玉详细分析了 ChatGPT 和 Claude 在记忆功能上的根本性差 …
阅读更多开放权重是多任务、多领域、多语言的未来趋势 - clem 🤗 Hugging Face的联合创始人Clement Delangue强调,**开放权重(open weights)**模型是未来许多AI任务、领域和语言的关键前沿。他指出,通过强化学习(RL)根据特定约束条件对模型进行专业化,开放权重模型的优势将更加显著。这表明了对开源AI社区和定制化模型潜力的坚定信心,预示着AI技术将以更灵活和适应性强的方式发展。 Groq 模型现已通过 Hugging Face 直接在 VS Code 中访问 - clem 🤗 (via GroqInc) Groq公司宣布,其模型现在可以通过Hugging Face直接在Visual Studio …
阅读更多Hugging Face Transformers v5 版本即将发布-merve Hugging Face宣布其Transformers库即将发布v5版本。这一重要的里程碑式更新在数月预告后终于启动,预计将带来Transformers库的重大改进和新功能,对AI模型开发和研究社区产生积极影响,预示着更强大的模型集成与更高效的开发体验。 Hugging Face 推理提供商集成至 GitHub Copilot Chat-merve 从今天起,用户可以在GitHub Copilot Chat中直接使用Hugging Face推理提供商(Inference Providers)。这意味着开发者能够更便捷地集成和利用Hugging …
阅读更多火山引擎免费开放顶级Seedream 4.0生图模型,API支持4K与去水印-向阳乔木 火山引擎现已免费开放其顶级Seedream 4.0生图模型,用户无需API或积分即可使用。该模型在架构上与Nano Banana类似,具备4K高清图片生成能力,并提供出色的中文支持。Seedream 4.0被认为具有巨大潜力,在多个场景下表现不俗。最值得关注的是,火山引擎还支持API接入,允许用户直接生成4K图片并去除水印,预计将催生大量基于此模型的AI原生产品。该模型已通过多种案例展示其强大的图像生成能力,包括设计乐队海报、可视化解数学题、生成衍纸艺术绘本、模拟烹饪过程、创建Q版玩偶蓝图以及生成表情包和手办。 Claude AI助手上 …
阅读更多以下是过去4小时全球AI领域的精选动态: PaddleOCRv5 发布并登陆 Hugging Face Hub - merv PaddleOCRv5 现已在 Hugging Face Hub 上发布,采用 Apache-2.0 许可证。尽管模型尺寸仅为 70M,但其基准测试结果表现“惊人”,展示了其高效而强大的性能。这一发布为开发者和研究人员提供了易于获取且性能卓越的 OCR 工具。 Anthropic 分享 AI Agent 工具开发经验,强调 Claude Code 优势 - 宝玉 Anthropic 工程团队发布了《为 AI 智能体打造高效工具》的技术文章,强调其 Claude Code 作为最强编程 Agent 的地位。该文 …
阅读更多以下是过去4小时全球AI领域的一些重要动态: Google AI 端侧模型体验应用上线 Google Play - 歸藏(guizang.ai) 谷歌已将其端侧模型体验应用“Google AI Edge Gallery”上架 Google Play 商店。用户现在可以直接搜索并安装此应用,其中集成了谷歌所有的 Gemma 端侧模型。该应用支持多种功能,包括图像识别、音频对话以及常规的文字对话,旨在为用户提供便捷的本地AI模型体验。 Anthropic 发布《如何为 Agent 构建工具》新文章 - 歸藏(guizang.ai) Anthropic 发布了一篇关于“如何为 Agent 构建工具”的新文章,强调了 Agent 工具设计需 …
阅读更多今日全球AI领域风起云涌,资本与战略布局成为绝对焦点。OpenAI与甲骨文签下高达3000亿美元的历史性云服务大单,凸显了顶级玩家对未来算力的疯狂押注。与此同时,微软正加速自研芯片集群建设,谋求技术自主,其与OpenAI的关系在合作与竞争中变得更加微妙。技术层面,阿里云发布并开源新一代高效模型架构Qwen3-Next,将行业竞争引向推理效率的深水区。从具身智能创业潮到AI在情感陪伴领域的渗透,应用场景持续拓宽,预示着AI正从底层基建到上层应用全面重塑产业生态。 Oracle与OpenAI达成3000亿美元云交易,创历史最大规模之一 OpenAI与甲骨文(Oracle)签署了一份为期五年、总价值高达3000亿美元的云服务协议,该协议将 …
阅读更多Replit 推出 Agent 能力重大创新与全新设计-Amjad Masad Replit 宣布对其平台进行全面优化,推出了Agent 能力的重大创新,并对用户界面进行了流线型重新设计。此次更新旨在提升开发者的编程体验,并增强AI Agent在Replit生态系统中的功能和交互效率,使其能更好地辅助代码编写和项目开发。 Emad Mostaque 宣布新公司致力于可验证的超级智能-Emad ChrSzegedy 宣布成立一家新公司,专注于通过自动化形式化 (autoformalization) 来创建可验证的超级智能 (verified superintelligence)。此举标志着在追求高级AI能力的同时,高度重视AI的可靠 …
阅读更多