以下是过去4小时全球AI领域的精选动态: FunctionGemma模型发布,主打函数调用功能 osanseviero和merve等用户转发宣布了FunctionGemma模型的推出。这款270M参数的模型专门为函数调用设计,具备在手机、浏览器及其他设备上运行的能力。它旨在高效执行特定功能,有望在边缘计算和轻量级AI应用中发挥关键作用,为开发者提供更灵活的AI集成方案。 Google Gemma 4即将发布?市场传闻不断 据kimmonismus和testingcatalog等账号转发的消息,有强烈迹象表明Google可能在今天发布其Gemma 4模型。这些猜测源于Google的Gemma模型家族集合最近进行了更新,引发了社区对新一 …
阅读更多AI 行业动态与技术进展 Andrew Ng 发布 E2B 编码代理新课程,赋能AI执行代码 吴恩达宣布推出与 E2B 合作的“使用工具执行构建编码代理”新课程。该课程旨在教授如何构建能编写、执行代码以完成任务的 AI 代理,突破了传统 AI 代理仅限于预定义函数调用的局限。学习者将掌握在沙盒云环境中安全运行代理生成代码的技能,并能创建数据分析和全栈开发代理,处理复杂任务。 Mistral AI 发布多模态模型 Ministral 3,支持免费微调 Mistral AI 推出了其最新多模态模型家族 Ministral 3。据悉,这些模型功能强大,并且用户可以在 Colab 上免费进行微调。这一举措有望降低多模态 AI 模型的使用门 …
阅读更多以下是过去4小时全球AI领域的精选动态: Andrew Ng推出AI编程代理新课程 斯坦福大学教授Andrew Ng宣布推出全新课程“使用工具执行构建编码代理”(Building Coding Agents with Tool Execution),由E2B的Tereza Tizkova和Fra Zuppichini授课。该课程旨在教授学员如何构建能够编写和执行代码的AI代理,以完成复杂任务,突破传统AI代理仅限于预定义函数调用的限制。学员将学习在沙盒云环境中安全运行代理生成的代码,并创建能够利用Pandas进行数据分析或构建Next.js全栈应用的代理。 Mistral AI发布Ministral 3系列多模态模型 Mistral …
阅读更多以下是过去4小时全球AI领域的最新动态: DeepSeek开源数学推理大模型DeepSeek-Math-V2,超越GPT-5与Gemini获IMO金牌水平-小互 DeepSeek发布并开源了其数学推理大模型DeepSeek-Math-V2,该模型在国际数学奥林匹克(IMO)竞赛中展现出金牌水平,成功解出6题中的5题,并在中国数学奥林匹克(CMO)及普特南(Putnam)大学数学竞赛中表现出色。DeepSeek-Math-V2的核心创新在于其“生成 + 验证 + 复审”的自我验证系统,能自动生成数学证明、自行检查逻辑严谨性并修正错误。在五大数学领域,它全面超越了GPT-5-Thinking和Gemini 2.5 Pro,以高准确率、严 …
阅读更多FLUX.2模型发布:图像生成与编辑的新进展 - merve FLUX.2图像生成与编辑模型已正式发布。该模型采用单一文本编码器(Mistral Small 3.1)和DiT架构,并支持多种量化方案(QLoRA),旨在优化推理和训练,同时降低对高显存的需求。测试表明,FLUX.2在精准色值控制和2K分辨率下的一致性方面表现出色,部分超越Banana模型,但中文理解和多模态推理能力仍有提升空间。它还支持使用SAM3掩码进行图像和视频的点提示修补。 企业技能提升:AI与人类的结合 - Peter H. Diamandis, MD Peter H. Diamandis博士预测,在不久的将来,所有中小型和大型企业都需要引入“技能提升合作伙 …
阅读更多Meta发布多语言MetaCLIP2模型,支持300+语言进行图像↔文本搜索 - merve Meta公司最新发布了多语言MetaCLIP2模型,该模型支持超过300种语言,极大地拓展了图像与文本之间的跨语言搜索能力。开发者可以利用这些模型在多语言数据库中进行高效的图像到文本或文本到图像的检索。相关的模型集合和使用FAISS与transformers的Jupyter Notebook也已公开,方便社区进一步探索和应用。 字节跳动AI编程工具TRAE SOLO版正式上线并限时免费 - 向阳乔木 字节跳动的AI编程工具TRAE SOLO版已正式上线,并取消了邀请码限制,同时提供限时免费至11月15日23:59。该工具亮点包括使 …
阅读更多以下是过去4小时全球AI领域的重点新闻回顾: Google 推出「Grounding with Google Maps」功能,让Gemini拥有地理空间理解能力-小互 Google 重磅发布「Grounding with Google Maps」功能,将 Gemini 大模型深度整合到 Google Maps 中。这项更新使 Gemini 能够直接访问 Google Maps 拥有的超过2.5亿个实时地理数据,赋予 AI 模型强大的“地理空间理解与推理能力”。现在,AI 不仅能理解文本,还能“理解地理空间”,这意味着它能够回答关于世界各地地点“是什么、在哪儿、有什么、什么时候开门、如何订票、如何到达”等一系列复杂问题。 …
阅读更多2025 人工智能现状报告:OpenAI保持领先,中国AI实力崛起-小互 《2025年人工智能现状报告》揭示,OpenAI 在前沿AI领域仍维持“微弱领先”地位,但竞争态势日益激烈。报告指出,Meta 在开源AI领域的领导力正逐渐削弱,而中国的 DeepSeek、Qwen(通义)、Kimi 等模型在推理和编程任务上已展现出接近 GPT-5 的性能,使其成为“可信赖的全球第二极”。此外,报告强调AI正经历从单纯的“生成内容”到“执行任务、规划目标、验证逻辑”的转型,模型已能分解复杂任务、逐步验证逻辑并自我修正,这被视为“可解释的通用智能雏形”。 Google 推出 Gemini Enterprise:赋能企业级AI助手与自动化- …
阅读更多ServiceNowRSRCH 发布 Apriel-1.5 推理视觉语言模型-merve ServiceNowRSRCH 近期推出了一款名为 Apriel-1.5 的全新推理视觉语言模型,展示了其强大的跨语言理解和推理能力。该模型在一次测试中成功地识别了法文药物标签中的药物相互作用,并用英文给出了结果。此外,它还能对矿物质进行比较,并生成准确的查找表,凸显了其在处理复杂信息和生成结构化数据方面的卓越表现。
阅读更多以下是过去四小时内全球AI领域的主要动态: DeepSeek模型与DS应用差异及用户期望解析-宝玉 宝玉澄清了DeepSeek模型与DS应用之间的区别,指出模型权重是固定的,而DS应用调用搜索引擎的搜索结果可能受到SEO污染影响,这与模型本身无关。同时,许多用户对DeepSeek的不满并非源于模型性能下降,而是因为用户期望值随时间推移而提高,而DeepSeek R1已是近一年前的模型,未能满足当前更高的标准。 Codex专业用户Token使用状态与限制解析-宝玉 宝玉分享了在Codex中通过输入/status命令即可查看Token使用状态的功能。他提到,专业用户虽然有Token用量限制,但在正常使用强度下通常不易达到上限。以他个人为 …
阅读更多