模型更新 | 72Live中文网

2025.12.06.16 过去4小时全球AI发生了什么？
Dec 6, 2025 · 1 分钟阅读 ·
分享到:
Google Gemini 3 Deep Think预测2026年AI行业趋势-歸藏(guizang.ai) 谷歌发布了由Gemini 3驱动的Deep Think模型，并基于OpenRouter报告分析了2026年AI行业发展趋势。预测指出，推理成本的急剧下降将促使云厂商的商业模式从“按Token收费”转向“按任务结果收费”，即企业将为“成功修复一个Bug”或“完成一次法律合规审查”等结果付费。此外，AI基础设施将全面重构以支持“长程记忆”服务，允许AI Agent在云端保持数小时甚至数天的工作记忆和上下文环境，无需每次重新上传数据，这将极大提升AI应用的连贯性和效率。阿里巴巴发布Qwen3-TTS语音合成模型-小互阿里巴巴 …

阅读更多
2025.11.09.20 过去4小时全球AI发生了什么？
Nov 9, 2025 · 1 分钟阅读 ·
分享到:
Nano Banana 2 测试结果及能力展示 - 歸藏(guizang.ai) AI模型 Nano Banana 2 预计即将上线，近期有用户报告其曾在Media IO平台短暂开放选项。根据短暂上线期间的测试结果，该模型在多个关键领域展现出显著提升。具体测试显示，其在画面细节、图像一致性以及文本渲染方面均有大幅改善。此外，Nano Banana 2在文本呈现、信息图表、世界知识、图表处理、多语言支持以及遵循指令方面表现突出。业界期待此次升级能有效提升其对中文处理的能力。

阅读更多
2025.09.30.16 过去4小时全球AI发生了什么？
Sep 30, 2025 · 1 分钟阅读 ·
分享到:
Anthropic的战略方向与Sonnet 4.5的上下文管理能力-宝玉有观点认为，Anthropic在编程领域虽然取得过成绩，但可能为OpenAI和Google趟了路，目前在编程和Agent方面被追赶甚至超越，其他领域缺乏突出表现，并预测Gemini 3.0发布后可能进一步超越。与此同时，Anthropic新推出的Sonnet 4.5模型在上下文压缩方面展现出显著进步，其**“状态管理”能力**（即模型能有效“记笔记”以保存关键任务信息）被用户称赞，认为这有助于模型在长对话中保持性能，甚至超越了GPT-5在这一方面的表现。 Shopify将整合GPT实现商家商品搜索-歸藏(guizang.ai) Shopify宣布将整合GPT …

阅读更多
2025.09.28.20 过去4小时全球AI发生了什么？
Sep 28, 2025 · 1 分钟阅读 ·
分享到:
腾讯开源生图模型 3.0 亮相，具备强悍文字生成与世界知识理解能力-歸藏(guizang.ai) 腾讯最新开源的生图模型 3.0，参数高达 80B，在美学表现、文字生成与世界知识理解方面取得了显著提升。该模型能够生成包括中文在内的较长文字，支持复杂排版和艺术字体设计，甚至能图解中学几何题，媲美头部图像模型如Banana。虽然目前尚不支持图像编辑功能，但有消息称该能力有望在国庆后上线。其强大的世界知识和推理能力，结合微调潜力，预示着广泛的应用前景。 Google DeepMind Veo 3 达到视觉AI的“GPT-3”时刻-小互 Google DeepMind的研究揭示，Veo 3 在视觉AI领域可能迎来了“GPT-3”时刻。该模 …

阅读更多
2025.09.24.20 过去4小时全球AI发生了什么？
Sep 24, 2025 · 1 分钟阅读 ·
分享到:
AI如何取代你的知识工作：一个三步走的流程 - Emad Emad M. 阐述了AI取代知识型工作的三个关键步骤。首先，AI会抓取你在Slack、GitHub和文档中的所有数字足迹，包括每次互动、代码提交和备忘录。接着，AI会部署你的数字分身作为“助手”，该分身能够从你的错误中学习，优化最佳实践，并全天候24小时可用。最终，这个“有才华的AI”将全面接管工作，形成一种“模仿即服务”（Mimic-as-a-service）的模式。这一过程预示着AI将成为专业环境中一个持续存在、自我改进的运营实体。阿里巴巴发布新模型及万相2.5产品动态 - orange.ai 阿里巴巴在今日发布了强大的新AI模型，其在展馆中的多个站台也备受关注，展 …

阅读更多
2025.09.20.00 过去4小时全球AI发生了什么？
Sep 20, 2025 · 1 分钟阅读 ·
分享到:
ElevenLabs 推出全新音视频编辑平台 Studio 3.0-小互 AI语音技术公司ElevenLabs发布了其全新的音视频编辑平台 Studio 3.0。该平台在一个统一界面内集成了AI语音合成、音频编辑、音效添加等多种功能。其核心能力包括自动配音（支持多语言和音色）、语音转文字、声音克隆、根据描述生成背景音乐与音效、多语言配音（自动翻译并生成配音），以及音频清理（去除噪音）。这一平台旨在为内容创作者提供更高效的音视频制作工具。 Wan 团队开源唇形与动作同步模型 Wan‑Animate-歸藏(guizang.ai) Wan团队发布了其强大的开源唇形和动作同步模型 Wan‑Animate。该模型具有极高的自定义程度，能够同 …

阅读更多
2025.09.18.20 过去4小时全球AI发生了什么？
Sep 18, 2025 · 1 分钟阅读 ·
分享到:
即梦 4.0 图片 4K 生成依然免费 - 歸藏(guizang.ai) 知名AI图像生成平台即梦 (Guizang AI) 近日宣布，其即梦 4.0 版本的图片 4K 生成功能将继续保持免费。这一举措对于广大AI艺术爱好者和内容创作者而言无疑是个好消息，意味着用户可以持续以高分辨率输出高质量的AI生成图像，无需承担额外费用，进一步降低了AI创作的门槛，促进了AI图像生成技术的普及和应用。 IBM 发布小型文档 VLM 模型 Granite-Docling-258M - merve IBM 最新发布了一款名为 Granite-Docling-258M 的小型文档视觉语言模型 (VLM)。该模型专门设计用于将 PDF 文档转换为 …

阅读更多
2025.09.14.00 过去4小时全球AI发生了什么？
Sep 14, 2025 · 1 分钟阅读 ·
分享到:
Fei-Fei Li 回顾 ImageNet 的核心价值-Fei-Fei Li AI领域知名学者李飞飞（Fei-Fei Li）转发推文，回顾了ImageNet的独特价值。她指出，ImageNet拥有精心策划的训练数据集和明确定义的测试协议，这些特质使其在过去带来了深刻的满足感。这番言论是在AI模型日益复杂、数据集来源多样化的背景下，对基础研究和数据质量重要性的一种再强调，引发了对当前AI训练数据和评估标准的反思。文心一言（ERNIE Bot）登顶 Hugging Face 榜单-clem 🤗 Hugging Face CEO Clement Delangue转发推文，宣布**文心一言（ERNIE Bot）**或其相关模型 …

阅读更多