Anthropic的战略方向与Sonnet 4.5的上下文管理能力-宝玉 有观点认为,Anthropic在编程领域虽然取得过成绩,但可能为OpenAI和Google趟了路,目前在编程和Agent方面被追赶甚至超越,其他领域缺乏突出表现,并预测Gemini 3.0发布后可能进一步超越。与此同时,Anthropic新推出的Sonnet 4.5模型在上下文压缩方面展现出显著进步,其**“状态管理”能力**(即模型能有效“记笔记”以保存关键任务信息)被用户称赞,认为这有助于模型在长对话中保持性能,甚至超越了GPT-5在这一方面的表现。 Shopify将整合GPT实现商家商品搜索-歸藏(guizang.ai) Shopify宣布将整合GPT …
阅读更多腾讯开源生图模型 3.0 亮相,具备强悍文字生成与世界知识理解能力-歸藏(guizang.ai) 腾讯最新开源的生图模型 3.0,参数高达 80B,在美学表现、文字生成与世界知识理解方面取得了显著提升。该模型能够生成包括中文在内的较长文字,支持复杂排版和艺术字体设计,甚至能图解中学几何题,媲美头部图像模型如Banana。虽然目前尚不支持图像编辑功能,但有消息称该能力有望在国庆后上线。其强大的世界知识和推理能力,结合微调潜力,预示着广泛的应用前景。 Google DeepMind Veo 3 达到视觉AI的“GPT-3”时刻-小互 Google DeepMind的研究揭示,Veo 3 在视觉AI领域可能迎来了“GPT-3”时刻。该模 …
阅读更多AI如何取代你的知识工作:一个三步走的流程 - Emad Emad M. 阐述了AI取代知识型工作的三个关键步骤。首先,AI会抓取你在Slack、GitHub和文档中的所有数字足迹,包括每次互动、代码提交和备忘录。接着,AI会部署你的数字分身作为“助手”,该分身能够从你的错误中学习,优化最佳实践,并全天候24小时可用。最终,这个“有才华的AI”将全面接管工作,形成一种“模仿即服务”(Mimic-as-a-service)的模式。这一过程预示着AI将成为专业环境中一个持续存在、自我改进的运营实体。 阿里巴巴发布新模型及万相2.5产品动态 - orange.ai 阿里巴巴在今日发布了强大的新AI模型,其在展馆中的多个站台也备受关注,展 …
阅读更多ElevenLabs 推出全新音视频编辑平台 Studio 3.0-小互 AI语音技术公司ElevenLabs发布了其全新的音视频编辑平台 Studio 3.0。该平台在一个统一界面内集成了AI语音合成、音频编辑、音效添加等多种功能。其核心能力包括自动配音(支持多语言和音色)、语音转文字、声音克隆、根据描述生成背景音乐与音效、多语言配音(自动翻译并生成配音),以及音频清理(去除噪音)。这一平台旨在为内容创作者提供更高效的音视频制作工具。 Wan 团队开源唇形与动作同步模型 Wan‑Animate-歸藏(guizang.ai) Wan团队发布了其强大的开源唇形和动作同步模型 Wan‑Animate。该模型具有极高的自定义程度,能够同 …
阅读更多即梦 4.0 图片 4K 生成依然免费 - 歸藏(guizang.ai) 知名AI图像生成平台即梦 (Guizang AI) 近日宣布,其 即梦 4.0 版本 的图片 4K 生成功能将继续保持免费。这一举措对于广大AI艺术爱好者和内容创作者而言无疑是个好消息,意味着用户可以持续以高分辨率输出高质量的AI生成图像,无需承担额外费用,进一步降低了AI创作的门槛,促进了AI图像生成技术的普及和应用。 IBM 发布小型文档 VLM 模型 Granite-Docling-258M - merve IBM 最新发布了一款名为 Granite-Docling-258M 的小型文档视觉语言模型 (VLM)。该模型专门设计用于将 PDF 文档转换为 …
阅读更多Fei-Fei Li 回顾 ImageNet 的核心价值-Fei-Fei Li AI领域知名学者李飞飞(Fei-Fei Li)转发推文,回顾了ImageNet的独特价值。她指出,ImageNet拥有精心策划的训练数据集和明确定义的测试协议,这些特质使其在过去带来了深刻的满足感。这番言论是在AI模型日益复杂、数据集来源多样化的背景下,对基础研究和数据质量重要性的一种再强调,引发了对当前AI训练数据和评估标准的反思。 文心一言(ERNIE Bot)登顶 Hugging Face 榜单-clem 🤗 Hugging Face CEO Clement Delangue转发推文,宣布**文心一言(ERNIE Bot)**或其相关模型 …
阅读更多