Qwen3-Omni:新的SOTA多模态模型发布 - merve Qwen团队近期发布了Qwen3-Omni,一款全新的、具备“任意到任意”能力的SOTA(State-of-the-Art)多模态模型,并同步推出了两个演示和三款模型变体。Qwen3-Omni是一个30B MoE模型,具有3B的活跃参数,包含指令(instruct)、思考(thinking,用于推理)和字幕生成(captioner,用于稳健语音生成)三种版本。该模型能够理解图像、文本、音频和视频等多种模态,并可输出文本或语音,支持多达119种文本语言、19种语音输入语言以及10种语音输出语言。它同时支持Transformers和vLLM,并在多项视频和音频基准测试中 …
阅读更多ChatGPT个性化设置整合升级 - Sam Altman OpenAI CEO Sam Altman宣布,ChatGPT的个性化设置页面已全面更新。现在,用户可以在一个统一的界面中管理其个性配置、自定义指令和记忆功能,所有这些关键设置都集中于一处。这一改进旨在简化用户体验,使其能更便捷地调整ChatGPT的行为和偏好,以更好地适应个人需求。此项更新将在未来几天内逐步向所有用户推出。 Claude和ChatGPT集成至Xcode 26,赋能原生编码 - 小互 Anthropic的Claude和OpenAI的ChatGPT近日共同宣布,它们现在都支持在Xcode 26中直接通过用户账户登录。开发者将能够使用各自的模型直接在Xcode …
阅读更多Google NotebookLM 发布 API,开发者可构建自用工具-向阳乔木 谷歌的AI协作工具NotebookLM现已开放API,用户可以利用其强大的笔记和文档处理能力,构建自定义的AI工具或集成到现有工作流中,这预示着NotebookLM功能将进一步扩展到更广泛的开发者生态系统。这一举措有望推动更多基于NotebookLM的应用场景和创新项目。 图像生成模型对决:字节跳动即梦4.0与Nano Banana性能深入对比-orange.ai Orange.ai对近期备受关注的图像生成模型Nano Banana和字节跳动推出的即梦4.0 (Seedream 4.0) 进行了深入对比。评测显示,Nano Banana在中文场景存在 …
阅读更多Replit完成2.5亿美元融资,Agent 3展现人类级开发性能-Amjad Masad Replit近日宣布成功完成2.5亿美元的C轮融资,公司估值达到30亿美元,进一步巩固了其在AI代码开发领域的领先地位。与此同时,Replit也展示了其最新产品Agent 3的强大能力。这款智能体能够在数小时内完成此前需要多名开发者共同协作的工作,被认为达到了人类级别的开发者性能。用户反馈显示,Agent 3在长周期任务的依从性、自我测试及加速开发方面表现出色,预示着“智能反转”的时代即将到来。 FactoryAI CLI集成Opus 4.1、GPT-5并支持IDE-Ben Tossell FactoryAI CLI近期推出了更新,现已支持 …
阅读更多直播圆满结束,NotebookLM总结-向阳乔木 向阳乔木在其X/Twitter账号上发布消息,宣布关于 NotebookLM 的直播活动已圆满结束。据称,此次直播内容干货丰富,获得了听众的积极反馈。NotebookLM 是Google推出的一款基于人工智能的笔记辅助工具,旨在帮助用户从文档、笔记和网络内容中提取关键信息、生成摘要并组织思路。此次直播可能深入探讨了NotebookLM的最新功能、使用技巧或实际应用案例,为关注AI工具的用户提供了宝贵的信息。
阅读更多以下是过去4小时全球AI领域的动态摘要: HunyuanWorld-Voyager:可探索的3D世界生成 - clem 🤗 一项名为 HunyuanWorld-Voyager 的最新AI技术被提出,专注于可探索的3D世界生成。该技术利用了世界一致的视频扩散(World-consistent video diffusion)和长距离世界探索(Long-range world exploration)能力,预示着在创建沉浸式、连贯的虚拟环境方面取得了显著进展。这有望在游戏、虚拟现实和仿真等领域带来突破。 微软AI的VibeVoice:领先的开源文本转语音模型 - clem 🤗 微软AI推出的开源文本转语音(TTS) …
阅读更多Nano Banana AI:未来环境预测与几何图形生成新进展-歸藏(guizang.ai) 近期,一款名为Nano Banana的AI工具展示了其在图像和视频生成方面的新能力。该工具可以根据用户提供的照片,预测并生成该地点在一百年后荒废且无人维护的样子,并以视频形式直观呈现,极具表现力。此外,Nano Banana还能够根据用户输入的几何图形来生成相应的图像。这项技术为环境发展模拟、创意内容生成等领域提供了新的可能性,被认为是开发小型应用以预览环境变化的良好基础。 AI能力深度探讨:封闭问题与开放性挑战,以及“抬高下限”论-宝玉 有观点深入探讨了人工智能在解决不同类型问题上的能力。讨论指出,可验证的封闭式问题最终都将被AI攻克, …
阅读更多