GLM 4.7 模型发布:开放前沿模型的重大飞跃 - merve GLM 4.7 模型已正式发布,被誉为开放前沿模型的重大飞跃。该版本在编码、复杂推理和工具使用方面取得了显著进步,性能超越DeepSeek V3.2,并在多项任务中表现优于部分闭源模型。GLM 4.7已在Hugging Face Transformers和推理提供商上同步可用,进一步推动了开源AI领域的发展。 微软与复旦大学合作推出AniX系统,实现可控角色动画生成 - 向阳乔木 微软研究院与复旦大学共同开发了AniX系统,旨在实现可控的3DGS场景角色动画生成。用户可通过自然语言指令控制3D场景中的角色,例如“往前跑”或“弹吉他”,系统便能生成相应的视频。AniX …
阅读更多Runway 发布 Gen-4.5 视频生成模型,增强物理与视觉精度-歸藏(guizang.ai) Runway 发布了其最新的视频生成模型Gen-4.5。尽管此次更新未带来范式级别的革新,但模型在多个核心能力上取得了显著提升,包括物理与视觉精度、复杂场景与详细构图、物理准确性、富有表现力的角色、风格化与风格一致性,以及电影感与真实日常场景的生成。此外,Gen-4.5还全面升级了控制方式,支持图片转视频、关键帧控制和视频转视频编辑,使得创作流程更加灵活,用户体验接近专业视频剪辑软件。 DeepSeek V3.2 正式版发布,强化 Agent 能力并融入思考推理-Orange AI DeepSeek V3.2 正式版已推出,该版本显 …
阅读更多以下是过去4小时内全球AI领域的动态摘要: 橙子AI团队推出全球最快端侧语音输入法 - orange.ai 橙子AI的团队近日推出了一款号称“世界上最快”的端侧语音输入法。这款输入法强调速度、端侧模型和隐私保护。其核心理念是,尽管当前AI模型已具备强大的理解能力,但通过语音输入与AI交流可以比打字快四倍,从而为AI提供更丰富的上下文信息(context),进而帮助用户获得更优质的AI回复结果。该产品旨在提升人机交互效率,利用语音的优势优化与AI的沟通体验。 AI辅助视频学习与笔记总结流程实践 - 向阳乔木 一位用户分享了利用AI工具Granola进行视频学习和笔记总结的创新流程。该方法包括:观看YouTube视频时,Granola自 …
阅读更多