Runway发布Gen-4.5视频生成模型,增强物理与视觉精度-歸藏(guizang.ai) Runway推出了新一代视频生成模型Gen-4.5,虽然没有带来范式革新,但在多方面实现了能力升级。其主要改进包括提升了物理与视觉精度,支持更复杂的场景和详细构图,提高了物理准确性,能生成富有表现力的角色,并优化了风格化与风格一致性,使其能生成更具电影感和真实日常感的场景。 DeepSeek V3.2正式版发布:强化Agent能力并融入Claude Code思考推理-Orange AI DeepSeek正式发布了V3.2版本,重点强化了其Agent能力并深度融入了思考推理机制。新版本特别优化了对Claude Code思考模式的支持,用户可 …
阅读更多Runway 发布 Gen-4.5 视频生成模型,增强物理与视觉精度-歸藏(guizang.ai) Runway 发布了其最新的视频生成模型Gen-4.5。尽管此次更新未带来范式级别的革新,但模型在多个核心能力上取得了显著提升,包括物理与视觉精度、复杂场景与详细构图、物理准确性、富有表现力的角色、风格化与风格一致性,以及电影感与真实日常场景的生成。此外,Gen-4.5还全面升级了控制方式,支持图片转视频、关键帧控制和视频转视频编辑,使得创作流程更加灵活,用户体验接近专业视频剪辑软件。 DeepSeek V3.2 正式版发布,强化 Agent 能力并融入思考推理-Orange AI DeepSeek V3.2 正式版已推出,该版本显 …
阅读更多今日全球AI领域动态激烈,视频生成模型的竞争进入白热化阶段,Runway发布Gen 4.5模型,在基准测试中超越谷歌及OpenAI的同类产品。与此同时,具身智能正从学术界走向产业前沿,清华大学成立专属研究院,滴滴等资本也开始布局相关交互技术。大型科技公司的战略调整同样值得关注,苹果AI部门迎来新负责人,汇丰银行等传统巨头则通过与Mistral AI合作加速内部AI应用。此外,从DeepSeek发布对标GPT-5的推理模型到Nvidia开源自动驾驶视觉模型,技术迭代的步伐丝毫未减,预示着AI正向更复杂的推理和物理世界交互深度渗透。 Runway 推出 Gen 4.5 AI 视频模型,测试成功击败谷歌 Veo3、OpenAI Sora …
阅读更多English Version News Discovery Time! Today we are exploring… Bang! Pop! Wow! From magical glowing forests to amazing apps built by students just like you, we have some incredible stories to share. Our first piece of news has come from the deep, quiet parts of the Amazon rainforest. Scientists have recently …
阅读更多Hugging Face发布Transformers v5首个Release Candidate Hugging Face宣布发布其Transformers库的v5版本首个Release Candidate(RC)。这是一个重大更新,旨在实现与整个生态系统中其他工具的端到端互操作性,标志着该库自上一个主要版本以来的五年里程碑。此版本将进一步简化AI模型在不同平台和框架间的集成与应用。 NeurIPS代理审稿人审查量已超越会议提交论文总数 斯坦福大学教授吴恩达指出,今年的NeurIPS会议收到了21,575篇论文投稿,而上周发布的“Agentic Reviewer”(代理审稿人)工具提交和评审的论文数量已超过此数。这表明代理审稿模式 …
阅读更多- Runway 发布 Gen-4.5 视频生成模型,增强多方面能力-歸藏(guizang.ai) Runway推出了Gen-4.5视频生成模型,虽然此次更新未带来范式革新,但在多方面进行了显著升级。新模型提升了物理与视觉精度,支持更复杂的场景与详细构图,并增强了物理准确性。此外,Gen-4.5能够生成富有表现力的角色,提供更好的风格化与风格一致性,并在电影感与真实日常场景生成方面有所改进。Amjad Masad的推文确认“Whisper Thunder”即Runway,可能指此新模型的内部代号。
- 国产AI视频生成App内测:音画同步但效果抽象,适合鬼畜视频-向阳乔木 一款国产AI视频生成应用目前正在进行内测。该应用的一大亮 …
阅读更多以下是过去一段时间全球AI领域的重要动态汇总: ChatGPT发布三周年,业界展望AI未来三年 - Emad ChatGPT于三年前的今天发布,这一里程碑事件彻底改变了世界,开创了生成式AI的新范式。Emad和Orange AI等业界人士纷纷回顾了其对AI领域及个人生活的深远影响,并展望了未来三年的巨大潜力。他们强调,无论是已经深耕AI三年,还是刚刚开始拥抱AI,现在都是投身这一领域的绝佳时机。 DeepSeek-V3.2模型发布,性能表现“极其强大” - mervenoyann DeepSeek-V3.2模型已正式发布,并引起了社区的广泛关注。多位评论者对其性能给予了高度评价,称其“极其强大”。此次更新预示着DeepSeek在AI …
阅读更多字节跳动发布“豆包手机助手”技术预览版,支持跨应用操作与个性化记忆-小互 字节跳动推出了“豆包手机助手”技术预览版,该助手具备多模态识别屏幕内容、交互操作以及跨应用手机操作的核心功能。它支持多种唤醒方式,并拥有强大的个性化记忆能力,能从历史对话和屏幕信息中提取关键数据,例如回忆停车位置或取件码。此外,“豆包”还支持实时视频通话,能理解摄像头内容并进行双语讲解互动。其多模态生成与编辑功能可将AIGC嵌入原生应用,如通过语音指令智能修图。值得注意的是,该版本将通过与手机厂商的系统集成来实现深层权限和功能。 ChatGPT发布三周年,业界反思其深远影响-Emad 三年前的今天,ChatGPT的发布标志着世界进入了生成式AI的新范式,彻底 …
阅读更多以下是过去4小时全球AI领域的最新动态: 字节跳动发布“豆包手机助手”技术预览版-小互 字节跳动推出了“豆包手机助手”技术预览版,该助手具备强大的多模态识别与交互能力,支持跨应用操作手机,并通过语音、AI键或耳机唤醒。其核心亮点包括个性化记忆功能,能从历史对话和屏幕信息中学习用户偏好和生活琐事;跨应用操作,如全网比价、生活服务自动化及办公自动化;以及多模态生成与编辑,例如在相册中通过语音指令智能修图。该版本将通过与手机厂商合作实现系统级集成。 ChatGPT三周年庆:重塑世界与人生-Orange AI 今天标志着ChatGPT发布三周年,这一里程碑事件被认为是将世界带入“生成式范式”的开端,彻底改变了技术发展轨迹和个人生活。多位业界 …
阅读更多字节跳动发布“豆包手机助手”技术预览版-小互 字节跳动推出了“豆包手机助手”技术预览版,该产品具备强大的多模态识别与交互能力,支持跨应用操作手机,并通过语音、AI键或耳机唤醒。豆包助手还拥有个性化记忆功能,能够从历史对话和屏幕信息中提取关键数据,提供生活琐事回忆和喜好记忆,并强调数据本地处理以保护隐私。其核心亮点是App Agent能力,能模拟用户操作,自动执行全网比价、生活服务自动化及办公审批等任务。此外,豆包助手还支持系统原生的多模态生成与编辑,例如智能修图,并提供了针对复杂任务的“Pro模式”,能进行多步骤的复杂任务规划和执行,例如跨平台预订旅行。该版本通过与手机厂商的系统集成,获得了更深层的操作权限。 ChatGPT 发布 …
阅读更多