Runway 发布 Gen-4.5 视频生成模型,增强物理与视觉精度-歸藏(guizang.ai) Runway 发布了其最新的视频生成模型Gen-4.5。尽管此次更新未带来范式级别的革新,但模型在多个核心能力上取得了显著提升,包括物理与视觉精度、复杂场景与详细构图、物理准确性、富有表现力的角色、风格化与风格一致性,以及电影感与真实日常场景的生成。此外,Gen-4.5还全面升级了控制方式,支持图片转视频、关键帧控制和视频转视频编辑,使得创作流程更加灵活,用户体验接近专业视频剪辑软件。 DeepSeek V3.2 正式版发布,强化 Agent 能力并融入思考推理-Orange AI DeepSeek V3.2 正式版已推出,该版本显 …
阅读更多今日全球AI领域动态激烈,视频生成模型的竞争进入白热化阶段,Runway发布Gen 4.5模型,在基准测试中超越谷歌及OpenAI的同类产品。与此同时,具身智能正从学术界走向产业前沿,清华大学成立专属研究院,滴滴等资本也开始布局相关交互技术。大型科技公司的战略调整同样值得关注,苹果AI部门迎来新负责人,汇丰银行等传统巨头则通过与Mistral AI合作加速内部AI应用。此外,从DeepSeek发布对标GPT-5的推理模型到Nvidia开源自动驾驶视觉模型,技术迭代的步伐丝毫未减,预示着AI正向更复杂的推理和物理世界交互深度渗透。 Runway 推出 Gen 4.5 AI 视频模型,测试成功击败谷歌 Veo3、OpenAI Sora …
阅读更多Hugging Face发布Transformers v5首个Release Candidate Hugging Face宣布发布其Transformers库的v5版本首个Release Candidate(RC)。这是一个重大更新,旨在实现与整个生态系统中其他工具的端到端互操作性,标志着该库自上一个主要版本以来的五年里程碑。此版本将进一步简化AI模型在不同平台和框架间的集成与应用。 NeurIPS代理审稿人审查量已超越会议提交论文总数 斯坦福大学教授吴恩达指出,今年的NeurIPS会议收到了21,575篇论文投稿,而上周发布的“Agentic Reviewer”(代理审稿人)工具提交和评审的论文数量已超过此数。这表明代理审稿模式 …
阅读更多- Runway 发布 Gen-4.5 视频生成模型,增强多方面能力-歸藏(guizang.ai) Runway推出了Gen-4.5视频生成模型,虽然此次更新未带来范式革新,但在多方面进行了显著升级。新模型提升了物理与视觉精度,支持更复杂的场景与详细构图,并增强了物理准确性。此外,Gen-4.5能够生成富有表现力的角色,提供更好的风格化与风格一致性,并在电影感与真实日常场景生成方面有所改进。Amjad Masad的推文确认“Whisper Thunder”即Runway,可能指此新模型的内部代号。
- 国产AI视频生成App内测:音画同步但效果抽象,适合鬼畜视频-向阳乔木 一款国产AI视频生成应用目前正在进行内测。该应用的一大亮 …
阅读更多以下是过去一段时间全球AI领域的重要动态汇总: ChatGPT发布三周年,业界展望AI未来三年 - Emad ChatGPT于三年前的今天发布,这一里程碑事件彻底改变了世界,开创了生成式AI的新范式。Emad和Orange AI等业界人士纷纷回顾了其对AI领域及个人生活的深远影响,并展望了未来三年的巨大潜力。他们强调,无论是已经深耕AI三年,还是刚刚开始拥抱AI,现在都是投身这一领域的绝佳时机。 DeepSeek-V3.2模型发布,性能表现“极其强大” - mervenoyann DeepSeek-V3.2模型已正式发布,并引起了社区的广泛关注。多位评论者对其性能给予了高度评价,称其“极其强大”。此次更新预示着DeepSeek在AI …
阅读更多字节跳动发布“豆包手机助手”技术预览版,支持跨应用操作与个性化记忆-小互 字节跳动推出了“豆包手机助手”技术预览版,该助手具备多模态识别屏幕内容、交互操作以及跨应用手机操作的核心功能。它支持多种唤醒方式,并拥有强大的个性化记忆能力,能从历史对话和屏幕信息中提取关键数据,例如回忆停车位置或取件码。此外,“豆包”还支持实时视频通话,能理解摄像头内容并进行双语讲解互动。其多模态生成与编辑功能可将AIGC嵌入原生应用,如通过语音指令智能修图。值得注意的是,该版本将通过与手机厂商的系统集成来实现深层权限和功能。 ChatGPT发布三周年,业界反思其深远影响-Emad 三年前的今天,ChatGPT的发布标志着世界进入了生成式AI的新范式,彻底 …
阅读更多以下是过去4小时全球AI领域的最新动态: 字节跳动发布“豆包手机助手”技术预览版-小互 字节跳动推出了“豆包手机助手”技术预览版,该助手具备强大的多模态识别与交互能力,支持跨应用操作手机,并通过语音、AI键或耳机唤醒。其核心亮点包括个性化记忆功能,能从历史对话和屏幕信息中学习用户偏好和生活琐事;跨应用操作,如全网比价、生活服务自动化及办公自动化;以及多模态生成与编辑,例如在相册中通过语音指令智能修图。该版本将通过与手机厂商合作实现系统级集成。 ChatGPT三周年庆:重塑世界与人生-Orange AI 今天标志着ChatGPT发布三周年,这一里程碑事件被认为是将世界带入“生成式范式”的开端,彻底改变了技术发展轨迹和个人生活。多位业界 …
阅读更多字节跳动发布“豆包手机助手”技术预览版-小互 字节跳动推出了“豆包手机助手”技术预览版,该产品具备强大的多模态识别与交互能力,支持跨应用操作手机,并通过语音、AI键或耳机唤醒。豆包助手还拥有个性化记忆功能,能够从历史对话和屏幕信息中提取关键数据,提供生活琐事回忆和喜好记忆,并强调数据本地处理以保护隐私。其核心亮点是App Agent能力,能模拟用户操作,自动执行全网比价、生活服务自动化及办公审批等任务。此外,豆包助手还支持系统原生的多模态生成与编辑,例如智能修图,并提供了针对复杂任务的“Pro模式”,能进行多步骤的复杂任务规划和执行,例如跨平台预订旅行。该版本通过与手机厂商的系统集成,获得了更深层的操作权限。 ChatGPT 发布 …
阅读更多今日全球AI动态呈现出基础设施与顶层应用的双重加速。硬件层面,三星即将发布HBM4内存,光互联技术也因AI算力需求而备受瞩目,显示出底层算力竞赛的持续白热化。应用层面,AI正渗透金融、办公等传统领域,但也面临用户在游戏等创意领域的抵制与开发者对“去技能化”的担忧。尤为引人注目的是,全球首个具身智能本科专业的设立,标志着AI人才培养正从纯软件向软硬件结合的下一阶段演进,预示着物理世界的智能化将是未来的核心战场。 上海交大设立全球首个具身智能本科专业,联合华为培养 上海交通大学宣布拟增设全球首个“具身智能”本科专业,隶属于人工智能学院,计划招生30人。该专业旨在培养能融合人工智能、机械、计算机等多学科知识的复合型人才,专业带头人卢策吾教 …
阅读更多重新定义机器人与人类工作关系-Peter H. Diamandis, MD Peter H. Diamandis博士提出,关于“人形机器人将取代人类工作”的说法是错误的。他认为,机器人的真正作用是承担人类不擅长或具有风险的任务,从而使人类能够专注于发挥自己的长处和优势。这一观点强调了AI与人类协作的未来,而非简单的替代关系。 AI在灾区、诊所及冲突区域的自主配送应用-Peter H. Diamandis, MD Peter H. Diamandis博士指出,尽管自主配送系统可能从家用场景开始普及,但它们在灾区、诊所和冲突区域将发挥至关重要的作用。这些系统能够以快速且安全的方式向最需要帮助的人提供援助,展示了AI技术在人道主义和紧急 …
阅读更多