Luma AI 推出 Ray3:世界首个具备“推理能力”的视频模型-小互 Luma AI 发布了 Ray 3 视频生成模型,号称是全球首个具备**“推理能力”的视频模型。Ray 3 能够理解复杂指令,以视觉和语言进行创作,并能评估自身生成结果。该模型支持生成专业级 HDR 视频**,提供 10、12、16-bit 高动态范围,并支持物理仿真、复杂场景、群体动画、运动模糊及写实光照等高级功能。此外,它能理解图像上的涂鸦和绘制等视觉注释,实现对镜头、运动和构图的精确控制,并引入草稿模式以提升创意迭代效率,通过 Hi-Fi diffusion 技术可将视频无缝升级至 4K HDR,还能将普通 SDR 视频转换为 HDR 并输出 EXR …
阅读更多以下是过去4小时内全球AI领域的重要动态: 保险公司将支付传感器费用以预防疾病-Peter H. Diamandis, MD Peter H. Diamandis 博士提出,未来保险公司将倾向于为用户支付健康传感器的费用。这不是出于对用户的关心,而是因为预防疾病的成本远低于治疗疾病的成本。这预示着AI驱动的预防性健康管理将成为医疗健康和保险行业的重要趋势。 DecartAI开源Lucy Edit并迅速被集成-clem 🤗 DecartAI正式开源了其视频编辑工具Lucy Edit,旨在打造“视频领域的开源Nano Banana”。该项目发布不到一小时,就已被迅速集成到Anycoder中,成为首个支持Lucy Video Edit …
阅读更多谷歌推出Agent间开放支付协议AP2 - 歸藏(guizang.ai) 谷歌已推出一项名为AP2(Agent-to-Agent Payment Protocol)的开放支付协议,旨在解决AI代理间交易的授权、真实性与问责核心挑战。该协议支持信用卡、借记卡、稳定币及实时转账等多种支付渠道,并基于加密签名和不可篡改的数字合同,建立可审计的证据链。它能处理用户在场时的“实时购买”场景,通过Intent Mandate和Cart Mandate确保交易意图;也能支持无人值守的“委派任务”,允许代理根据预设约束自动完成支付。AP2还与Coinbase、以太坊基金会等合作,为AI驱动的加密支付提供可投产方案。目前,该协议已获得包 …
阅读更多今日AI领域呈现出深度集成与应用落地两大趋势。开发者工具成为新战场,OpenAI的GPT-5-Codex与Anthropic的Claude全面融入主流IDE,预示着软件工程范式的变革。具身智能持续火热,Figure AI获巨额融资,而国内的导盲犬、空翻机器人展示了其在特定场景的突破。在消费端,苹果正式推送Apple Intelligence,将AI无缝嵌入操作系统,提升用户体验。同时,AI正深入垂直行业,从加速材料科学研究到赋能生物回收,展现出解决复杂问题的巨大潜力。Mira Murati对LLM确定性的探索和谷歌为AI代理支付制定的新标准,则从底层技术和生态规则上推动行业走向成熟。 OpenAI 推出 GPT-5-Codex, …
阅读更多YouTube Shorts推出AI新功能:Veo 3和Lyria 2-Demis Hassabis Demis Hassabis 宣布YouTube Shorts上线了两项强大的AI新功能。Veo 3能够根据文本提示生成带有集成音频的视频片段,极大地简化了视频创作流程。同时,Lyria 2则支持“Speech to song”功能,可以将视频对话内容自动转化为配乐,为用户提供更丰富的音频创作体验。 AI助力手持超声波技术实现医生级技能-Peter H. Diamandis, MD Peter H. Diamandis 博士展望了AI在医疗领域的应用前景,指出未来人们可以通过AI引导的手持超声波设备,即时获得医生般的诊断技能。这项 …
阅读更多今日全球AI动态呈现出技术应用深化与潜在风险并存的局面。一方面,AI正加速渗透至创意与情感领域,从Stable Audio 2.5的秒级音乐生成,到利用语音克隆技术辅助心理疗愈,展现了其强大的应用潜力。另一方面,一项研究揭示主流AI聊天机器人的虚假信息传播率翻倍,凸显了在模型接入实时网络后,信息污染问题愈发严峻。资本市场对AI智能体的态度也出现分化,乐观与审慎并存,反映出业界对当前技术成熟度与商业化路径的复杂考量。与此同时,硬件层面的创新仍在持续,为AI的未来发展奠定基础。 研究发现:主流 AI 聊天机器人传播虚假信息的概率较去年翻倍 Newsguard的最新研究指出,主流生成式AI工具在处理实时新闻时,传播虚假信息的概率已从去年 …
阅读更多Ling-mini-2.0:16B-A1B MoE LLM宣布开源-clem 🤗 Ling-mini-2.0,一个拥有 16B-A1B MoE(混合专家)架构的大型语言模型,已宣布开源。该模型经过 20万亿+ tokens 的训练,并结合了 SFT (监督微调)、RLVR (基于人类反馈的强化学习) 和 RLHF (人类反馈强化学习) 等多种训练方法。据称,其生成速度高达 300+ tokens/秒,比现有模型快 7倍。这一发布有望加速开源社区在MoE架构LLM领域的发展和应用。 ChatGPT与Claude记忆功能对比:两种截然不同的哲学-宝玉 宝玉详细分析了 ChatGPT 和 Claude 在记忆功能上的根本性差 …
阅读更多今日全球AI领域呈现出 模型竞争白热化 与 应用场景深度拓展 的双重趋势。Anthropic 成为焦点,不仅因其模型在特定任务上超越OpenAI而被微软Office集成,打破了后者独家合作的局面,还推出了文件创建与编辑新功能,进一步强化其生产力工具属性。资本市场同样活跃,阿里巴巴领投AI视频生成公司 爱诗科技,凸显了应用层的巨大潜力;而 Nvidia 发布的下一代AI芯片Rubin CPX,则预示着底层算力竞赛仍在加速。与此同时,AI对社会的影响愈发显现,从创意工作者面临的岗位替代,到AI DJ引发的伦理讨论,都标志着技术融合正步入深水区。 微软将在Office中使用Anthropic的AI,此前其在某些任务上超越了OpenAI 微 …
阅读更多AI支出提振经济,GDP贡献高达1% - Peter H. Diamandis, MD 知名未来学家Peter H. Diamandis指出,全球对人工智能(AI)的巨额投资已切实提振了实体经济。在某些季度,AI支出对GDP的贡献率甚至高达1%。这一现象突显了AI技术不仅在科技领域引发变革,也正在成为推动宏观经济增长的强大引擎,其影响力已超乎许多人的预期。 大型企业质疑生成式AI的成本效益 - Gary Marcus AI专家Gary Marcus援引Apollo Academy的数据指出,大型企业已开始意识到,尽管生成式AI(GenAI)概念引人入胜,但其目前的表现尚不足以证明其高昂成本的合理性。Marcus进一步表达了他对AI …
阅读更多AI 写的代码不是资产,是债务-宝玉 Jane Zhang分享了团队使用AI代码工具一年后的经验,指出AI生成的代码往往伴随着技术债务。她观察到代码中增加了大量冗余、无用的注释和过度的mock测试,甚至单元测试的可靠性也下降,导致后期需要频繁进行大规模重构。这表明,尽管AI工具旨在提高开发效率,但若缺乏人工的精细审查和维护,反而可能带来隐性的质量问题和额外负担。 原推这段子太逗了:那些天天念叨“大语言模型(LLM)不会推理,只会预测下一个词元(Token)”的人,自己才是真正的“随机鹦鹉”-宝玉 针对那些反复强调大语言模型(LLM)“只会预测下一个词元”而缺乏推理能力的人,有观点幽默地反驳,称这些批评者本身更像“随机鹦鹉”。他们被 …
阅读更多