TheWorldLabs 展示通过单张图片生成3D环境的强大潜力-Fei-Fei Li 人工智能领域的重要人物李飞飞教授转发推文,展示了 TheWorldLabs 在通过单张图片生成复杂 3D 环境方面的巨大潜力。据分享,其“Marble”工具能够仅凭一张图片创建出“洞穴式餐厅3D环境”。这表明了 AI 驱动的3D内容创作正在取得显著进展,有望大幅简化设计流程,并为沉浸式体验提供更高效的工具。 OpenAI Sora 视频生成模型被指训练数据来源广泛-Gary Marcus Gary Marcus 转发了一条推文,透露 OpenAI 的视频生成模型 Sora 似乎在极其广泛和多样化的数据集上进行了训练。该数据集据称涵盖了包括 好莱 …
阅读更多腾讯发布Hunyuan3D 3.0,提升3D模型生成能力 - Emad (retweeting TencentHunyuan) 腾讯正式推出其全新的Hunyuan3D 3.0模型,该版本在性能上实现了显著飞跃。新模型拥有3倍更高的精度、1536³的几何分辨率以及36亿参数。这一升级标志着腾讯在3D内容生成技术方面取得了重要进展,有望为游戏开发、虚拟现实、元宇宙内容创作及工业设计等领域带来更高效、更逼真的3D资产生成能力,进一步降低高质量3D内容的制作门槛。 \n\n 歸藏(guizang.ai) 推出苹果同款Logo/文字动画工具 - 歸藏(guizang.ai) 歸藏(guizang.ai)发布了一款实用工具,用户可以通过该工具 …
阅读更多XAI 发布 Grok 4 fast 模型 - 歸藏(guizang.ai) 埃隆·马斯克的XAI公司推出了Grok 4 fast模型,该模型采用推理与非推理混合架构,提供高达200万上下文,并支持网页和推特搜索功能。新模型在基准测试中展现出与Grok 4相当的性能,但平均使用的思考token减少了40%,同时在前沿基准上达到相同性能的费用降低了98%。其定价极具竞争力,输入每百万Token仅需$0.2,输出$0.5,命中缓存更低至$0.05,旨在大幅降低AI模型的使用成本和提高效率。 Notion AI Agents 发现漏洞,可被恶意 Prompt 窃取数据 - 宝玉 Notion的AI Agents刚发布便被发现存在潜在漏 …
阅读更多过去4小时全球AI动态一览 AI编码助手Codex导致用户代码丢失,凸显使用风险-宝玉 一位用户分享了使用AI编码助手Codex时遭遇的代码丢失经历。在对文件进行修改时,因操作失误和对AI指令的表述不清,导致Codex执行了超出预期的“回滚”操作,直接将文件B恢复到上次Git提交状态,从而抹去了数小时的开发成果。此次事件强调了在使用AI工具进行代码修改时,及时提交版本控制的重要性,以及清晰准确地向AI传达指令的必要性,以避免潜在的数据损失风险。 扎克伯格揭秘Meta AI团队建设理念:小而精锐,高算力投入-宝玉 马克·扎克伯格在近期访谈中阐述了Meta构建AI顶尖团队的独特策略。他指出,与大型研发部门不同,大语言模型开发更适合“小 …
阅读更多今日科技焦点清晰地指向一个趋势:AI正从纯粹的软件形态加速向物理世界和应用生态渗透。OpenAI 携手制造业巨头立讯精密并大举招募苹果工程师,其进军AI硬件的决心预示着对现有智能手机生态的直接挑战。与此同时,AI在应用层的整合也在深化,Google Chrome全面集成Gemini,Workday则通过巨额收购布局企业级AI代理。而在现实世界,深圳功能型无人车已实现显著的商业价值,NVIDIA对自动驾驶的重金投入也印证了“具身智能”的落地前景。这些动态共同勾勒出AI的下一站:争夺硬件入口、深化场景应用、创造可量化的物理世界价值。 OpenAI携手立讯精密进军AI硬件,并积极招募苹果人才 OpenAI已与苹果核心供应商立讯精密达成合 …
阅读更多NotebookLM:远不止用户手册的项目助手-Demis Hassabis DeepMind联合创始人兼Google DeepMind CEO Demis Hassabis 转发推文,强调了 NotebookLM 的“Intro to NotebookLM”功能远超传统用户手册。该工具允许用户通过聊天方式描述他们的项目,从而获得更智能、更具上下文感知的帮助。这表明NotebookLM正致力于通过增强人机交互和个性化指导,提升用户在使用AI工具进行项目开发和管理时的效率和体验。 “Grafting Diffusion Transformers”论文被NeurIPS 2025接收为口头报告-Fei-Fei Li 知名AI …
阅读更多以下是过去4小时内全球AI领域的重要动态: Replit 推出“自主性滑块”功能,允许用户调整AI助手自主程度 - Amjad Masad Replit 宣布引入一项名为“自主性滑块”(Autonomy Slider)的新功能,旨在让用户能够根据具体需求,灵活控制AI助手的工作自主性。用户可以将其设置为一个辅助性的“副驾驶”模式,在几分钟内提供即时帮助,也可以提升其自主权,将其视为一个全面的开发者,能够独立处理耗时数小时的完整功能或应用程序开发任务。这一用户体验模式的设计灵感来源于Andrej Karpathy在YC的最新演讲。 LumaLabsAI 发布 RAY3 模型,实现原生高动态范围(HDR)视频生成 - Emad …
阅读更多ElevenLabs 推出全新音视频编辑平台 Studio 3.0-小互 AI语音技术公司ElevenLabs发布了其全新的音视频编辑平台 Studio 3.0。该平台在一个统一界面内集成了AI语音合成、音频编辑、音效添加等多种功能。其核心能力包括自动配音(支持多语言和音色)、语音转文字、声音克隆、根据描述生成背景音乐与音效、多语言配音(自动翻译并生成配音),以及音频清理(去除噪音)。这一平台旨在为内容创作者提供更高效的音视频制作工具。 Wan 团队开源唇形与动作同步模型 Wan‑Animate-歸藏(guizang.ai) Wan团队发布了其强大的开源唇形和动作同步模型 Wan‑Animate。该模型具有极高的自定义程度,能够同 …
阅读更多个人开发者一天内用AI完成App Store评论分析工具开发-向阳乔木 一位个人开发者成功在一天内完成了App Store评论抓取与分析工具的开发和上线,充分展示了**“人+AI”协作开发的高效性。该项目主要利用Kimi K2和Claude Code进行编码与错误修复,并借助Dia浏览器自带的GPT5辅助需求讨论和JSON字段分析。开发者指出Kimi K2在成本上的显著优势。这款工具能够抓取App Store用户评论并聚合生成报告,项目已开源并迅速获得过万浏览量和业界关注,凸显了Vibe Coding**(情绪编程)和基于AI开发效率工具的巨大潜力。 OpenAI揭示ChatGPT用户行为模式,并对比主流AI模型优劣- …
阅读更多以下是过去4小时全球AI领域的一些值得关注的进展: DecartAI 开源 Lucy Edit 视频模型-Emad DecartAI 公司已正式开源 Lucy Edit 模型,并发布了相关的技术报告。该模型是其“视频纳米香蕉(nano banana for video)”系列的首个产品,旨在推动视频生成和编辑技术的发展。此次开源将有助于研究人员和开发者社区进一步探索视频AI领域的创新应用和技术突破。 LumaLabsAI 推出 Ray3 AI 视频生成模型-Emad LumaLabsAI 推出了其新的AI视频生成模型 Ray3,并展示了通过该模型制作的AI视频。Ray3 代表了AI在视频创作领域的新进展,使用户能够更高效、更便捷地生 …
阅读更多