- Runway 发布 Gen-4.5 视频生成模型,增强多方面能力-歸藏(guizang.ai) Runway推出了Gen-4.5视频生成模型,虽然此次更新未带来范式革新,但在多方面进行了显著升级。新模型提升了物理与视觉精度,支持更复杂的场景与详细构图,并增强了物理准确性。此外,Gen-4.5能够生成富有表现力的角色,提供更好的风格化与风格一致性,并在电影感与真实日常场景生成方面有所改进。Amjad Masad的推文确认“Whisper Thunder”即Runway,可能指此新模型的内部代号。
- 国产AI视频生成App内测:音画同步但效果抽象,适合鬼畜视频-向阳乔木 一款国产AI视频生成应用目前正在进行内测。该应用的一大亮 …
阅读更多中国在开放AI模型市场超越美国-clem 🤗 一项由麻省理工学院和Hugging Face联合发布的研究指出,中国在开放AI模型的全球市场中已超越美国。这一突破性的进展标志着全球AI格局的重大变化,中国在开源AI生态系统中的影响力显著增强。 Z-Image Turbo模型登顶Hugging Face排行榜-clem 🤗 由Ali_TongyiLab开发的Z-Image Turbo模型在Hugging Face的模型排行榜上表现出色,位居榜首。这表明该模型在性能和社区关注度方面取得了显著成就,进一步推动了图像生成领域的发展。 Hugging Face指令数据集的再生与优化-clem 🤗 有专家提出,可以从Hugging Face中挑 …
阅读更多sfcompute 获得 4000 万美元融资并招聘 Linux 程序员 - Ben Tossell sfcompute 公司近日宣布成功完成 4000 万美元融资,并正在积极招募 Linux 程序员,以支持其超级计算机项目。这一发展表明了在高性能计算和人工智能基础设施领域持续的投资热度,旨在加速前沿技术的研发与落地。 Gary Marcus 持续批评大型语言模型与 AGI 发展 - Gary Marcus 知名 AI 批评家 Gary Marcus 再次就大型语言模型(LLMs)能否实现通用人工智能(AGI)发表了强硬观点。他指责 Yann LeCun 盗用其 2022 年关于 LLM 扩展瓶颈和 AGI 局限性的论 …
阅读更多家庭人形机器人研发取得进展-Emad 深圳MindOne Robotics公司正在Unitree G1平台上测试其开发的机器人大脑,这一进展预示着家庭人形机器人距离大规模应用更近一步。该项技术旨在将复杂的人形机器人能力带入日常生活环境,为未来智能家居和个人助理机器人奠定基础。 FactoryAI Droid CLI与GPT-5.1性能卓越-Ben Tossell FactoryAI的Droid CLI工具因其在编码和调试方面的强大功能而受到广泛关注。有用户报告称,GPT-5.1在2分钟内成功解决了Sonnet 4.5在10分钟内未能解决的调试问题,彰显了其卓越性能。Droid CLI以其快速开发迭代著称,支持ChatGPT …
阅读更多Ben Tossell的专家平台新增机构身份选项-Ben Tossell Ben Tossell宣布,其专家平台experts.bensbites.com已新增允许用户指定自己是否属于某个代理机构的功能。尽管用户仍需通过个人账户注册,但这一更新为代理机构成员提供了更明确的身份标识,有助于完善平台上的专家信息和合作模式。 AI未来预测与个人发展建议-向阳乔木 一位作者分享了对AI未来的一些**“疯狂”预测和个人发展建议**。预测中提及了培养讲故事能力、提升品味、真人出镜建立信任等已形成共识的方向,但部分观点仍待验证。作者建议当下可着手培养品味与讲故事能力,学习编排组合AI工具并掌控AI Agent,建立人机协作的作品集,并积极探 …
阅读更多在过去4小时内,全球AI领域的主要动态围绕着AI辅助开发工具的用户体验和选择展开。 Why I Switched to Droid from Cursor 2.0 - Ben Tossell AI辅助开发工具的用户偏好正在发生变化。一篇推文分享了用户从 Cursor 2.0 转向 Droid 的理由。Cursor 2.0 是一款知名的AI驱动代码编辑器,这次转换表明新的或不同的AI开发工具可能在特定功能、用户体验或效率方面提供了更具吸引力的优势。这一趋势反映了开发者在AI辅助编程工具选择上日益增长的多样性和对工具性能的细致考量。
阅读更多以下是过去4小时全球AI领域的动态汇总: Hugging Face发布214页的LLM训练手册《The Smol Training Playbook》- clem 🤗 Hugging Face发布了一份长达214页的**《The Smol Training Playbook》**,这份详细的指南被誉为LLM训练的“大师级课程”。该手册深入探讨了如何训练大型语言模型(LLMs),为开发者和研究人员提供了全面的资源和最佳实践,有望进一步降低LLM开发的门槛,推动开源AI社区的发展。 NVIDIA推出新的Nemotron RAG模型系列,包含多模态检索器- merve NVIDIA发布了全新的Nemotron RAG模型家族,这其中包括了 …
阅读更多以下是过去4小时内全球AI领域的重要动态: SoulX-Podcast语音模型发布,实现高真实度、长时段、多说话人语音生成-小互 Soul发布了SoulX-Podcast语音模型,实现高真实度、长时段、多说话人、多语种(中英双语+多方言)播客式语音生成。该模型具备方言和副语言控制能力(如笑声、叹息声、呼吸声),可连续生成90分钟以上的对话内容而不失稳定性。SoulX-Podcast还支持在零样本条件下完成声音与语气的克隆与迁移,显著提升了语音表达的真实感与感染力,并支持情境化生成,改善播客式语音的韵律变化与情绪丰富度。 玉伯的Youmind更新至0.5版本,整合研究创作产出流程-歸藏(guizang.ai) 玉伯的Youmind更新 …
阅读更多AI与人类结合导致愚蠢结果及对社会负面影响的担忧-Gary Marcus AI专家Gary Marcus指出,2025年,“糟糕的AI与麻木不仁的人类结合,正在导致极其愚蠢的事情发生”。他同时引述观点,批评AI正在“杀死和污染黑人和棕色城市”,并对公众过度依赖AI表示担忧。这些言论反映了对当前AI技术发展中存在的伦理、社会和环境问题的深刻忧虑,以及在AI应用过程中可能出现的负面后果。 对AI编程过度吹捧的警示-宝玉 博主“宝玉”对AI在编程领域的应用提出了审慎的看法,强调不应过度吹捧或贬低AI编程。他指出,如果使用AI的人本身不够靠谱,即使AI生成的代码存在问题,也可能被采纳,这并非AI本身不靠谱的问题。他警告称,有影响力的人物如 …
阅读更多Sonnet 4.5 架构分析-Ben Tossell Ben Tossell分享了由Sonnet 4.5模型进行的一项架构分析的有趣表格。该分析在充分的上下文支持下生成,体现了Sonnet 4.5在复杂数据分析和架构理解方面的强大能力。这表明AI模型在辅助专业领域决策和深入洞察方面正发挥越来越重要的作用,尤其是在需要大量背景信息进行推理的工作中,能够提供高效且精准的辅助。 将学术论文转化为科普文章的提示词-宝玉 宝玉分享了一个精心设计的“学术论文科普”提示词,旨在利用AI将晦涩难懂的学术论文转译成通俗易懂、引人入胜的科普文章。该提示词详细定义了AI作为科普作家的角色、工作流程(包括挖掘研究动机、消化论文核心要素、定位行业坐标 …
阅读更多