在过去4小时内,全球AI领域涌现出多项新进展和讨论。语音技术方面,Fish Audio S1推出了升级版语音克隆模型和API,大幅提升了性能。Google的Veo视频模型增加了强大的精确编辑功能。Anthropic为生命科学领域推出了专属的Claude版本,并强化了Agent Skills。DeepSeek在AI基础设施和开放研究方面持续发力。此外,OpenAI发布了编写高质量文档的指南,知名思想家Ray Dalio也推出了其思想的AI智能体。 Fish Audio S1 API上线及语音克隆模型升级-小互 Fish Audio S1 API已正式上线,并对语音克隆模型进行了显著升级。该API实现了低于 500毫秒的首帧延 …
阅读更多Perplexity产品更新:支持连接私有信息源-向阳乔木 Perplexity近日推出一项重要产品更新,允许用户授权连接Notion、GitHub和Gmail等私有应用,以实现更具个性化和深度的信息搜索。这一功能旨在通过整合用户的私人数据源,提供更定制化的搜索结果,从而显著提升用户体验和产品黏性。此举有望让Perplexity成为用户个人信息管理和检索的关键AI工具。 AI Agent与企业低代码应用的未来走向-宝玉 关于ToB领域AI Agent的低代码落地问题,有专家指出,尽管低代码能帮助业务人员快速验证可行性,但其灵活性和深度扩展能力有限。他认为,未来企业内部AI应用的开发方向应是业务人员借助AI辅助,与技术人员紧密合作搭 …
阅读更多HuggingFace创始人会面,讨论Werewolf Benchmark项目-clem 🤗 HuggingFace 联合创始人兼 CEO Clement Delangue 转发了一条消息,内容是关于一个名为 Werewolf Benchmark 的研究项目团队与 HuggingFace 创始人在巴黎会面并进行了讨论。这表明该基准测试项目在AI研究领域获得了显著关注,可能预示着其在评估或推动大型语言模型发展方面的潜在影响力。 GPT-5与Claude在代码生成上的表现对比-宝玉 用户“宝玉”经过多次测试后指出,即使开启了 GPT-5 的“hight”模式,其在代码生成方面的表现仍不如 Claude 模型。这一观察为开发者和研究人员 …
阅读更多Libin图像生成基准发布,挑战AI精确控制能力 - Gary Marcus Gary Marcus介绍了名为**“Libin图像生成基准”的新评估工具,旨在测试AI模型在生成图像时对精确细节的控制能力。该基准要求模型根据提示词准确生成包含十七本大小各异、标题和作者清晰可读**的真实英文书籍的书架图像,并指定其中一本封面为红色。这突显了当前图像生成AI在处理复杂、具体指令时,尤其是在需要精确数字和属性匹配的场景中,仍面临挑战。 马来西亚推出全球首家AI驱动银行Ryt - Peter H. Diamandis, MD 马来西亚正式推出了全球首家AI驱动型银行Ryt。这家创新银行旨在利用人工智能技术,为用户提供无等待的金融服务。Ryt …
阅读更多