Ben Tossell的专家平台新增机构身份选项-Ben Tossell Ben Tossell宣布,其专家平台experts.bensbites.com已新增允许用户指定自己是否属于某个代理机构的功能。尽管用户仍需通过个人账户注册,但这一更新为代理机构成员提供了更明确的身份标识,有助于完善平台上的专家信息和合作模式。 AI未来预测与个人发展建议-向阳乔木 一位作者分享了对AI未来的一些**“疯狂”预测和个人发展建议**。预测中提及了培养讲故事能力、提升品味、真人出镜建立信任等已形成共识的方向,但部分观点仍待验证。作者建议当下可着手培养品味与讲故事能力,学习编排组合AI工具并掌控AI Agent,建立人机协作的作品集,并积极探 …
阅读更多在过去4小时内,全球AI领域的主要动态围绕着AI辅助开发工具的用户体验和选择展开。 Why I Switched to Droid from Cursor 2.0 - Ben Tossell AI辅助开发工具的用户偏好正在发生变化。一篇推文分享了用户从 Cursor 2.0 转向 Droid 的理由。Cursor 2.0 是一款知名的AI驱动代码编辑器,这次转换表明新的或不同的AI开发工具可能在特定功能、用户体验或效率方面提供了更具吸引力的优势。这一趋势反映了开发者在AI辅助编程工具选择上日益增长的多样性和对工具性能的细致考量。
阅读更多以下是过去4小时全球AI领域的动态汇总: Hugging Face发布214页的LLM训练手册《The Smol Training Playbook》- clem 🤗 Hugging Face发布了一份长达214页的**《The Smol Training Playbook》**,这份详细的指南被誉为LLM训练的“大师级课程”。该手册深入探讨了如何训练大型语言模型(LLMs),为开发者和研究人员提供了全面的资源和最佳实践,有望进一步降低LLM开发的门槛,推动开源AI社区的发展。 NVIDIA推出新的Nemotron RAG模型系列,包含多模态检索器- merve NVIDIA发布了全新的Nemotron RAG模型家族,这其中包括了 …
阅读更多以下是过去4小时内全球AI领域的重要动态: SoulX-Podcast语音模型发布,实现高真实度、长时段、多说话人语音生成-小互 Soul发布了SoulX-Podcast语音模型,实现高真实度、长时段、多说话人、多语种(中英双语+多方言)播客式语音生成。该模型具备方言和副语言控制能力(如笑声、叹息声、呼吸声),可连续生成90分钟以上的对话内容而不失稳定性。SoulX-Podcast还支持在零样本条件下完成声音与语气的克隆与迁移,显著提升了语音表达的真实感与感染力,并支持情境化生成,改善播客式语音的韵律变化与情绪丰富度。 玉伯的Youmind更新至0.5版本,整合研究创作产出流程-歸藏(guizang.ai) 玉伯的Youmind更新 …
阅读更多AI与人类结合导致愚蠢结果及对社会负面影响的担忧-Gary Marcus AI专家Gary Marcus指出,2025年,“糟糕的AI与麻木不仁的人类结合,正在导致极其愚蠢的事情发生”。他同时引述观点,批评AI正在“杀死和污染黑人和棕色城市”,并对公众过度依赖AI表示担忧。这些言论反映了对当前AI技术发展中存在的伦理、社会和环境问题的深刻忧虑,以及在AI应用过程中可能出现的负面后果。 对AI编程过度吹捧的警示-宝玉 博主“宝玉”对AI在编程领域的应用提出了审慎的看法,强调不应过度吹捧或贬低AI编程。他指出,如果使用AI的人本身不够靠谱,即使AI生成的代码存在问题,也可能被采纳,这并非AI本身不靠谱的问题。他警告称,有影响力的人物如 …
阅读更多Sonnet 4.5 架构分析-Ben Tossell Ben Tossell分享了由Sonnet 4.5模型进行的一项架构分析的有趣表格。该分析在充分的上下文支持下生成,体现了Sonnet 4.5在复杂数据分析和架构理解方面的强大能力。这表明AI模型在辅助专业领域决策和深入洞察方面正发挥越来越重要的作用,尤其是在需要大量背景信息进行推理的工作中,能够提供高效且精准的辅助。 将学术论文转化为科普文章的提示词-宝玉 宝玉分享了一个精心设计的“学术论文科普”提示词,旨在利用AI将晦涩难懂的学术论文转译成通俗易懂、引人入胜的科普文章。该提示词详细定义了AI作为科普作家的角色、工作流程(包括挖掘研究动机、消化论文核心要素、定位行业坐标 …
阅读更多- OpenAI ChatGPT Atlas系统提示词曝光,揭示GPT-5身份及多功能工具集成-宝玉 OpenAI的ChatGPT Atlas系统提示词被公开,其中明确指出该模型为 GPT-5,知识截止日期为2024年6月,并启用了图像输入能力。该系统提示词详细展示了ChatGPT Atlas集成的多项内部工具,包括用于记忆管理的 bio 工具、任务自动化的 automations 工具、用于创建和更新文本文档的 canmore 工具、文件搜索 file_search、以及与Google日历、联系人、Gmail、图像生成和Python代码执行等服务的集成。这些指令揭示了ChatGPT Atlas作为独立浏览器应用程序,如何通过丰富 …
阅读更多OpenAI 推出全新 AI 浏览器 ChatGPT Atlas for macOS - Sam Altman & 小互 OpenAI 正式发布其首款 AI 优先网络浏览器 ChatGPT Atlas,并率先登陆 macOS 平台。Atlas 将 ChatGPT 从一个独立的网页或应用,转变为一个随处可用的认知层。它能够在用户浏览网页时,实时地理解、总结、提供建议或执行操作任务。Atlas 深度整合了 ChatGPT 的应用生态系统,通过开放 Apps SDK,允许第三方服务直接嵌入。用户可以在对话中直接操作应用,例如 Spotify 或 Zillow,这意味着 ChatGPT 不仅是一个浏览器助手,更是一个跨平台的“服务协调中 …
阅读更多在过去4小时内,全球AI领域涌现出多项新进展和讨论。语音技术方面,Fish Audio S1推出了升级版语音克隆模型和API,大幅提升了性能。Google的Veo视频模型增加了强大的精确编辑功能。Anthropic为生命科学领域推出了专属的Claude版本,并强化了Agent Skills。DeepSeek在AI基础设施和开放研究方面持续发力。此外,OpenAI发布了编写高质量文档的指南,知名思想家Ray Dalio也推出了其思想的AI智能体。 Fish Audio S1 API上线及语音克隆模型升级-小互 Fish Audio S1 API已正式上线,并对语音克隆模型进行了显著升级。该API实现了低于 500毫秒的首帧延 …
阅读更多在过去4小时内,AI领域主要关注Sora 2 Pro的视频生成能力升级、AI图像/视频生成的技术实践与Veo-3.1模型的正式发布。 Sora 2 Pro支持25秒视频生成与故事板功能-歸藏(guizang.ai) Sora 2 Pro现已支持生成最长达25秒的视频内容,并引入了故事板功能,允许用户对视频进行更精细的控制。一位用户详细分享了通过分镜提示词(如场景、镜头和情感描述)生成连贯情节视频的测试经验。该功能通过点击输入框的“故事板”按钮,并在右下角切换时间来实现,极大地增强了文生视频的叙事能力和用户自定义度。 AI图像与视频生成实践技巧分享-宝玉 AI图像和视频生成领域涌现了多项实用技巧。有用户分享了使用Grok …
阅读更多