- OpenAI ChatGPT Atlas系统提示词曝光,揭示GPT-5身份及多功能工具集成-宝玉 OpenAI的ChatGPT Atlas系统提示词被公开,其中明确指出该模型为 GPT-5,知识截止日期为2024年6月,并启用了图像输入能力。该系统提示词详细展示了ChatGPT Atlas集成的多项内部工具,包括用于记忆管理的 bio 工具、任务自动化的 automations 工具、用于创建和更新文本文档的 canmore 工具、文件搜索 file_search、以及与Google日历、联系人、Gmail、图像生成和Python代码执行等服务的集成。这些指令揭示了ChatGPT Atlas作为独立浏览器应用程序,如何通过丰富 …
阅读更多OpenAI 推出全新 AI 浏览器 ChatGPT Atlas for macOS - Sam Altman & 小互 OpenAI 正式发布其首款 AI 优先网络浏览器 ChatGPT Atlas,并率先登陆 macOS 平台。Atlas 将 ChatGPT 从一个独立的网页或应用,转变为一个随处可用的认知层。它能够在用户浏览网页时,实时地理解、总结、提供建议或执行操作任务。Atlas 深度整合了 ChatGPT 的应用生态系统,通过开放 Apps SDK,允许第三方服务直接嵌入。用户可以在对话中直接操作应用,例如 Spotify 或 Zillow,这意味着 ChatGPT 不仅是一个浏览器助手,更是一个跨平台的“服务协调中 …
阅读更多在过去4小时内,全球AI领域涌现出多项新进展和讨论。语音技术方面,Fish Audio S1推出了升级版语音克隆模型和API,大幅提升了性能。Google的Veo视频模型增加了强大的精确编辑功能。Anthropic为生命科学领域推出了专属的Claude版本,并强化了Agent Skills。DeepSeek在AI基础设施和开放研究方面持续发力。此外,OpenAI发布了编写高质量文档的指南,知名思想家Ray Dalio也推出了其思想的AI智能体。 Fish Audio S1 API上线及语音克隆模型升级-小互 Fish Audio S1 API已正式上线,并对语音克隆模型进行了显著升级。该API实现了低于 500毫秒的首帧延 …
阅读更多在过去4小时内,AI领域主要关注Sora 2 Pro的视频生成能力升级、AI图像/视频生成的技术实践与Veo-3.1模型的正式发布。 Sora 2 Pro支持25秒视频生成与故事板功能-歸藏(guizang.ai) Sora 2 Pro现已支持生成最长达25秒的视频内容,并引入了故事板功能,允许用户对视频进行更精细的控制。一位用户详细分享了通过分镜提示词(如场景、镜头和情感描述)生成连贯情节视频的测试经验。该功能通过点击输入框的“故事板”按钮,并在右下角切换时间来实现,极大地增强了文生视频的叙事能力和用户自定义度。 AI图像与视频生成实践技巧分享-宝玉 AI图像和视频生成领域涌现了多项实用技巧。有用户分享了使用Grok …
阅读更多基于Claude Agent SDK开发的网页生成Coding Agent即将开源-宝玉 知名开发者“宝玉”宣布,他基于 Claude Agent SDK 开发了一个类似于 v0 dev 的 Coding Agent。该工具能够接受用户输入的Prompt,并自动生成网页,同时支持实时预览功能。宝玉表示,他正在整理代码,预计将在下周将该项目开源,届时更多开发者将能够接触和使用这一高效的网页生成工具,这预示着AI辅助开发领域的又一进步,特别是对于快速原型设计和前端开发流程可能带来显著的效率提升。
阅读更多以下是过去4小时全球AI领域的动态汇总: GAGA-1模型:AI视频语音与表演的新突破-歸藏(guizang.ai) Send AI发布了专注于人物对话表演的GAGA-1模型,被认为是目前在人物细微表演对话方面表现最强的模型,甚至可能超越Sora2。该模型在语音和表演表现上达到了极高水平,目前提供免费试用。使用技巧包括:在提示词中优先说明情绪变化,然后是语气和内容;双人对话表现出色,能理解左右、男女或A/B指定角色;图生时建议避免复杂肢体或全身动作;短文本可选择5秒生成时长,长对话选择10秒;目前支持16:9横屏比例,未来将支持9:16竖屏。测试显示,GAGA-1能够精准捕捉并配合剧烈情绪,即使在极限人脸角度下也能维持面部表情和嘴 …
阅读更多以下是过去4小时全球AI领域的动态摘要: Lovart 接入 Sora 2 模型:一键生成MV和宣传片-小互 AI工具Lovart已成功接入Sora 2模型,实现了从文字到视频的全自动一站式生成,尤其擅长制作MV和产品宣传片。用户只需提供简单的提示词,Lovart便能自动生成音乐、视频片段并进行智能剪辑,极大地简化了原本需要多种工具和复杂流程的视频创作过程,让不具备设计、剪辑或3D技能的用户也能轻松产出高质量视频内容。 Shadcn 在AI时代被加速:AI友好且易于生成-宝玉 用户界面(UI)组件库Shadcn因其出色的设计和与AI时代的良好契合而备受赞誉。如同TailwindCSS一样,Shadcn的组件在AI辅助下更容易生成和集 …
阅读更多Sora2 短剧引爆社交媒体,邀请码供不应求-orange.ai 由 Sora2 生成的一部短剧预告片在社交媒体上引起轰动,一天内达到 245万播放量、1.8万次转发及1900条评论,凸显了AI在内容创作上,特别是视频生成领域,已具备取代传统编剧、拍摄、剪辑和配音等环节的强大能力。与此同时,有用户表示Sora的体验远超传统短视频平台,并积极分享 Sora邀请码,甚至出现了10K人邀请码的消息以及飞书公益激活码帖子,显示出市场对Sora的高度热情和体验需求。 Anthropic Sonnet 4.5 额度重置,公司有望率先实现盈利-宝玉 Anthropic 旗下的 Sonnet 4.5 模型的用户使用额度已重置。在AI产业观察方面, …
阅读更多过去4小时全球AI要闻速览: AI驱动的全栈开发与部署平台迎来突破 - Emad & 小互 AI工具在全栈开发和产品部署领域取得显著进展。II-Agent 宣布支持通过单个提示词构建全栈网站并交付可编辑幻灯片,同时能调用 OpenAI Codex 处理复杂代码。另一方面,Bolt new 发布 V2 版本,深度集成了所有后端服务,包括服务器托管、数据库、API、支付和认证,使用户能够从零开始快速构建和上线完整产品。该平台提供可扩展的云端后端,支持百万级用户规模,并实现自动部署、调试和资源分配。它集成了 Claude Code、Cody、Codex 等顶级AI编码代理,内置深度规划功能,并能进行完全自主的调试,将错误率降低98%。这 …
阅读更多OpenAI Sora 2 引领AI视频社交新浪潮 - Emad/歸藏(guizang.ai)/向阳乔木 OpenAI 的最新视频模型 Sora 2 正在引发广泛关注,被誉为有望彻底改变用户生成内容和社交媒体。多位用户测试后表示,Sora 2 远超传统 AI 视频模型,具备多项创新功能:仅需两秒音频即可完美克隆音色(支持中英文),模型内置世界知识,能像成熟导演一样自主规划分镜和运镜,并从一句文本生成带有音效和完整电影化叙事的视频。其独特的“客串 cameo”社交玩法,允许用户“混剪”并个性化 AI 生成内容,被视为“AI 版 TikTok”,能有效促进社交裂变,降低 C 端用户创作成本。尽管有人指出其模型本身相对于 Veo3 等现 …
阅读更多