Emad lamenting the lost buzz around open model tuning-Emad Emad表达了对开放模型发布后社区调优和竞赛热度下降的怀念,指出虽然调优活动仍在进行,但早期那种充满激情的“嗡嗡声”已不复存在。Gary Marcus对此表示赞同,认为这是“非常悲伤”的现象。这反映了部分AI社区对当前开放模型生态中创新活力和协作氛围变化的担忧。 Hot take: We are NOT doomed.-Peter H. Diamandis, MD 未来学家Peter H. Diamandis博士发布了一条乐观的推文,驳斥了“我们注定失败”的悲观论调。他强调,从统计学角度来看,当前是人类历史上最好的 …
阅读更多以下是过去4小时内全球AI领域的重要动态: Amjad Masad赞扬Jordan在AI品味上的突破 - Amjad Masad Replit CEO Amjad Masad高度赞扬了Jordan (@jordwalke) 在赋予AI卓越品味方面的执着追求,并指出其努力已开始显现成果。这一进展预示着AI在理解和生成更具美学和判断力的内容方面正取得突破性进展,有望为用户带来更精致和个性化的AI体验。 GAGA-1正式发布,可免费生成会说话的生动视频并计划新增竖屏与自定义音色 - 小互 Gaga AI正式推出其GAGA-1模型,现已免费开放使用,无需邀请码。该模型允许用户只需上传一张照片并提供文本提示,即可生成会说话、会表演的生动视频。 …
阅读更多我的经验是编程任务,gpt-5-codex high 最好,文档任务、或者做计划可以选 gpt-5 high - 宝玉 宝玉分享了他在实际工作中使用GPT-5系列模型的心得体会。他指出,在处理编程任务时,gpt-5-codex high 版本展现出卓越的性能和效率,是目前的首选。而对于文档处理、内容创作或制定计划等任务,则更推荐使用标准的 gpt-5 high 版本。这一经验表明,不同版本的GPT-5模型可能针对特定应用场景进行了优化,用户在选择AI工具时,应根据具体任务类型进行适配,以最大化模型的效用并提升工作效率。
阅读更多以下是过去4小时内全球AI领域的动态摘要: 开发者对Claude Code的依赖日益加深,相关工具受关注-orange.ai 开发者orange.ai表示对Claude Code的依赖性越来越强,称其是处理报销、数据分析、写作和Vibe Coding等场景下最便捷的选择。其开发的Claude Code Now快速启动器已获得近200个星标,并且Windows版本也已完成。下一步计划解决切换不同模型参数的痛点。 AI编程工具引发新挑战:“凭感觉编程地狱”-宝玉 宝玉分享了一篇由Lane Wagner撰写的文章,探讨了AI编程工具带来的新困境——“凭感觉编程地狱”。文章指出,AI编程工具虽能提高效率,但也可能导致开发者盲目依赖、生成臃肿 …
阅读更多以下是过去4小时全球AI领域的动态摘要: Lovart 接入 Sora 2 模型:一键生成MV和宣传片-小互 AI工具Lovart已成功接入Sora 2模型,实现了从文字到视频的全自动一站式生成,尤其擅长制作MV和产品宣传片。用户只需提供简单的提示词,Lovart便能自动生成音乐、视频片段并进行智能剪辑,极大地简化了原本需要多种工具和复杂流程的视频创作过程,让不具备设计、剪辑或3D技能的用户也能轻松产出高质量视频内容。 Shadcn 在AI时代被加速:AI友好且易于生成-宝玉 用户界面(UI)组件库Shadcn因其出色的设计和与AI时代的良好契合而备受赞誉。如同TailwindCSS一样,Shadcn的组件在AI辅助下更容易生成和集 …
阅读更多Radical Numerics发布RND1,最强大的扩散语言模型 Radical Numerics公司推出了RND1,声称这是迄今为止最强大的基础扩散语言模型(DLM)。该模型旨在推动AI在语言理解和生成领域的最新进展,可能为内容创作、代码生成及其他AI应用带来新的可能性。 Emad M.呼吁社会核心模型全面开放与合成化 Emad M.强调,驱动社会运行的模型需要实现完全开放,包括数据和权重。他指出,这些模型应趋向于完全合成和聚焦,并透露其团队正致力于政府、金融和健康领域的开放模型开发,预计很快将有更多公告发布。 Gary Marcus批判AI炒作及大模型局限性 AI研究员Gary Marcus对当前AI领域的过度炒作表示担忧, …
阅读更多OpenAI推出“Apps in ChatGPT”平台及开发者SDK OpenAI近日发布了“Apps in ChatGPT”,将ChatGPT从单纯的聊天工具升级为一个可运行应用的平台。用户现在可以直接在对话界面中调用外部应用,例如利用Zillow查找房产、通过Spotify创建歌单或在Coursera上学习课程,全程无需切换到其他网站或应用。与此同时,OpenAI还面向开发者发布了Apps SDK,允许开发者构建“ChatGPT内的App”,自定义界面并接入自己的后端API(如CRM、数据库、SaaS系统),从而将服务无缝触达数亿ChatGPT用户,开启了一个全新的AI生态入口。 NVIDIA、AMD与OpenAI之间AI交易 …
阅读更多OpenAI发布GPT-5 Pro、Sora 2及Pro API,并公布详细定价-歸藏(guizang.ai) OpenAI已正式推出GPT-5 Pro、Sora 2及Sora 2 Pro API服务。其中,GPT-5 Pro的百万Token输出价格高达120美元。Sora 2的视频生成服务定价为每秒0.1美元,而Sora 2 Pro则为每秒0.3美元。这些新工具,特别是Sora 2,被认为能够将简单的自拍和文字描述转化为电影级别的视频内容,预示着AI创作者时代的到来。同时,业界也在探讨其巨大的经济潜力,例如通过“GDP测试”评估AI代理的经济贡献,以及Sora 2可能为普通用户带来的百万年收入可能性。 AI Token使用量惊 …
阅读更多OpenAI Sora 推出IP版权精细控制与商业化分成模式-Sam Altman OpenAI 正为视频生成模型 Sora 推出两项重要调整。首先,OpenAI 将允许IP版权方对人物角色的创作提供更细粒度的控制,版权方可以精细设定允许/不允许、允许的场景及可能的限制,甚至放开大尺度创作,以促进“互动式粉丝创作”并吸引更多版权方参与。其次,鉴于用户创作量远超预期导致成本上升,OpenAI 计划探索商业化路径,推出收入分享模式,如果用户创作的视频涉及版权方的角色,OpenAI 将与版权方分享相应的收入。Sam Altman 强调团队将像ChatGPT早期一样进行快速迭代,并特别提及日本内容生态的强大创意表现力,暗示日本动漫/角色可 …
阅读更多以下是过去4小时全球AI领域的动态摘要: ChatGPT Pro用户开始灰度测试Sora 2视频生成功能-宝玉 有消息指出,部分ChatGPT Pro用户已开始获得Sora 2视频生成功能的灰度测试权限。目前该功能允许用户生成长达15秒的视频内容,不过生成结果仍处于**“灰度”**或测试阶段。这一进展预示着OpenAI在文本到视频生成技术方面的持续推进,并将高端视频生成能力逐渐开放给更多用户,尽管目前仍未全面上线。 关于AI Agent任务管理的命令行工具讨论-宝玉 有开发者讨论了类似AWS CLI的命令行工具在远程管理云端AI Agent任务中的应用。这类工具,例如Jules,能让开发者通过命令行界面高效管理云端运行的代码和任务, …
阅读更多