OpenAI 创始人 Ilya 在证词中爆料:曾与 Anthropic 密谈合并,内部纷争不断-宝玉 OpenAI联合创始人兼前首席科学家伊尔亚·苏茨克维(Ilya Sutskever)的证词揭露了一段陈年往事:早在两年前,OpenAI董事会解雇Sam Altman后,其竞争对手Anthropic公司曾对与OpenAI合并表示“兴奋”。证词显示,如果这笔交易当时真的达成,Anthropic的CEO达里奥·阿莫迪(Dario Amodei)当时很有可能会反过来执掌OpenAI。这一爆料不仅揭示了OpenAI内部持续存在的权力斗争,也暗示了行业巨头之间在关键时期曾考虑大规模整合的可能性。 Is it just me, or does …
阅读更多沙特阿拉伯在FII9峰会推出SAGE人工智能计划 - Peter H. Diamandis, MD 在FII9峰会上,彼得·戴曼迪斯(Peter Diamandis)与伊玛德·莫斯塔克(Emad Mostaque)共同揭示了沙特阿拉伯向世界献礼的创新项目——SAGE。SAGE被定位为一个前沿的人工智能平台,旨在推动全球AI生态系统的发展。此举表明沙特阿拉伯正积极投资并参与到全球AI领域的基础设施建设和技术创新中,有望在全球人工智能格局中扮演日益重要的角色。 \n\n Baseten Training 正式发布,提供高级模型训练服务 - sarah guo 经过数月收集早期客户反馈并完成数千项任务后,Baseten正式宣布推出 …
阅读更多以下是过去4小时内全球AI领域的重要动态: OpenAI发布开源安全推理模型gpt-oss-safeguard - clem 🤗 OpenAI已发布gpt-oss-safeguard,这是一个处于研究预览阶段的开源安全推理模型,旨在用于内容分类和审核。该模型提供120B和20B两个版本,其核心特点是采用推理而非记忆的方式,能够直接读取并遵循开发者自定义的安全政策进行判断。这意味着开发者无需重新训练模型即可修改政策,模型能够输出其推理过程,且不同产品和场景可以灵活定制政策。性能评估显示,gpt-oss-safeguard在同时执行多项政策时,准确率优于GPT-5-thinking及其他gpt-oss模型,标志着内容安全从“被动学习规 …
阅读更多OpenAI 完成营利性资本重组,微软延长IP权益至2032年-宝玉 OpenAI 宣布已完成复杂的资本重组,正式将公司架构调整为由一个非营利基金会控制的“公益公司”性质的营利性实体 OpenAI Group。基金会将持有营利公司26%的股份,并负责任命董事会。作为早期投资者,微软将持有约27%的股份,目前公司估值约1350亿美元。此次重组使得微软对 OpenAI 模型知识产权的权益延长至2032年,并规定若实现通用人工智能 (AGI),需提交独立专家小组验证。此举旨在平衡AI技术发展与公共利益,并得到加州和特拉华州总检察长的放行,但附加了需持续减轻AI对青少年风险的条件。 \n\n NVIDIA 发布新版开放数据集和OCR工具, …
阅读更多以下是过去四小时全球AI领域的一些重要动态: 对家庭机器人5倍生产力提升的怀疑-Gary Marcus 知名AI怀疑论者Gary Marcus对一个旨在实现家庭机器人5倍生产力提升的演示表达了强烈的怀疑。他个人认为,该演示在实现这一宏大目标上的贡献度“不足1%”。这一评论反映了AI和机器人技术领域内部对于当前进步的实际效用和长远前景的持续争论,质疑了某些演示可能带来的过度乐观情绪,并强调了实际应用落地的复杂性。 AI提升知识获取却导致架构师更稀缺-宝玉 有观点指出,尽管AI技术能够使架构知识更容易获取和学习,但最终结果可能是架构师这一职位变得更加稀缺。作者认为,一个行业专家数量的增减,并非取决于知识获取的难易,而是由“清晰的成长路 …
阅读更多ListenHub 发布全新编辑模式,赋能 AI 播客和多人语音配音内容创作-Orange AI ListenHub 近期推出了全新的编辑模式,旨在简化 AI 生成音频内容的编辑流程,让用户像使用 Word 一样轻松编辑 AI 播客。此模式解决了此前 AI 生成语音内容难以修改的痛点,允许用户像导演选角一样为播客设定多个角色并指定声音,还能像作家一样灵活地插入或删除内容。此外,该功能也支持完全可控的多人语音配音,甚至可以用于制作多人有声书,致力于在 AI 功能和传统编辑器之间找到平衡,提供既简单又可控的创作体验。 AI Coding/Codex 实践技巧:利用 AI 自我日志调试-宝玉 分享了一项实用的 AI 编码/Codex 实 …
阅读更多《基于大语言模型的Vibe Coding综述》发布,探讨AI编程新范式-宝玉 中科院、杜克大学等机构联合发布了《基于大语言模型的Vibe Coding综述》,将Vibe Coding定义为人类开发者、软件项目和编程智能体之间的“三方关系”。论文指出,经验丰富的开发者在使用高级AI工具时,任务完成时间反而可能增加19%,这主要归因于上下文工程、反馈循环和基础设施等方面的挑战。文章还提出了五种Vibe Coding开发模式,并强调开发者应将AI智能体视为员工而非工具,其核心工作将转向意图阐述、上下文管理、系统级调试、架构监督及质量验证。Vibe Coding的推广也带来代码可靠性、安全、大规模监管以及教育体系脱节等深远挑战。 AI生成 …
阅读更多Suno AI音乐生成实验:从硬核舞曲到未来电子 - 向阳乔木 AI音乐平台Suno的用户正在积极探索其音乐生成能力。通过添加如hardstyle, hardtechno, cyberpunk, edm, dance, future house等风格提示词,并结合fast robotic female voice, vocal chop, robotic voice break effects, acid rap等声音效果,Suno能够生成节奏更快、更具舞曲风格的音乐。用户还分享了一个详细的歌词示例,展示了如何通过结构化的歌词(包括intro, verse, pre-drop, drop, breakdown, bridge, …
阅读更多以下是过去4小时内全球AI领域的重要动态: Peter H. Diamandis将出席FII-9峰会探讨AI、人形机器人和富足主题-Peter H. Diamandis, MD 著名未来学家Peter H. Diamandis博士正前往沙特阿拉伯利雅得,准备参加即将举行的FII-9峰会。他将在峰会上主持多场关于人工智能(AI)、人形机器人以及富足理论的对话和研讨会。此次会议预计将汇聚全球顶尖的思想家,共同探讨科技前沿对未来社会和经济的影响。Diamandis博士的参与预示着峰会将深入探讨AI与机器人技术如何推动人类社会向更丰富的未来发展。 AI/ML开发者分享视觉语言模型及计算机视觉教程仓库-merve AI/ML开发者merve提 …
阅读更多Veo 3.1 图生视频广告制作方法揭秘-歸藏(guizang.ai) 归藏(guizang.ai)分享了使用Veo 3.1制作图生视频广告的详细方法。该流程首先涉及为每个角色训练包含多种角度、表情和光线变化的数据集。接着,用户创建主提示词以定义环境参数,如灯光、建筑和对比度。随后,系统生成一个基础模板,其中不包含角色。最后,通过将参考图导入Nano Banana,来创建包含角色的最终图像。这一方法展示了AI在视频内容创作中实现精细控制的潜力,为广告制作带来了高效且高质量的解决方案。 Google Earth AI 接入 Gemini 迎来重大升级-小互 Google Earth AI近日宣布重大升级,通过深度整合Gemini模 …
阅读更多