以下是过去4小时内全球AI领域的重要动态: OpenAI发布开源安全推理模型gpt-oss-safeguard - clem 🤗 OpenAI已发布gpt-oss-safeguard,这是一个处于研究预览阶段的开源安全推理模型,旨在用于内容分类和审核。该模型提供120B和20B两个版本,其核心特点是采用推理而非记忆的方式,能够直接读取并遵循开发者自定义的安全政策进行判断。这意味着开发者无需重新训练模型即可修改政策,模型能够输出其推理过程,且不同产品和场景可以灵活定制政策。性能评估显示,gpt-oss-safeguard在同时执行多项政策时,准确率优于GPT-5-thinking及其他gpt-oss模型,标志着内容安全从“被动学习规 …
阅读更多