gpt-oss-safeguard logo

gpt-oss-safeguard

カスタムセーフティポリシーを用いたオープンな安全推論モデル

Artificial Intelligence Open Source Development

プロダクト紹介

gpt-oss-safeguardは、OpenAIが提供する新しいオープンソースのセーフティモデルです。120bおよび20bの2つのバージョンがあり、開発者が指定したカスタムポリシーを基に推論を行い、コンテンツを分類します。これにより、各決定の背後にある思考過程を透明化し、説明可能性を提供します。

主な特徴

  • セーフティポリシーがモデルの実行から切り離され、開発者に「ホワイトボックス」環境を提供
  • モデルの思考過程を確認することで、決定の理由を理解可能
  • ポリシーテキストを編集するだけで迅速にセーフティルールを調整

利点

このプロダクトの最大の利点は、従来のように新しい分類器をトレーニングすることなく、素早く安全ルールを更新できる点です。これにより、AIに関連する法的リスクが高まる中で、安全性が強化されます。実際のポリシーを用いた試用も可能で、OpenAIの提供するサンプルを通じて、その動作を確認できます。

投票数: 103
← 投稿一覧に戻る