gpt-oss-safeguard
ストックにはログインが必要です
カスタムセーフティポリシーを用いたオープンな安全推論モデル
Artificial Intelligence
Open Source
Development
プロダクト紹介
gpt-oss-safeguardは、OpenAIが提供する新しいオープンソースのセーフティモデルです。120bおよび20bの2つのバージョンがあり、開発者が指定したカスタムポリシーを基に推論を行い、コンテンツを分類します。これにより、各決定の背後にある思考過程を透明化し、説明可能性を提供します。
主な特徴
- セーフティポリシーがモデルの実行から切り離され、開発者に「ホワイトボックス」環境を提供
- モデルの思考過程を確認することで、決定の理由を理解可能
- ポリシーテキストを編集するだけで迅速にセーフティルールを調整
利点
このプロダクトの最大の利点は、従来のように新しい分類器をトレーニングすることなく、素早く安全ルールを更新できる点です。これにより、AIに関連する法的リスクが高まる中で、安全性が強化されます。実際のポリシーを用いた試用も可能で、OpenAIの提供するサンプルを通じて、その動作を確認できます。
投票数: 104