
QwQ-32B
ストックにはログインが必要です
R1レベルの推論を実現しながら、サイズは20倍小さい
Artificial Intelligence
Open Source
概要
QwQ-32Bは、AlibabaのQwenチームによって開発された新しいオープンソースの大規模言語モデル(LLM)です。
このモデルは、スケールアップされた強化学習を活用し、DeepSeek-R1と同等の推論能力を持ちながら、サイズは20分の1となる32Bのパラメータを持っています。
特徴
- 優れたサイズ/性能比: 小型ながら推論や数学、コーディングタスクにおいて高いパフォーマンスを発揮します。
- スケールアップされた強化学習: 強力な基盤モデル(Qwen2.5-32B)をもとにして、強化学習を拡張しています。
- 「思考モード」: 特別な「思考モード」が搭載されており、複雑な課題に対してより深い思考を可能にします。
- オープンソース: モデルの重みがApache 2.0の下で公開されています。
利用可能性
現在、QwQ-32BはQwen ChatやHF Spacesで利用できます。
このモデルによる推論性能の向上は、強力なAIをより低性能のハードウェア上で展開できることを意味し、コスト削減やアクセスの向上に寄与します。
投票数: 185