QwQ-32B logo

QwQ-32B

R1レベルの推論を実現しながら、サイズは20倍小さい

Artificial Intelligence Open Source

概要

QwQ-32Bは、AlibabaのQwenチームによって開発された新しいオープンソースの大規模言語モデル(LLM)です。
このモデルは、スケールアップされた強化学習を活用し、DeepSeek-R1と同等の推論能力を持ちながら、サイズは20分の1となる32Bのパラメータを持っています。

特徴

  • 優れたサイズ/性能比: 小型ながら推論や数学、コーディングタスクにおいて高いパフォーマンスを発揮します。
  • スケールアップされた強化学習: 強力な基盤モデル(Qwen2.5-32B)をもとにして、強化学習を拡張しています。
  • 「思考モード」: 特別な「思考モード」が搭載されており、複雑な課題に対してより深い思考を可能にします。
  • オープンソース: モデルの重みがApache 2.0の下で公開されています。

利用可能性

現在、QwQ-32BはQwen ChatHF Spacesで利用できます。

このモデルによる推論性能の向上は、強力なAIをより低性能のハードウェア上で展開できることを意味し、コスト削減やアクセスの向上に寄与します。

投票数: 185
← 投稿一覧に戻る