QwQ-32B

ProductHunt 製品ページ

R1レベルの推論を実現しながら、サイズは20倍小さい

Artificial Intelligence Open Source

QwQ-32B

概要

QwQ-32Bは、AlibabaのQwenチームによって開発された新しいオープンソースの大規模言語モデル（LLM）です。
このモデルは、スケールアップされた強化学習を活用し、DeepSeek-R1と同等の推論能力を持ちながら、サイズは20分の1となる32Bのパラメータを持っています。

特徴

優れたサイズ/性能比: 小型ながら推論や数学、コーディングタスクにおいて高いパフォーマンスを発揮します。
スケールアップされた強化学習: 強力な基盤モデル（Qwen2.5-32B）をもとにして、強化学習を拡張しています。
「思考モード」: 特別な「思考モード」が搭載されており、複雑な課題に対してより深い思考を可能にします。
オープンソース: モデルの重みがApache 2.0の下で公開されています。

利用可能性

現在、QwQ-32BはQwen ChatやHF Spacesで利用できます。

このモデルによる推論性能の向上は、強力なAIをより低性能のハードウェア上で展開できることを意味し、コスト削減やアクセスの向上に寄与します。

投票数: 185

← 投稿一覧に戻る