
DeepSeek V3
ストックにはログインが必要です
最高のパフォーマンスと価値を誇るオープンソースAIモデル
Artificial Intelligence
GitHub
Open Source
DeepSeek V3の概要
DeepSeek V3は、優れた性能とコストパフォーマンスを誇るオープンソースのAIモデルです。
主な機能
- コーディング、翻訳、エッセイやメール文の作成など、テキストベースの作業に対応
- 文書をアップロードして長文の会話が可能
- 6710億のパラメータを持ち、わずか2.8M GPU時間で訓練されているため、他のモデルに比べて計算リソースが非常に効率的です
DeepSeek V3のトレーニングとパフォーマンス
- 約$5.58百万(2048 GPU)で2か月間トレーニング
- V2に比べて3倍の速度で60トークン/秒を処理
- APIの互換性が保持され、完全にオープンソース
開発背景
DeepSeekは2023年7月に創立され、中国本土で最大級の定量ヘッジファンドを運営するHigh-Flyer Quantからスピンオフされました。「すべての人類に利益をもたらすAI」という信念のもと、2019年に最初のAIクラスターの開発を始めました。
GitHubやX(旧Twitter)でのさらなる情報やレビューもチェックできます。
投票数: 16