DeepSeek V3 logo

DeepSeek V3

最高のパフォーマンスと価値を誇るオープンソースAIモデル

Artificial Intelligence GitHub Open Source

DeepSeek V3の概要

DeepSeek V3は、優れた性能とコストパフォーマンスを誇るオープンソースのAIモデルです。

主な機能

  • コーディング、翻訳、エッセイやメール文の作成など、テキストベースの作業に対応
  • 文書をアップロードして長文の会話が可能
  • 6710億のパラメータを持ち、わずか2.8M GPU時間で訓練されているため、他のモデルに比べて計算リソースが非常に効率的です

DeepSeek V3のトレーニングとパフォーマンス

  • 約$5.58百万(2048 GPU)で2か月間トレーニング
  • V2に比べて3倍の速度で60トークン/秒を処理
  • APIの互換性が保持され、完全にオープンソース

開発背景

DeepSeekは2023年7月に創立され、中国本土で最大級の定量ヘッジファンドを運営するHigh-Flyer Quantからスピンオフされました。「すべての人類に利益をもたらすAI」という信念のもと、2019年に最初のAIクラスターの開発を始めました。

GitHubやX(旧Twitter)でのさらなる情報やレビューもチェックできます。

投票数: 16
← 投稿一覧に戻る