提供中 llm
v2024-12
DeepSeek-V3
text-generation
2024/12/26
中国DeepSeek社の671Bパラメータモデル。MoEアーキテクチャで効率的に動作。驚異的な低コストが特徴。
スペック
コンテキストウィンドウ
128K トークン
オープンソース情報
- 重みの公開
- 非公開
- ライセンス
- proprietary
- 学習データの開示
- 非開示
中国DeepSeek社の671Bパラメータモデル。MoEアーキテクチャで効率的に動作。驚異的な低コストが特徴。