ESC
キーワードを入力してください

Mixture of Experts (MoE)

architecture
表示形式

複数の専門家ネットワーク(experts)から動的にルーティングする疎活性化アーキテクチャ。

総パラメータを増やしつつ推論コストを抑える。

Mixtral / DeepSeek V3 / Qwen3 等で採用。