Mixture of Experts (MoE)
architecture
表示形式
複数の専門家ネットワーク(experts)から動的にルーティングする疎活性化アーキテクチャ。
総パラメータを増やしつつ推論コストを抑える。
Mixtral / DeepSeek V3 / Qwen3 等で採用。
🔗 外部リンク
次に進む
目的に合わせて、学ぶ・比較する・相談するの3つの導線から選べます。
複数の専門家ネットワーク(experts)から動的にルーティングする疎活性化アーキテクチャ。
総パラメータを増やしつつ推論コストを抑える。
Mixtral / DeepSeek V3 / Qwen3 等で採用。
目的に合わせて、学ぶ・比較する・相談するの3つの導線から選べます。