ESC
キーワードを入力してください

Flash Attention

algorithm
登場日 2022年5月
表示形式

GPU メモリ階層を活用してアテンション計算を IO 最適化するアルゴリズム。

学習・推論を大幅高速化。