Flash Attention
algorithm
登場日
2022年5月
表示形式
GPU メモリ階層を活用してアテンション計算を IO 最適化するアルゴリズム。
学習・推論を大幅高速化。
次に進む
目的に合わせて、学ぶ・比較する・相談するの3つの導線から選べます。
GPU メモリ階層を活用してアテンション計算を IO 最適化するアルゴリズム。
学習・推論を大幅高速化。
目的に合わせて、学ぶ・比較する・相談するの3つの導線から選べます。