カーネル関数の性能推定と改良|行列積高速化#25
ここまで、行列積の高速化チューニングの手順を書きましたが、サンプルが思ったよりも性能が出ませんでした。そこで、もう少し粘ってチューニングをしていましたが、なんとか理論ピーク性能比率で90%を超えたので、何をやったのか書き残しておこうと思います。
追記
(2020/11/14)下記記事の分割&シリーズ化に伴い、タイトルを変更しました。
カーネル関数の作り直しサンプルを作成したのち、いろいろ計算速度を測定した結果、結局カーネル関数の実装が遅いのだろうという結論になりました。そ