マガジンのカバー画像

超高性能プログラミング技術のメモ

15
ハイパフォーマンスコンピューティング(HPC)で必要とされる高速なプログラムを書くための技術です。普通のプログラマーには、あまり必要ではありません。
運営しているクリエイター

2020年7月の記事一覧

行列積計算を高速化してみる

行列積計算を高速化してみる

超高性能プログラミング技術のメモ(15)

実は、このメモは、行列-行列積計算C=ABを高速化するために必要な技術を記録してきました。今回は、いよいよその行列積計算の高速化に挑みたいと思います。

行列積DGEMMは、HPC業界ではTop500ランキングでもベンチマークプログラムとして使われていて、今でも世界最高速が競われています。近年は、ディープラーニングの畳み込み計算などにも利用されているよう

もっとみる
CPUIDでCPUスペックを確認する

CPUIDでCPUスペックを確認する

超高性能プログラミング技術のメモ(14)

2020/7/22 動作周波数追記。コア数を修正

ここまで書き残してきた超高性能プログラミングのメモは、アセンブラ命令を多用しているため、CPUのスペックに思いっきり依存しています。しかし、CPUは、パッケージやマイクロ・アーキテクチャによって、使用できる拡張命令セットや、キャッシュメモリのサイズなどが変わります。そのため、同じプログラムでも同じ性能は

もっとみる