評価環境|行列積高速化#1
この記事は、以下の記事を分割したものです。
[元の記事]行列積計算を高速化してみる
一括で読みたい場合は、元の記事をご覧ください。
使用するコンピュータは、手元のMacBook Proを使います。カタログスペックは、バッテリーが壊れた際に知ったシステム情報を見ると、次のとおりでした。
機種名 :MacBook Pro
CPU :Dual-Core Intel Core i5
動作周波数 :2.9GHz
プロセッサ数:1
コア数 :2
SMT :有効
L1キャッシュ:32KB
L2キャッシュ:コアあたり256KB
L3キャッシュ:4MB
明示されていませんが、購入時期から考えて、CPUのマイクロアーキテクチャはSkylake Microarchitecture(最新資料だと、Skylake Client Microarchitecture)だと思われます。
動作周波数は、CPUIDの情報だと基本が2.9GHz、最大が3.3GHzに設定されていました。CPU使用量が増加すると、Tarbo Boost テクノロジーによって、自動的に動作周波数が上がる可能性があります。
コア数は2個ありますが、まずは1コア性能を向上させたいと思います。SMT(ハイパー・スレッディング・テクノロジー)は、正しく性能を測るためには無効にした方がいいのですが、方法がわからないのでこのままにします。
コンパイル環境には、Xcodeをインストールした上で、brewコマンドでgcc 10.1.0及びgfortranをインストールしました。/usr/local/bin/gccは、当初clangにリンクされているので、これをインストールしたgccに置き換える必要があります。
$ brew install gcc
$ brew install gfortran
$ rm /usr/local/bin/gcc; ln -s /usr/local/bin/gcc-10 /usr/local/bin/gcc
最適化オプションは、-O3を使用します。
次の記事
元の記事はこちらです。
ソースコードはGitHubで公開しています。