見出し画像

評価環境|行列積高速化#1

この記事は、以下の記事を分割したものです。
[元の記事]行列積計算を高速化してみる
一括で読みたい場合は、元の記事をご覧ください。

使用するコンピュータは、手元のMacBook Proを使います。カタログスペックは、バッテリーが壊れた際に知ったシステム情報を見ると、次のとおりでした。

機種名   :MacBook Pro
CPU    :Dual-Core Intel Core i5
動作周波数 :2.9GHz
プロセッサ数:1
コア数   :2
SMT    :有効
L1キャッシュ:32KB
L2キャッシュ:コアあたり256KB
L3キャッシュ:4MB

明示されていませんが、購入時期から考えて、CPUのマイクロアーキテクチャはSkylake Microarchitecture(最新資料だと、Skylake Client Microarchitecture)だと思われます。

動作周波数は、CPUIDの情報だと基本が2.9GHz最大が3.3GHzに設定されていました。CPU使用量が増加すると、Tarbo Boost テクノロジーによって、自動的に動作周波数が上がる可能性があります。

コア数は2個ありますが、まずは1コア性能を向上させたいと思います。SMT(ハイパー・スレッディング・テクノロジー)は、正しく性能を測るためには無効にした方がいいのですが、方法がわからないのでこのままにします。

コンパイル環境には、Xcodeをインストールした上で、brewコマンドでgcc 10.1.0及びgfortranをインストールしました。/usr/local/bin/gccは、当初clangにリンクされているので、これをインストールしたgccに置き換える必要があります。

$ brew install gcc
$ brew install gfortran
$ rm /usr/local/bin/gcc; ln -s /usr/local/bin/gcc-10 /usr/local/bin/gcc

最適化オプションは、-O3を使用します。


次の記事

元の記事はこちらです。

ソースコードはGitHubで公開しています。


いいなと思ったら応援しよう!