
第10回 Matomoのレポートを見る(その1:ビジター編)
【登場人物はこちら】

今回から、Matomoのレポートをグループごとに詳しく見ていこう。
まずは、ビジターグループのレポートからだよ。
最初に「ビジター」の定義を確認しておこうか。
Matomoのビジターはアクセス元のIPアドレス/ホスト名とユーザーエージェント、あとはCookieデータによって一意に定義される。
ログ解析ではCookieデータは使えない(ログファイルに記録されていない)ので、ホストとユーザーエージェントの組み合わせで決まることになる。
この一意のデータは、後の処理のしやすさのために「VisitorID」という名前で保存されるよ。

VisitorIDが一意のデータになることで、例えば、PCとスマホから同じIPアドレスを使ってアクセスしたとしても、別のビジターとしてカウントされるという理解で合っていますか?

その通り。PCとスマホではブラウザが同じ、例えばChromeであっても、ユーザーエージェント情報が違うから別のビジターになるよ。
ビジターのレポートには次の種類がある。
概観
ビジットログ
リアルタイム
リアルタイムマップ
場所
デバイス
ソフトウェア
時間
ユーザーID
この中で「リアルタイム」と「リアルタイムマップ」は、現在時刻から24時間以内の訪問についてのみ集計されるレポートなので、ログ型解析ではデータが無い状態になるんだ。インポートしたログファイルは過去のアクセスについて記録されているものなので、24時間以内のアクセスについてはデータが入っていないんだよ。
また、「ユーザーID」は集計のための仕組みが別に必要になるので、この3つのレポートの説明は割愛させてもらうね。

ログ型解析とタグ型解析で使えるデータが違うんですね。リアルタイムデータが必要な場合は、タグ型解析を利用するんですね。

まず「概観」だけど、これは複数のビジット関連項目を1つの画面にまとめたものだよ。

これらの集計項目はこの後紹介するレポートの内容を簡単に示していると考えてほしい。
「ビジットログ」はビジット1つ1つについて、誰が、どこから、どんな環境で、どのページにアクセスしたかを細かく見るレポートだよ。

統計的なレポートではなく、セグメントで絞り込んで特定のビジットを調査するためのレポートだね。
一番上のビジットは1ページしか見ていない。
アメリカからのアクセスで、Bingの検索結果からやってきている。また、アイコンの表示から、WindowsのEdgeを使っていることが分かる。
2番目のビジットは3ページ閲覧していて、1ページ目のアクセスから3ページ目のアクセスまで38秒かかっている。
イギリスからのアクセスで、Googleの検索結果からのビジット、WindowsのEdgeを使っていることが分かる。
3番目のビジットは5182ページものアクセスを9時間40分かけて行っている。
日本国内からだけど、参照元はなく、WindowsのIEを使っていることが分かる。これはおそらく自動巡回ツール(クローラー)によるアクセスだよ。

どうしてそういうことが分かるんですか?

1つのビジターがこんなに大量のアクセスを行うということは考えにくい。
またアイコンにマウスカーソルを乗せるともう少し詳しい情報が表示される。
それによると、IE10とWindows7によるアクセスだとわかる。これは少し古いクローラーなどでよく使われる組み合わせなんだ。

会社からの場合「プロキシサーバー」を経由することになるんだけど、一つのIPアドレスから同じブラウザでアクセスされると、クローラーによるアクセスと同じような現象が起きることがある。
でも、プロキシサーバー経由の場合は近年利用されているOSやユーザーエージェントになるんだ。
このレポートは、セグメントなどで絞り込みを行って、ビジットを特定したうえでどんなアクションを行っているのかを調べるものだと思ってほしい。
つぎに「場所」はビジターがどこからアクセスしているかを分類したものだよ。

概要として地図の色の濃さでビジターの多さを表している。
その他に「国」「大陸」「地域」「都市」「ウェブブラウザ言語」の表が表示されている。
ログ解析では「ウェブブラウザ言語」だけは取得できない。これはタグ解析でのみ収集できるデータなんだ。
これらはホストIPアドレスから、おおよそのエリアを割り出しているんだ。そのためのデータベース(*1 ※詳しくは、本記事下部の注釈をご参照ください。)がMatomoには組み込まれている。
このレポートからは、サイトの多言語対応をどのくらい進めるか、またどの言語を優先的に行うべきかがわかるね。
「デバイス」は、ユーザーエージェント情報からビジターが使っているPCやスマホを分類するレポートだよ。


「デバイスタイプ」「デバイスのモデル」「デバイスブランド」が集計されている。「画面解像度」はタグ解析でのみ集計できる項目だ。
これらを見て、サイトのデザインをどのデバイスに対して適切なものにするべきかが判断できるよ。
「ソフトウェア」は、ユーザーエージェント情報からビジターが使っているOSやブラウザの種類を分類するレポートだよ


これらの情報はすべてログファイルのユーザーエージェント情報から集計されている。
「ブラウザプラグイン」はログに記録されていないので、タグ解析でのみ集計される項目だよ。
オペレーティングシステムとしてAndroidやiOSが多いようなら、それはモバイルからのアクセスが多いことを意味するから、サイトのデザインもモバイル向けに重点を置いた方がいいということが分かる。
「時間」は、1時間ごとのビジット数やページビュー数を集計するレポートだよ。

グラフ左上にある四角いアイコンをクリックすると、ビジット数以外の表示可能なメトリックスが選択できるので、必要に応じて追加・切り替えをしてみよう。

ローカルタイムとサイトのタイムゾーンというのは何が違うのですか?

ログファイルでは時刻情報がUTC、つまり協定世界時で扱われることが多い。それが「ローカルタイム」。
対して、本来のサイトの時間、ここでいえば日本時間だね、それが「サイトのタイムゾーン」だと思ってほしい。
まとめると、ビジターのレポートというのは、「どこから」「どんな環境」で「どのくらいの数の人」がサイトを見に来たかを集計するレポートといえるね。
ビジット数は一定ではなく、サイトを更新したり、広告を出したり、別のサイトにバナーやリンクを置くことで変動する。
その効果の測定をおおよそで行うこともできる基本的な指標だよ。
サイトに何らかのトラブルが発生して、閲覧ができないことがあった場合などには、どれくらいの影響があったか、時間とビジット数で把握することもできるね。
では、次回はビジターがどんなページを見たり資料をダウンロードしたかなどを集計する「行動」グループのレポートを見て行こう。
*1:Matomoインストール時に位置情報データベースを使用するオプションを選択することで、db-ip.comから無料のデータベースをダウンロードし、IPアドレスからおおよその地理的な位置情報を提供します。
このオプションは、インストール後に「設定」の「システム」からも追加することが可能です。
関連リンク
サイオステクノロジー「アクセス解析・データ活用」サービスの紹介
note「初心者のための優しいアクセス解析入門マガジン①」
note「初心者のための優しいアクセス解析入門マガジン②」