見出し画像

金融分析×情報技術〜第5回インターン勉強会〜

はじめまして、インターン生の今井です。

金融の知識をビジネスの現場で身に付けたいと思いインターンにジョインすることを決めたのが昨年の秋。
気がつけば半年が経ち、ユニークなメンバーと一緒に仕事ができるこの環境を楽しんでいます。

大学では工学部に所属しており、工学的なアプローチで経済・金融を分析することに興味があるので、そういった知識を共有できればと思い勉強会を担当させていただきました。

というわけで、第5回のテーマは「金融分析×情報技術」です。
ここでは2つの技術を紹介します。

機械学習とは?

一つ目は、機械学習です。近年注目されているAI(人工知能)とも関わりの深い技術であり、耳にしたことのある方も多いのではないかと思います。
さて、その機械学習ですが簡単に説明すると

①大量のデータを与え、コンピュータに規則を学習させる
②新しいデータ(判断材料)が与えられると、今までに学習した規則をベースにコンピュータが勝手に判断

というプロセスのことを指します。

人間が今まで経験則でやってきたこと・人間では情報が多すぎて規則性を見つけられなかったことを代わりに処理できる可能性を持っているため、広い分野で活躍が期待されます。
具体的な例を挙げると、画像認識や商品レコメンドが挙げられます。

機械学習×金融

まず、機械学習と金融それぞれの特徴を考えたいと思います。

機械学習:与えられたデータ(過去)から現在と似た状況を見つけ、未来を予測することが得意。
金融:経済指標などから未来の経済動向を正確に予測することが利益につながる。今までは個人の経験値に頼っていた 。

このような特徴があるため、機械学習と金融は相性が良く、金融は機械学習の応用対象として様々な研究がされている分野となっています。

株価、イールドカーブなどの予測に機械学習は利用されています。ここではその全てを紹介することは不可能であるため、筆者が特に興味を惹かれた研究を紹介したいと思います。

機械学習×金融政策予測

私が紹介したいのは

水門善之, 勇大地(2017) . 日銀総裁会見の表情解析に基づく感情値の計測と金融政策変更との関係 

です。

この論文の背景は「従来、日銀総裁の会見は文章として公表されるだけだったが、2014年からは動画配信もされるように。情報量が増加したことを利用できるのでは?」というものです。

金融政策の決定に大きく関わる立場にある日銀総裁の会見に関する情報量の増加に着目した、ということですね。

次に内容を要約すると、「深層学習などを用いた表情認識アルゴリズムで会見における日銀総裁の表情を解析した。重大な金融政策変更を行う直前の回の会見では「怒り」や「嫌悪」の値が高くなり、変更後 の会見では「悲しみ」の数値が低下する傾向が見られた。 」となります。

つまり、日銀総裁の会見での表情を分析すれば重大な金融政策変更が行われるタイミングがわかる(かもしれない)ということを主張しています。

詳しく内容を見ていきましょう。

スクリーンショット 2020-04-13 22.31.14

(出典:水門善之, 勇大地(2017) . 日銀総裁会見の表情解析に基づく感情値の計測と金融政策変更との関係)

まず、この分析は日銀総裁の会見動画のスクリーンショットを0.5秒おきに撮ることから始まります。

そして、Microsoft社が開発した表情認識アルゴリズムを使うことで、各スクリーンショットごとに「喜び」「悲しみ」「怒り」などの感情が数字として分かるようになります。
この表情認識アルゴリズムに機械学習が利用されています。
そして、会見ごとに各感情の占める割合を計算します。

スクリーンショット 2020-04-13 22.31.20

スクリーンショット 2020-04-13 22.31.25

(出典:水門善之, 勇大地(2017) . 日銀総裁会見の表情解析に基づく感情値の計測と金融政策変更との関係)

こうして計算された感情の割合をグラフにしたものが上の図です。
これによって、

・重大な金融政策変更を行う直前の会見では「怒り」や「嫌悪」の割合が高くなる傾向
・金融政策変更に向けては「悲しみ」の割合が上昇、変更後は低下する傾向

がわかります。この傾向が生じる理由として、論文著者は

・「怒り」や「嫌悪」の割合の変化に関しては、既存の政策に対する問題意識の高まりがネガティブな表情につながった可能性
・「悲しみ」の割合の変化に関しては、政策変更によって抱えていた問題意識が緩和された安堵が表情に出た可能性

と述べています。

金融への機械学習の応用の中で、特定の人物の表情に注目した研究は非常に珍しく、面白いと思ったのでここで紹介させていただきました。
日銀総裁だけでなく、欧州中央銀行の総裁・副総裁の表情解析をした研究もあるため、興味を持たれた方はそちらも調べてみてはいかがでしょうか。

テキストマイニングとは?

機械学習の次はテキストマイニングを紹介したいと思います。
こちらは機械学習と違い、耳にしたことのある方はそこまで多くないと思われます。

テキストマイニングとは、コンピュータで処理することで大量の文章データから有益な情報を取り出すことを指します。コンピュータでの処理は

①文を単語に分割
②単語の活用を元に戻す
③その単語の出現頻度や相関関係を分析

といった手順を踏みます。

テキストマイニングの最大の特徴は、『定性データから高付加価値の情報を抽出できる』という点です。

本当にざっくりと言うと、大事なところがわかりにくい文章から大事な情報をピックアップしてくれる、ということです。
こういった特徴を持つため、アンケート調査の自由記述欄やSNS分析に利用されることが多いです。

では具体例を見ていきましょう。

スクリーンショット 2020-04-13 22.09.59

ある居酒屋がサービス向上のためにSNSの口コミを分析しようとしているケースを考えてみましょう。

店名を検索すると、上図のようにさまざまな意見が出てきますが、このままではサービスの向上につながりません。
なぜならば、「意見の数が多すぎて読みきれない」「どういう意見が多いのか把握しきれない」「どうでもよい意見が混ざっている」等の問題があるからです。このような場面で活躍するのがテキストマイニングです。

スクリーンショット 2020-04-13 22.11.04

まず、文章を単語ごとに区切ります(上の文章に「/」が入っているのが見えると思います)。
次に、各単語の活用を元の形に戻します(例えば、「予約し」→「予約する」)。
この二つのプロセスを合わせて「形態素解析」といいます。さらに、単語と単語の意味的なつながりを調べる「構文解析」を行います。

スクリーンショット 2020-04-13 22.12.06

このようなステップを踏むと、大量の口コミ(文章データ)から上のイメージ図のように有益な情報を取り出すことができるのです。

テキストマイニング×金融

金融や経済の分析にテキストマイニングを利用する試みは1990年代からありました。

当時は新聞記事の文章などを対象にしていましたが、2000年代に入るとツイッターやブログなどの文章も対象となりました。

先ほどの機械学習の時と同様に、金融とテキストマイニングの研究はたくさんあるため、ここでは一つだけ紹介させていただきます。

テキストマイニング×アナリストレポート

私たちインベストメントブリッジのインターン生のメイン業務がアナリストレポート作成のサポートということもあり、ここではアナリストレポートの文章を対象とした研究を紹介したいと思います。

平松賢士,酒井浩之,坂地泰紀(2018). 深層学習を用いて極性付与されたアナリストレポートと株式リターンとの関連性 

この研究の背景には、証券市場における情報過多が発生していることがあります。

例えばアナリストレポートは多い時で1日に1000本以上リリースされるなど、証券市場における情報は人間が活用しきれる量を超えてしまっているのが現状なのです。

そのため、投資家の情報収集・投資判断を支援するツールへの需要が高まっています。そのツールの一つとして期待されているのがテキストマイニングなのです。

この論文の要旨は、「テキストマイニングを用いて文章に出てくる単語からアナリストレポートに極性(トーン)を付与し、その極性と株価が連動する傾向があることを示した」というものです。

詳しく見ていきましょう。
まず、レーティングが上がった(下がった)レポートから特徴的な単語を学習します(ここではテキストマイニングと同時に機械学習が用いられています)。

好景気により、〇〇の需要が伸びたため利益は増加することが予想される。
・△△市場の成長鈍化により、利益増は難しいだろう。

アナリストレポートには上のような文章が並びますが、レーティングが上がっている(下がっている)レポートに出て来やすい単語をそれぞれ学習するのです。

当然、レーティングが上がっているレポートにはポジティブなワードが、下がっているレポートにはネガティブなワードが出て来やすくなります。
そして、学習が終わった後は分析したいレポートをテキストマイニングし、上述の学習をもとにトーンを決定します。

2009年から2016年までに発行された前回レポートからレーティングおよび各利益の値が変更されていないレポートを対象としてトーンを付与し、トーンと株価の変動の関係を調べたところ、2つの結果が得られました。

①レポート発行日前後の株価リターンとレポートの間には強い関係がある。つまり、アナリストレポートの楽観的(悲観的)なトーンに株価は正(負)に反応する。
②全期間でみると強気トーンのレポートは弱気トーンのものより、株価リターンが上回る。また、3年程度で区切ってもリターンが反転する傾向は見られない。つまり、トーンに対する株価反応はその後修正されない。

このようにテキストマイニングや機械学習の発達は、レポートの印象を人間ではなくコンピューターが判断しても市場の傾向と一致するレベルにまで達しているのです。

おわりに

以上で、第5回勉強会は終了です。
もちろん、ここで紹介した情報技術や研究はほんの一部でしかありませんが、読んだ方が金融分析×情報技術に興味をもっていただけたら嬉しいです。

※本noteは株式会社インベストメントブリッジとしての意見・見解ではなく、あくまでも一個人の意見・見解となります。

参考資料

水門善之, 勇大地(2017) . 日銀総裁会見の表情解析に基づく感情値の計測と金融政策変更との関係 

平松賢士,酒井浩之,坂地泰紀(2018). 深層学習を用いて極性付与されたアナリストレポートと株式リターンとの関連性

この記事が参加している募集

SNSでのシェアやブリッジサロンの活用をぜひお願い致します♪