【自然言語処理でニュース記事を分析!】サッカー日本代表、サウジ・オーストラリア戦への試合前の注目ポイントはどう報じられたか?
こんばんは!
今回は、サッカーW杯出場を目指すアジア最終予選、注目の2試合に向けた注目ポイントを様々なニュース記事から分析します。ここではデータ分析技術の1つである、自然言語処理を用いて8記事1.5万字分を分析しました。
記事については、Googleニュース検索を用いて探索し、
・単純な試合時間やメンバー等の報道記事
・特定の選手1人に注目した記事
・選手たちのクラブでの成績のみの報道記事
ではなく、ある程度分量があり、チーム編成や戦術について総合的にまとめている記事を取り上げました。(下にまとめてあります。)
それでは分析結果を見ていきます!
1.形容詞からニュース全体の傾向を見る
まず、全ニュースで頻出の形容詞を可視化しました。全体的に「難しい」や「厳しい」「苦しい」といった単語が並びました。9月の2試合の内容があまり芳しくなかったことや、最終予選最大のライバルたちとの戦いであること、また、中東の「暑い」気候の厳しさが反映されているといえます。
次に頻出の名詞・代名詞から具体的な試合のポイントを、各記事を交えつつ見ていきます。名詞については、以下の共起ネットワーク(どの単語と単語が一緒に使われているかを示したもの)を注目部分にズームインしながら見てみましょう。
2.オフェンス陣の入れ替わりー久保・伊藤・(堂安)の離脱ー
全体として、オフェンスの選手たちの名前の多さが目に付きますが、これまで主力として起用されてきた久保選手・伊東純也選手・堂安選手などが出場停止や離脱した中で、一方好調なオナイウ阿道選手も含め、前線の選手構成をどうするか、という点を報じた記事が目立ちました。
3.収容人数6万人の完全アウェイ・暑さ
「収容」「人数」といったサッカーとは関係なさそうな単語が出ていますが、特に、サウジアラビア戦の難しさとして、大応援団と高い気温が予想されるアウェイスタジアムでの戦いであるという点が挙げられています。森保監督も「暑さの中でパフォーマンスの連係・連動という意味では難しいところが出てくる」とコメントしています。
4.サウジアラビア・オーストラリアの戦術ーポゼッションー
以上は頻出単語ベースで注目ポイントを分析してきましたが、戦術面はどうでしょうか。どうしても試合前のネット記事だと、書きやすくて需要も多い、選手個々人を主語にした記事が多く、逆に綿密な取材が必要で需要の少ない、戦術的な記事は多くないため、データ分析もその傾向を反映しています。
以下の2つの戦術面に関する記事では、共通して「ポゼッション」をしてくる相手に対して、日本代表の「堅守速攻」のスタイルを出せれば、組み合わせは悪くないと分析しています。
最後に本記事で分析・引用した記事を載せておきます。
このような戦術やチームの分析も、サッカーの醍醐味の1つですよね。このnoteを通じてそうした部分に興味を持ってもらえると嬉しいです!
こちらの記事に興味を持ってくださった方は、いいねやツイート等、よろしくお願いします!また記事に対してのご意見や、要望等がありましたら、DM等もお待ちしております!
5.参考記事