クラロワデータ分析_No.1
1. 自己紹介
初めまして!データ分析について勉強中の takeshi です。2020年12月にクラッシュ・ロワイヤルをプレイし始め、無課金のまま1年半ほどで、マルチの仕様が変わるまでの最多トロフィー 7190 に到達しました。
プレイをしていく中で、どのカードが強いのか、また、クラロワが強い人はどういう人のことを言うのか等気になることがたくさん出てきました。プロ、元プロの人のお話や、クラロワのデータアナリストの方のお話を聞いて納得をすることができましたが、数学的にそれが正しいといえるのか疑問に思っていました。
そこで数年前から統計学、プログラミングなどの勉強を始め、最近基礎知識も身についてきたため、本格的に分析作業を始めてみるこにとしました。
もともとメジャーリーグやプロ野球のデータ分析にも興味を持っていて、勉強を少ししていたので計画的に進めることができました。
いつかクラロワだけでなく野球の分析についても行い、公開していきたいと考えています。(できるかわかりませんが)
2. 結果
今回はカードデータの情報をCSVファイルに出力する作業を行いました。最終的には全109枚のカードデータに対して131列の情報を記録することができました。
これが実際のデータの一部です。
欠損値が多い理由については「4. 作業内容」で記述していますが、簡単に言うと、該当するカード特有の能力を表す列となっており、ほとんど入力できない状態となっているためです。
また、作成した各列の説明をCSVに記録しました。こちらが実際のファイルの中身の一部です。
それでは、実際にどのような作業を行い、どのようなデータを収集したのか、また、今後どのように活用していくのかについて説明していきます。
3. 経緯
分析を始めるにあたり、APIで試合データを確認することはできましたが、カードそのものの情報が記録されているデータが見つかりませんでした。これでは分析できる範囲も限られてしまいます。クラロワのアプリから直接情報を抜き出すことも考えましたが、その技術が私にはない点、直接引き出すことのできないデータが多く存在する点等、課題点が多く考えられたため今回は手作業で愚直に収集することとしました。また、ゲームから直接情報を抽出することが許される行為なのか否か確認できなかったことも理由の一つに挙げられます。
収集したデータは分析したい人が自由に利用することができることを目的としているため、レアリティごとにデータを収集して分割したり、ゲーム内に記載されていない箇所を補完したりなどしないようにしています。
つまり、ゲーム内で確認できる情報と私が追加した情報以外はほとんど手を加えていないということです。そのため、もしこのデータを利用して分析したい人は必ず前処理をするようにお願いします。(単純に計算して補完できる箇所がありますので、、、)
分析の練習材料に使っていただくのもよいかと思います。
仕事終わりの時間の合間を縫ってデータの収集をしていたため、1か月弱も時間がかかってしまいました。そのため、入力ミスをしている可能性もありますが、興味のある方はぜひご覧ください。
4. 作業内容と課題点
クラロワのゲーム画面で確認できるカードの性能(hp、移動速度、攻撃速度 etc)をMySQLと呼ばれるデータベースを用いて直接入力していきました。
作業を進めるうちに、問題点が続々と出てきて気の遠くなるような作業となりました。具体的な問題点の一部が下記の通りとなっております。
徐々に列が増えていき、入力したい列がどこにあるのかわからなくなっていった
入力するデータ数が多く、1/2のデータを埋めるのに10時間以上かかってしまった
手入力で作業したため入力ミスが散見された(確認できた箇所は修正済み)
それぞれのカードに固有の能力があるために、埋められているデータ数が極端に少ない列が多く存在している(レアリティごとにデータを分類し、不要な列を削除して分析に使用すると問題はあまりないように思えるが、今後確認する予定)
ノックバックの距離や近距離攻撃の正確な距離、初撃速度など、クラロワのゲーム画面を見てもわからない情報を記録することができなかった。
挙げるときりがないですが、簡単にまとめると非常に大変な作業でした。あまりに大変すぎて体の節々が痛くなりました💦
さすがにすべてのデータを正しいか確認するのは1人では相当な時間がかかるのでできていません。もし、おかしな点、疑問点があればtwitterで質問していただければと思います。
3. 成果物
上記の作業を終えて、ようやく完成したデータは下に添付しました。「自分は分析なんかしない」、「見てもよくわからない」という人も見てくださるととてもうれしいです!
※ページの最後にも同じものを載せています
分析に活用してみたいという人もぜひ確認して利用してください!もしおかしな点や疑問点があれば教えていただければ幸いです。
作成したデータ
データの説明
4. 今後の展望
ようやく必要なデータの収集は終わったため、今後は下記の作業を行っていきたいと考えています(確定ではありません)。
基礎集計(棒グラフ、ヒストグラムなどを用いたデータの可視化)
カードの強さを表す指標の作成
プレイヤースキル(PS)を数値化する指標の作成
バランス調整によって流行るデッキの予測
カードを8種類に分類(クラスタリング)し、それぞれ1枚ずつピックアップしてデッキを作成し、実際に使用
絶対にできると断定はできませんが頑張りたいと思います。もし他にもやってほしいことがあれば、教えていただけると助かります。
5. まとめ
いかがでしたか?今回はデータ収集のみだったのでデータ分析に興味関心がない方にはあまり見ごたえはなかったかと思います。ただ、今後は実際にグラフの作成や分析を行っていく予定なので、分析に関心がない方でも見たくなるものを調べていきたいと思います。
非常に大変な作業で、時間がかかりましたが、何とかデータ収集を終えることができました。データは下に添付してあります。
twitterのフォロワーもほとんどいないので見ている人はいないかもしれませんが、それでも分析は好きなので馬鹿にされても続けます。
もちろんフォローしてくださるのが一番うれしいのですが、、、
フォロワーが増えるとやりたいこともあるので、、、
こちらからtwitterのリンクに飛びます。
今後も応援よろしくお願いします!
作成したデータ
データの説明
この記事が気に入ったらサポートをしてみませんか?