見出し画像

Netflixオリジナルシリーズは何ヶ国語で展開すれば良いか?データ分析を用いて答えを出そう

Netflixもまた、ありとあらゆる意思決定にデータ分析を用いるデータドリブン企業であると言えます。ドラマの撮影スケジュール作成や、Netflixオリジナルシリーズを何ヶ国語で展開すれば良いか?という問題に対して、データ分析はどのように用いられているのでしょうか?

It’s a wrap for the day, or is it?
ドラマの撮影は数百ものシーンから構成されており、ロケ地も数十箇所、ロケ期間も数ヶ月にわたります。Assistant Directorはスケジュール作成に頭を悩ませ、数百時間も費やすことも。"Hey AD, 俳優Xはこの1週間しか空いていないよ!"...データ分析を用いてADを助けられるでしょうか?

この問題は、次の最適化問題に帰着することができます。撮影はNシーン、D日に渡ってL箇所で行われると仮定し、それぞれのシーンにかかる撮影期間も与えられているとします。

目的
・トータルの費用の最小化

変更可能な変数
・各シーンの撮影を始める日付/時間
・各ロケ地の契約を開始する日付/時間

制約条件
・1つの時間帯に1つのシーンしか撮影できない
・とあるシーンに必要なロケ地、キャスト
・撮影はx時間を超えてはいけない、またキャストとスタッフは撮影の間に最低y時間は休む必要がある
・ロケ地移動にかかる時間
・daytimeシーンはsunsetの前に撮影しないといけない

最適化問題は数分で計算完了!撮影を始める前に予算がわかる上、突然のスケジュール変更にもアルゴリズムが対応してくれます。

Ich liebe Netflix!
Netflixの会員は190ヶ国、コンテンツの提供言語は20ヶ国語にも渡り、コンテンツのローカリゼーションはユーザー獲得のために必要不可欠であると言えます。

例えば、ドイツで作成されたドラマ"DARK"のローカリゼーションを考えましょう。20ヶ国語に翻訳して提供したいところですが、時間、声優の確保といった制約から全ての言語での提供は非現実的です。言語Aでの視聴数が言語Bより多いとわかれば、言語Aに特化して翻訳するのが良いと言えます。データ分析を用いて、"何ヶ国語に翻訳するのが良いか"という問題を解くことができるでしょうか?

答えは、"DARKに似ているコンテンツの各言語ごとの視聴者数のデータを参考にして、言語ごとの視聴者数を予測する"というものです。
DARKに似ている2016年のComedyのde, es, frでの視聴者数は各xx人、2017年のSci-Fi Thrillerのfr, en, czでの視聴者数は各yy人... ローカリゼーションがサブタイトルで提供されたのか、吹き替え版まで作成したのかという情報も特徴量に含めるとbetterです。

何ヵ国語で提供するかといった問題も、データ分析で解くことができるのは面白いですね!

内容は以下のブログ記事を日本語に翻訳し、まとめ直したものとなっております。
Data Science and the Art of Producing Entertainment at Netflix

いいなと思ったら応援しよう!