データサイエンティスト目線の エアークローゼットの会社紹介
1. はじめに
はじめまして。株式会社 エアークローゼットのデータサイエンスチームに所属しているTigerです。弊社では、ニックネーム制が導入されており、Tigerはそのニックネームです。今回は、airCloset Advent Calendar 2021 の10日目への寄稿で、本記事を書いています。
弊社データサイエンスチームは、所謂開発チームのような位置付でなく、社長室に所属しています。このためか、弊社プロダクトグループと異なり、データサイエンスチームの発信機会は現状多くなく、なかなかこのような機会がありません。このため、まずは業務について紹介してみたいと思います。次に、弊社のデータや業務において課題に感じていることを紹介します。最後に、これらをまとめ、弊社の技術やサービスに興味を持っていただければ嬉しいです。
2. 業務の紹介
まず、エアークローゼットのサービスについて、詳細を図1 に示します。これらのサービスにより得られたデータの活用がデータサイエンスチームの業務です。この業務により、スタイリングの効率化や高度化を目指します。
次に、普段の業務の具体例について説明します。私は、下記のようなアプリケーションを実装するための技術の検討、実験および社会実装までを行ないました。
特にこれは、エアークローゼットにおけるデータサイエンス技術を活用したPR施策であり、上司と企画等を一から考えた、思い入れのある施策です。また、エアークローゼットでは大学との共同研究も行なっており、このPJTのPL業務も担当も担当しております。
さらに、弊社では、このページに紹介するような、様々な課題に取り組んでおります。本ページにおける一例としては、スタイリングサポートAIがあります。こちらの具体的な活動としては、お客様へのパーソナライズされたお洋服の推薦システムの研究開発等があります。
上述したとおり、これらのPJTを行うにあたって、お洋服やお客さまのデータを用います。特に、弊社では、パーソナライゼーションされたサービスの提供を行なっていることから、複雑かつ多様性のあるデータが存在します。そこで、次章に、弊社のデータについて紹介したいと思います。
3. エアークローゼットが保有するデータの紹介
エアークローゼットでは、お洋服およびパーソナルスタイリングに係るデータを数多く保有しています。これらデータには、色のようなローデータだけでなく、テキストおよび画像等のメディアデータも存在します。人の感性のような高次な情報を表現するためには、これらマルチメディアデータの活用が必要不可欠です。
さらにこれらデータは、様々な意味情報を表しています。図2. に、エアークローゼットで保有しているデータの一例として、貸し出したお洋服の返却フォームを示します。
図2. より、お洋服の画像、それに対する着こなし方法を示した文章、レーティングや感想等の様々な意味を持つデータがあることがわかります。さらにこのお洋服は、プロのスタイリストによるお客様に対するコーディネートでもあるため、選ばれたお洋服自体を、コーディネートに関するデータとみなすことも可能です。これだけでなく、弊社では、物流や他事業におけるデータも有しており、その多様性は多岐に渡ります。
業務上では、これらデータの活用により、2. 章で述べたようなPJTを遂行する必要があります。しかしながら、そのサービスおよびデータの複雑性や多様性から、課題点が様々存在するように感じます。次章では、このことについてお話したいと思います。
4. データ活用における課題
まず、エアークローゼットは、一般の E-Commerce のように簡単なサービスでなく、スタイリストによるお洋服のコーディネートや貸し出しの関わる複雑なサービスであることから、データの活用の難易度が高くなっているように思います。例えば、E-Commerce サイトにおける推薦システムを考えると、お客様と実際に購入した商品のペアを教師データとして推薦することが考えられます。しかしながら、弊社では、スタイリストが選ぶお洋服を3着以上同時にお客様にレンタルいただくため、サイズ情報等の誤差が存在したり、好みが分かりづらい場合には、必ずしもお客様にご満足いただくスタイリングができない場合もあります。このことから、これら満足度合いを考慮した推薦手法が求められます。このように、サービスの複雑性に応じて、データ整形やモデル自体が複雑になったり、適切なモデル選択が難しくなっているように思います。
また、エアークローゼットでは、感性に関する問題を取り扱うため、これらを定量化ないしはモデル化する必要があります。しかしながら、これらの完全な実現は、個人や状況によるため非常に困難です。
簡単な例では、レーティングが挙げられます。具体的には現在、エアークローゼットでは、スタイリングされたお洋服に対するレーティングを4段階で取得しています。しかし、異なるお客様同士の同一レーティングのご感想を見てみると、その内容が大きく異なる場合が存在します。このことからわかるように、同一レーティングの履歴データにおいても、お客様やアイテム等によって、大きく意味が変わってしまいます。このような個人間の感性の差異が、意味のあるデータの取得に向けた大きな課題となっています。
もう一例を挙げると、お客様に対して、好みや似合うコーディネートを特定するために、スタイリスト間で確立されている「決まりごと」があります。この「決まりごと」をうまく用いると、お洋服とお客様をマッチングさせることができると考えられています。しかしながら、このような「決まりごと」は、内容が具体的でない場合が多く、詳細が言語化されていません。したがって、これらのシステム化や属人的なスキルの汎用化が、大きな課題となっています。
以上のことから、感性を考慮したデータの取得や、モデル化が困難なことがわかります。これらのことが、サービスにおけるデータ活用の現状の大きな課題点であり、これら課題の解消に向けて、研究開発を続けています。
5. おわりに
最後までご覧いただきありがとうございました!ここまで、エアークローゼットにおけるデータサイエンスの具体的な業務、データの紹介および業務における課題についてお話しました。このような記事をここまで見ていただいたということは、求職者や我々の事業に興味がある方だと思われるので、こちらのページもぜひご覧ください。
今はまだ、具体的な業務内容の発信はしていないですが、今後は具体的な発信も増やしていきたいと思っていますので、よろしくお願いします!!明日以降も毎日、エアークローゼットのメンバからの Advent Calendar への投稿がありますので、そちらもご確認をよろしくお願いいたします!!!
※この記事は、airCloset Advent Calendar 2021 の10日目への寄稿です。