こんにちは、 バイタリフィアジアのNiheiです。
普段は、生成AIを活用したプロダクト開発のアドバイザーとしてプロジェクトのサポートを行ったり、PM / PMO をしたりしています。
解決したいこと
旅行先でふらふらと街を歩いていると、有名な雰囲気を醸している建造物や、歴史的に価値がありそうな何かがあったとします。
そのときに「これってなんだろう?」と思うことはないでしょうか?
実際にそう思うかはさておき、この記事では、ChatGPTの画像認識機能から、「有名な雰囲気を醸している建造物や、歴史的に価値がありそうな何か」をどの程度まで教えてくれるかを検証し、観光業界でのChatGPTの利用可能性を考えていきたいと思います。
検証したこと
このような簡易ツールを開発して、実際に使えるか検証を行いました。
Google Lensの観光特化版みたいな感じですね
画像をOpenAI社のGPT4oモデルに送信し、位置情報も参考情報として送り、もっともそれらしいランドマークの名前とありうる候補を5つ教えてもらう
そのランドマーク(観光地)の名前をGoogle検索を行い、そのランドマーク(観光地)の概要と、参考情報となる近辺の情報をもとにわかりやすく要約してもらう
この2段階の処理を簡易的なシステムを構築して、自動的に行いました。
このようなプロンプトで聞いてみました
responsed json と入力して欲しい形を伝えると、システムで扱いやすい形で出力をしてくれます
検証1 : ホイアンの日本橋
most_likely_landmark は、Japanese Covered Bridge (Chùa Cầu) つまり日本橋と出てきていますね。正解しました。
また上記の結果に対して、Google検索をAPI経由で行い、概要の説明と近くのおすすめの観光スポットをChatGPTを使って自動で教えてもらいました。
いい感じの要約ですね!近隣の施設についてもしっかりURLを表示できています。
検証2 : ダラットのダラット駅
most_likely_landmark は、ダラット駅と出てきていますね。正解しました。
また同様に自動でダラット駅についてまとめてもらいました。
検証3 : ダナンのミーケビーチ
ミーケビーチと出てきました。正解です。似たような海はどこにでもありそうなものですが、見事に正解してくれました。
検証4 : 弊社オフィスの入り口
The Factory Contemporary Arts Centre と出てきました。弊社は、Vitalify Asiaですので残念。不正解でした。
「違うよー。これは会社のオフィスだよ。画像の情報から文字を読み取って予測して」と諦めずに続けて聞いてみました。
Asia Life Offices と言われました。Aisaだけ正解ですね。。。
やはり有名な観光名所ではないと難しいようです。
ちなみに弊社オフィスは、ホーチミン3区の日本領事館の向かいにあります。
開発のご相談や、オフィス見学・情報共有のお打ち合わせなど、ご興味がありましたらご案内させていただきますので、こちら から お問い合わせ ください。
まとめ
ご覧いただいたように、観光地だと100%の正答率でした。
またしっかりとその付近の観光地情報のURLもくれましたね
この画像から観光地を予測する技術を応用して、初めての観光地でも楽しめるような旅行サポートアプリなんてものが作るかもしれませんね。
また、旅の計画を立てるツールでも使えると思いますし、最近流行りのストリートビューの画像から場所を予測するgeo guesserというゲームでも役にたつかもしれません。
また、自動でGoogle検索を行い情報をまとめる技術を応用して、訪問先の土地の情報を調べるツールや、問い合わせがあった企業の関連情報を自動で検索してまとめるツールなど、なんでも応用が効きそうですね
バイタリフィアジアは、モバイル・Webアプリ・VR・生成AI など、モダンな技術を使った開発を得意としています。
「既存のシステムにどのように組みわせることができるか?」など
ご興味を持っていただけましたら、ぜひこちらからお問い合わせください。