2022年12月にネット検索の結果を利用して質問に回答する新しい検索エンジンのPerplexity Askが公開されました。
Perplexity Askは、検索結果を利用することによって、最新の話題にも回答することができ、また、回答の根拠となるウェブサイトの情報も同時に示されるため、ある程度の信頼性が担保されます。
今回、このPerplexity Askの性能をChatGPTと比較してみました。
1.Perplexity Askの概要
Perplexity Askは、Perplexity AIが開発した世界初の会話型検索エンジンで、ユーザーが入力した質問に対して、GPT-3などの大規模言語モデルのAPIを使用してウェブサイトの検索を行い、その検索結果から得た情報を要約して回答を返します。
2022年12月8日に最初に公開され、2023年1月20日にメジャーアップデートが行われて、性能がレベルアップし、フォローアップの質問もできるようになりました。
2022年11月にOpenAIが公開したChatGPTには、2021年までのデータに基づく回答しかできない、一見正しいように見える誤った回答を返すこと(ハルシネーション)があるといった欠点がありますが、Perplexity Askは、これらの欠点をある程度、克服しています。
Perplexity Askは、ネットで検索したウェブサイトの情報を利用して回答を作成するため、最新の話題についても回答できます。
また、回答の作成に使用したウェブサイトの情報を同時に示してくれるため、回答の根拠になった情報を確認できます。
Perplexity Askは日本語の質問にも対応していますが、回答が英語になることがあるので、その場合は、ブラウザの自動翻訳機能などを利用してください。
また、Perplexity AIには、Bird SQLというTwitter検索機能もあり、Perplexity Askのページから切り替えて使用することができます。
2.Perplexity Askの利用方法
Perplexity Askの基本的な使い方は、Google検索とほぼ同じで、検索窓に質問を入力してエンターキーを押せば、回答が表示されます。
日本語で質問する場合は、漢字変換の確定のためにエンターキーを押すと、検索が始まってしまうため、質問が長くなる場合は、メモ帳アプリなどに質問を書いてから検索窓にコピーした方がよいでしょう。
回答画面は、以下のようになります。
回答が正しい場合は「Accurate」、正しくない場合は「inaccurate」をクリックして報告することができます。
「View detailed」をクリックすると、更に詳しい回答を表示してくれます。
「SOURCES」の下に回答作成に使われたウェブサイト名が表示され、をクリックするとそのサイトに飛ぶことができます。また、「Vew List」をクリックすると、それぞれのサイトの参考にした部分の記述などが表示されます。
「RELATED」の下には、関連する検索ワードが示され、これをクリックすると、その検索ワードに対する回答が表示されます。
また、「Ask a follow up」と書かれた検索窓に、最初の回答を踏まえた追加質問を入力して回答を求めることができます。
3.日本語質問と英語質問の回答の比較
Perplexity Askは、日本語の質問にも対応していますので、日本語質問と英語質問の回答を比較してみました。なお、日本語質問でも、英語で回答が返ってくることがあります。
ChatGPTは、英語質問の方が日本語質問より回答の精度が上がる場合が多かったのですが、Perplexity Askの場合は、検索結果に大きく左右されます。
Perplexity Askは、日本語質問の場合は日本語のサイトを検索し、英語質問の場合は英語のサイトを検索するので、日本語の情報の多い日本に関係するテーマについて質問するときは日本語質問の方が精度が高く、海外の情報について質問するときは、英語質問の方が精度が高くなる場合が多いです。
4.ChatGPTとの比較
Perplexity Ask(PA)とChatGPT(CG)に同じ質問をして回答を比較しました。なお、Perplexity Askには日本語で質問していますが、ChatGPTは日本語質問に対する回答の精度が低い(日本語質問では比較対象にならない)ため、英語で質問して回答を日本語訳しています。
(1) 最近の情報についての質問
CGは、2021までの情報で回答できない質問への回答は拒否してきます。PAは、ネット検索によって最近の情報を踏まえた回答を返すことができますが、どのサイトの情報が最新の情報か判断できない場合は、古い情報を返してくることがあります。
(2) 歴史的な質問
PAの回答はコンパクトな場合が多いですが、CGは、詳しく説明してほしいと頼むと、非常に長い回答を返してくることがあります。
PAの強みは、回答に必要な情報が学習データに含まれていないときに、一見正しく見える適当な作り話を返すことなく、ネットで検索して必要な情報を集めることですが、今回のように正確な情報を集めても、要約に失敗して誤った回答を返すこともあります。
ただ、一般的には、根拠となる情報を検索して探すことによって、適当な作り話をすることが減り、怪しい情報があっても、参考にしたウェブサイトをたどることによって、内容を確認することができます。
また、日本語のウェブサイトも検索できるので、CGよりも日本語の情報に強いということができます。
(3) 科学的な質問
どちらの回答も同じような結果でした。基本的な知識を説明することはできても、その知識を理解してそれを応用することは、AIにはまだ難しいようです。
(4) 算数の質問
PAは、基本的に検索結果に頼って回答を作成するため、情報を検索するだけで回答が得られない今回のような問題は苦手なようです。一方、CGの方は、きちんと段階的に推論することができており、今回の算数の問題は、いずれも完璧に解くことができていました。
(5) 難しい質問
こういう複雑で答が一つに絞れないような質問の場合は、PAの回答は様々なウェブサイトの情報を集めているので、統一感のない寄せ集めの回答になることが多いです。一方で、CGの方は、回答全体に一貫性があって、非常に理性的な回答を返しているように見えます。
(6) 架空の出来事についての質問
架空の出来事について質問した場合に、どう答えるのかについて試してみました。
オスタニアもウェスタリスも、アニメで有名な存在しない架空の国です。以前、GPT-3に対して、この質問をしたときは、一見事実であるかのようなそれらしい回答を返してきましたが、CGは、できるだけそういう回答を避けるようにトレーニングされているようです。
5.まとめ
以前、GPT-3のtext-davinci-003モデルに同じような質問をしてみましたが、現在のChatGPTは、それと比べてもかなりレベルが上がっているようです。人間フィードバックによる強化学習(RLHF)の効果でしょうか。
一見もっともらしい作り話(ハルシネーション)を返してくることが減り、段階的な推論の能力も上がっているようです。
Perplexity AskとChatGPTについては、それぞれ長所と短所があります。
ChatGPTの方が、よりまとまった一貫性のある文章を書くことができ、段階的な推論の能力も高いですが、最新の話題に対応できない、以前より減ったとは言え、一見もっともらしい作り話を返してくることがあるといった問題があります。
その点、Perplexity Askは、ネット検索で収集した情報を参考にしているので、複数のサイトから集めたバラバラの情報の寄せ集めのようなまとまりのない回答になることがあるという欠点はありますが、最新の話題にも対応することができます。また、実在するサイトの情報を参考にするため、ChatGPTのように作り話を返すことが少なく、参考にしたサイトに飛んで、簡単に内容をチェックできるというメリットがあります。
いずれにせよ、目的に応じて使い分けることが重要で、対話を楽しんだり、文章を作成したりするときはChatGPTを使用し、調べ物をするときは、Perplexity Askを使用するのがよいでしょう。
何かについて調べたいときに、Perplexity Askで表示される参考サイトとフォローアップ質問を使えば、かなり効率的に作業を進めることができます。