Perplexity APIの新モデル、Sonarを試す
[読了目安: 3分]
NO AI(人間が書きました✍️)
AI系ポッドキャスト(耳で学ぶAI)運営の矢野哲平(@robothink_jp)です。この記事ではPerplexity APIが新しくリリースしたモデル、SonarとSonar Proを試した感想について解説します。
ちなみにPerplexity APIは2024年8月にもnoteで取り上げました。
記事にも書いているのですが、ふだんPerplexityのチャット画面で利用するよりも精度が落ちた回答が生成されていました。
この時に「PerplexityをAPIから操作するのはやめとこう…」と諦めていたんですね。
今回、モデルのアップデートでどれくらい性能が上がったかを検証していきます。
新しいモデルはSonarとSonar Pro
新しく発表されたモデルは2つです。SonarとSonar Pro。
公式の説明を引用しますね。
がっつり調査したい場合はSonar Pro、より軽量な動作を期待したい時はSonarといった感じでしょうか。
ちなみにAPIで入力された情報は学習に利用されません。
なお以前のモデル(llama-3.1-sonar)は2025年2月22日以降利用できなくなるとのこと。
SonarとSonar ProのAPI料金
Sonar:
入力トークン: 1ドル(100万トークンあたり)
出力トークン: 1ドル(100万トークンあたり)
1,000回の検索あたり: 5ドル
Sonar Pro:
入力トークン: 3ドル(100万トークンあたり)
出力トークン: 15ドル(100万トークンあたり)
1,000回の検索あたり: 5ドル
検索あたりの金額は同じですがトークンの金額はかなり違ってきます。
この辺は精度とコストを比べながら選定していく方が良さそうです。
肝心の回答精度は?
Perplexityが用意しているPlayground環境で試してみました。
試しに最近気になっているAIサービスについて質問してみます。
新しいサービスなのでインターネット上でもそんなに言及されていないと思います。
Sonar、Sonar Pro、Perplexityのチャット画面で比較します。
# Sonar
AIノートパッドアプリ「Granola」の創業者は、**Chris Pedregal**と**Sam Stephenson**です。
彼らは2023年3月にGranolaを設立しました[3][4]。
Chris Pedregalはスタンフォード大学でコンピューターサイエンスを学び、Googleでプロダクトマネージャーとして働きました。
また、彼はAIを活用した学習アプリ「Socratic」の創業者でもあります[4]。
Sam Stephensonは、ノートアプリ「Ideaflow」で働いていた経験があります[3]。
# Sonar Pro
Granolaの共同創業者はChris PedregalとSam Stephensonです[3][6]。
Chris PedregalとSam Stephensonは2023年3月にGranolaを設立しました[6]。
2人とも以前から生産性ツールに興味を持っていました[7]。
Chris Pedregalは以前、AI tutoring appのSocraticを創業し、Googleに売却した経験を持っています[4]。
Sam Stephensonは以前、ノートアプリのIdeaflowで働いていました[4]。
2人はロンドンを拠点としており、ミーティングツールに関するミートアップグループを通じて出会い、意気投合して共同創業に至りました[4]。
# Perplexityのチャット画面
AIノートパッドアプリGranolaの共同創業者の一人はSam Stephenson氏です[1]。
Stephenson氏は、投資家との会話や資金調達プロセスについてコメントしており、Granolaの代表的な人物の一人であることがわかります。
ただし、他の共同創業者に関する情報は提供された検索結果には含まれていないため、Sam Stephenson氏以外の創業者については言及できません。
私が注目したのはAPI経由とチャット画面の解答結果の違いです。APIの方が良い回答を生成していると思いませんか?
「質問を何度も試したわけではない」
「海外のAIツールに関する質問」
という条件下ですがチャット画面より良い結果を得られたのは個人的には驚きでした。
以前のAPIではこうしたことはあまり起きなかったからです。
これは…念願の検索AIを使った処理を実装できそうな予感😇
余談: Perplexity × DeepSeek R1
Perplexityのプレイグラウンドを見て気付いたのですがDeepSeek R1も表示されていますね。
DeepSeekについて補足すると中国のAI企業が開発したオープンソースのモデルです。
最近はR1という推論モデルを出してOpenAIのo1に匹敵する!と話題になっていますよね。
試しにR1も使ってみましたが、回答までに25秒かかったので動作していないのかと勘違いしてしまいました。
先ほどと同じ質問をしましたが、肝心の回答結果に関しては回答できず。
「2024年7月時点の情報では…」と英語で回答されましたが知識のカットオフ…?🤔
最新情報の検索はできないのかもしれません。この辺は引き続き検証していきます。
【note読者限定】生成AIのおすすめツールは?
生成AIは何を使えばいいか分からない
もっと業務効率化に貢献するツールを知りたい
ChatGPT以外のAIツールを知りたい
こういった声に応えておすすめの生成AIツールを解説する資料を制作しました。よりAIの情報をキャッチアップしたい人はチェックしてみてください。
noteでも月に20本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼