![見出し画像](https://assets.st-note.com/production/uploads/images/122557541/rectangle_large_type_2_032c0f11b9dddaf88e87df58eb359243.png?width=1200)
データサイエンスニュース(23/11/24) : "ChatGPTの経営変動、スマートフォンAI操作革新、神戸市のオープンデータ、Claude 2.1のChatGPT代替可能性”
ちょっと仕事やらで忙しくて、火曜日ぶりになってしまったのですが、その間にChatGPTのCEO解任問題が大きく動いたりと、色々ありましたね。
ただ、そのニュースを追い続けてそんなに発展もなさそうなので、今日はそれ以外のニュースを見てみました。
GPT-4Vに画像とテキストを提示して行動計画を行い、生成した出力にマークタグを設置する。これらのマークはセグメンテーションやOCRモデルを利用して空間的な位置と関連付ける。この方法により、MM-Navigatorは、画面の画像、テキスト指示、その相互作用の履歴に基づいた実行可能な行動を生成できる。
ということで、現在の「Ok Google」「Hey Siri」だと、あくまで検索結果を出力したり、アプリを起動したりするだけだったものが、より「この場所をクリックする」「このアイコンをクリックして、○○を探す」といったようなこともできるようになるようですね。
ここだけ聞くと、そこまで大きく変わらないように見えますが、より柔軟な操作や対話型でできるようになるのでしょうか。
生成AIが、スマホのUI/UXにどう影響するのか気になりますね。
これは面白い
神戸市は10月26日、2020年の国勢調査に基づいて作成した人口移動や就業状況に関するダッシュボード(複数の情報をまとめて表示するツール)を同市のウェブサイトにて公開した。
ということで、神戸市に限らず全国のデータが見えるようですね。
Tableauでつくっているようで、オープンデータの見える化というのはいいですね。
もちろん、「じゃあ、これを使って何するの?」という議論が、次には出てくると思いますが、ぜひ色々な方法を検討してほしいですね。
ChatGPTの代わり?
前の記事で、ChatGPTの代わりにClaudeもと言いました。まあ、ChatGPTも普通に続きそうなのと忙しさで、ひとまず代わりを試す余裕を持ててなかったのですが、最新のClaude 2.1を試している記事があったので、参照してみました。
Claude 2.1とChatGPTの比較(2023年11月時点)
で見る限りは、トークン数やハルシネーションの抑制などの基本的なところは、Claude 2.1が優れているようですね。
API連携もできるようになっているということで、アプリケーション構築にも使えそうです。
画像などのマルチモーダル対応や、拡張機能といった部分はまだまだのようですが、ベースがちゃんとしていれば、比較的簡単に対応できるのではないでしょうか。
さながら、Play StationとSega Saturnの闘い(古い 笑)のように、覇権争いが出てくるのかもしれないですね。