見出し画像

2025年の生成AIとの付き合い方

最近、 Devin と戯れています。

Devin は「AI チームメート」と称するバーチャルエンジニアです。 Slack に常駐して、 GitHub のリポジトリ上にあるソフトウェアの開発をリモートエンジニアのように手伝ってくれます。

このサービス、トライアルもなく最初から $500/月 というコミットを求めてくるので、試し始めるハードルは高いですが、だいぶ実用に耐え、業務で使うのであればほぼ一瞬で元を取ることができると感じています。(脱線しますが、マーケティング的にも、キャパシティプランニング的にも、プライシング戦略的にも、大変よく考えられていると感じます)

まだ利用開始から 1 ヶ月も立っていませんが、現時点では、我々の Slack に上がってきた Sentry からのエラー通知に対して "これ、調べて" とスレッドでメンションするだけで、 Sentry API 経由でエラーの詳細を取得し、 Git リポジトリ内の適切なリリースブランチのコードと行単位での対応を取り、エラーの原因を特定して、適切な報告とともにGitHubのプルリクエストを作る、というところまでを自動的に行えています。

実践例

もちろん、提案内容に 100% 問題がないとは言えず、ポンコツだなと思うこともなくはないですが、これまでバックログに積んだまま優先度が上がらず対応できないまま風化してしまっていたチケットを完全になくせる未来が見えてきています。

昨今、生成AIをベースとしたサービスがあちこちで立ち上がり、盛り上がりを見せています。直近はDeepSeekが(良くも悪くも)これまでより圧倒的低いコストで勝るとも劣らない性能を叩き出した、というニュースだけでテック企業の株価が軒並み下がるなど、世間の注目度の高さを感じます。

私個人としては、以前からWhisperを文字起こしに活用するなど、実用的な形での利用を試していました。そこから時間が経ち、昨年末ぐらいからは徐々にこれらを応用した「サービス」が今後どのように我々の生活を変えることに繋がるのかを、自分自身の肌感覚で把握しようと試みています。

現時点で、生成AIに向いているタスクはマイナスをゼロにするタスクだと感じています。モデルが持っている情報は本質的には過去の歴史です。歴史には、たくさんの試行と結果が含まれており、その膨大な過去の「傾向」から妥当と考えられる未来を提案を受けることができます。その特性を活かして、普段からChatGPTを初めとしたLLMにさまざまな相談をしている方も多いと思います。

さて、生成AIから明るい未来の提案を受けたとして、その最終的な成果を判断するのは人間です。皆さんは現代のLLMが提案してきた内容について、そのまま受け入れられると感じるのはどのぐらいの割合でしょうか。自分自身がその分野に十分な見識を持っている領域に関して、適切な提案となっているかどうかを見ると、まだ鵜呑みにはできないという感触ではないかと思います。アプリ開発に特化したというAIが、「このボタンの色を変えると、ユーザーのエンゲージメントが高まる可能性が高いです」と提案があったとして、それを受け入れられるか。自身が十分な知識を持たない状況でその提案を受け入れるかどうか判断するのは、ともすると博打と変わらない感じがします。

一方で、現時点で明確にマイナスとなっている問題に対して、その問題をなくすという提案の場合はどうでしょう。目の前にアプリがクラッシュするエラーが出てきたとき、「ログから確認したところ、このクラッシュの原因はここで、これは特定のケースの考慮漏れであり、この問題を直すための修正が明確に存在する、その修正は他の場所に影響がでない、テストも行って確認した」マイナスの問題の多くは明確に具体性があります。マイナスな部分を減らすのに必要となる判断は、概ね既存タスクとの優先順位と掛かるコストですが、解決済みの成果物が目の前に用意されている状況であればその判断をする必要もありません。

このようにマイナスをゼロにする、ストレングスファインダーでいうところの回復志向なタスクは、現状生成AIに「任せる」のに適切なタスクであるように感じています。こういった部分から積極的に自動的に解消できる状況を作っていくことは、あらゆる組織において有効に働くのではないかと思います。

昨年、GitHubがGitHub UniverseにおいてCopilot Autofixというセキュリティ機能を発表しました。

"Found means fixed" というスローガンで、自動的な「発見」だけではその後の修正まで完了されないことが多かったセキュリティ脆弱性対応を、自動で「修正」までを行うことで、世界中のプロダクトの堅牢性のベースラインを上げていくという旨の発表を行っていました。これも同様に、マイナスをゼロにしていくというアクティビティを自動化していく動きです。

今後、Copilotが同様にプロダクトのバグ修正まで踏み込んでいく未来も見えますが、今日時点ではそれを一足早くDevinで自動化してみるのも面白いかと思います。

今年は使えるもの色々つかって効率化していくぞ!というお話でした。今月はそんな感じで!

いいなと思ったら応援しよう!