今さら聞きにくい「AI」ってなにができるの？

2024年9月24日 08:35

AIって何の略？

こんにちは、(株)オーテックの小川広佑です！
今回は、巷で常識のように使われ始めている「AI」の基本的な知識について紹介させて頂きます。
読者の方の中には、説明してと言われてしまうと、内心ドキッとしてしまう方もいるのではないでしょうか。
この記事を読めば、あなたもドヤ顔でAIのことについて説明できるようにななるはず！

AI(Artificial Intelligence=人工知能） とは、人間の知的な作業をコンピュータや機械に模倣させる技術や理論の総称です。AIは、学習、推論、問題解決、認識、理解などの能力を持ち、さまざまな分野で応用されています。
以下はその主要なものです。

機械学習（Machine Learning）：AIがデータを使って学習する手法で、経験から自動的にパターンを発見し、予測や意思決定を行います。主に大量のデータを扱うことに強みがあります。
深層学習（Deep Learning）：機械学習の一種で、脳の神経回路を模倣した「ニューラルネットワーク」を使って、画像認識や音声認識など、より複雑なタスクを実行します。
自然言語処理（NLP）：人間の言語を理解し、生成する技術で、翻訳、チャットボット、感情分析などに使われます。
コンピュータビジョン（Computer Vision）：画像や映像を理解する技術で、顔認識、医療画像の診断、自動運転車の障害物検出などに利用されます。

なんでAIがこんなに話題なの？

これまでAIは、「2001年宇宙の旅」や「ターミネーター」など昔から空想上の遠い未来の話としてSF映画の題材となってきたイメージを持っている方が多いと思います。最近、「ChatGPT」や「Copilot」といった生成AIがニュースで取り上げられるのを知って、触ってみた方もいると思います。
しかし、AIを利用したサービスは、約10年ほど前から世の中に発表されていました。それが「siri」や「alexa」といった音声アシスタントサービスです。これらは、主に音声認識や自然言語処理（NLP）技術を利用して、人間の音声入力に基づいて情報を提供するなどの特定のタスクに特化したNarrow AIに分類されており、基本的には「音楽をかけて」「○○を検索して」といった特定のタスクに限定されたものです。

それでは、なぜTVや新聞等のメディアで急に「生成AI」のことが取り上げられて、各企業が生成AIの導入を進めていたり、生成AIを利用したサービスの展開を進めているのでしょうか。それは、生成AIはこれまでのAI技術とは大きく異なる点があるからです。
生成AIが話題になったきっかけとして、OpenAI社が2022年11月に発表した「ChatGPT」の影響が大きいと思います。ChatGPTは、LLM(=大規模言語モデル)という技術によって支えられています。このLLMとは、大量のデータとディープラーニング（深層学習）技術によって構築された言語モデルのことを指します。従来の言語モデルと比べて、モデルサイズ・データサイズ・学習計算量がパラメーター数で1,000億以上と膨大なデータ量を機械学習することで、複雑な言語処理ができるようになったことが大きな進化となります。
「ChatGPT」に代表される生成AIも厳密にはNarrow AIに分類されるのですが、人間と会話すると同じように自然言語を理解し、文章生成、画像生成、音楽生成など様々なタスクを実行できるようになりました。

引用：DOORS DX Media by BrainPad - LLM(大規模言語モデル)とは？ https://www.brainpad.co.jp/doors/contents/01_about_llm/

AIがあれば、なんでもできちゃう？！

そんな生成AIの技術は、様々な分野で応用されてきています。youtubeを視聴される方だと想像しやすいですが、Vtuberや時事ネタを取り上げるyoutuberの方の中には生成AIを利用して動画内の画像を作成していたり、テロップ入れを自動化していたりします。
最近、私が個人的に驚いたニュースは、The Beatlesが27年ぶりに新曲として発表した「Now and Then」です。The Beatlesといえば、世界中の誰もが必ず1度は曲を聴いたことがある世界的な有名バンドですが、存命のメンバーはポールマッカートニー氏とリンゴスター氏の2名しかいません。では、なぜ27年ぶりに新曲が発表されたのでしょうか？
それは、生成AIを利用してレコーディングがされたためです。使われた技術としては、音源からあらゆる楽器の音や声を分離できる技術です。当時、ジョンレノンがカセットにレコーディングした際に、ピアノの音にジョンレノンの声がかき消されてしまっていたため、曲を編集することが出来ませんでした。生成AIによって、声だけを音源から上手く分離して再構成することで、曲として聴ける形に出来たということです。

このように、生成AIは様々な分野に応用されています。代表的な例としては、以下となります。

文章生成：ブログ記事やニュース記事といったコンテンツをライターの変わりに執筆したり、ユーザーの質問に対して自動で応答するような顧客対応のチャットボット、マーケティングやカスタマーサポートにおいて個人に合わせたメールの生成と配信等を行います。
コード生成：開発者が記述したコードの意図を理解し、適切なコードを自動生成しプログラミングを補助するツールや、コードのエラーをチェックしバグの修正やコードの改善提案を行うことも可能です。
画像・動画生成：テキストの指示に従って完全に新しい画像を生成したり、広告などのバナーやポスターの生成することが可能です。また、動画素材を解析し、適切なカットやエフェクトを自動的に追加したり、バーチャルアバターを生成することが可能です。
医療分野：医療データや画像を解析し病状の予測をしたり、診察内容や医療記録の自動生成し書類業務の軽減などの効果を発揮します。

生成AIでできることを挙げるとキリがなく、多くの分野で活用できる可能性があります。なので、もし「これできたら便利なのにな～」と思われたら一度生成AIを触ってみるのがおすすめです！

下記のような書籍も参考にしてみてください。

まずは、これを試してみてください！

「百聞は一見に如かず」で、まずは触れてみてどんなことができるか試してみてください。
以下が代表的な生成AIサービスとなります。

1. 文章生成AI

ChatGPT（OpenAI）: 大規模言語モデル（LLM）をベースに、自然な対話、文章生成、質問応答などに対応する生成AI。
Gemini（Google DeepMind）: Googleが開発する次世代AIで、マルチモーダル機能（テキスト、画像など）に強みを持つ。
Jasper: マーケティングやコピーライティングの文章生成に特化し、ビジネス向けに使用されるAIツール。
Copy.ai: キャッチコピーやブログ投稿など、クリエイティブな文章作成を自動化するAI。

https://chatgpt.com/

https://openai.com/dall-e

2. 画像生成AI

DALL·E（OpenAI）: テキストプロンプトから高品質な画像を生成するAIで、創造的なアートやデザインに活用されている。
MidJourney: テキスト入力に基づいて芸術的で創造的な画像を生成するAIツール。
Stable Diffusion: オープンソースの画像生成モデルで、リアルな画像やファンタジーなアートを生成可能。

https://www.midjourney.com/

3. 音楽生成AI

Amper Music: ユーザーが指定する音楽スタイルに基づき、AIが音楽を自動生成。映画やゲームのBGM制作にも使用される。
Aiva: 作曲に特化したAIで、クラシック音楽や映画音楽の生成に使われる。
Soundraw: ジャンルやムードに合わせて、カスタマイズ可能な音楽をAIが生成するツール。

https://www.ampermusic.com/

まとめ

これで「AI」の基本知識についてお分かり頂けたでしょうか。一度触っていただくとわかりますが、生成AIによって目の前の人にお願いするかのように自然な言葉でタスクを依頼することが可能になりました。まずは、簡単なことから依頼してみて、いつかはご自身のお仕事での事務作業などを依頼すると実感が湧いてくるかと思います。

当社では、その生成AIを基に製造業に特化した独自のGPTモデルの開発を進めております。当社が目指す姿は、AIを用いて誰でも・簡単に・思い通りに業務改善やノウハウ共有を行えるサービスを作ることです！

記事の内容が面白かったら、フォローやSNSでのシェアを宜しくお願いします！

当社にご興味ある方は、こちらもご参照ください！

この記事が参加している募集

#やってみた

38,995件

#AIとやってみた

33,921件

応援したいと感じて頂けたらサポートお願いします！頂いたサポート費は、AIやDXの調査費用として使わせていただきます！より良いコンテンツの制作を頑張ります！