![見出し画像](https://assets.st-note.com/production/uploads/images/165060886/rectangle_large_type_2_2bfc35522043f3757a860db0650beed3.png?width=1200)
様々な分野の生成AIまとめ-簡易版-
生成AI(ジェネレーティブAI)は、テキスト、画像、音声、動画など多様なコンテンツを自動生成する人工知能技術で、近年、ビジネスや日常生活において急速に普及しています。
今流行りの生成ai、どんなものがあり、どのように活用できるかをまとめました。以下に、簡易的に主要な生成AIツールとその活用方法をカテゴリ別にご紹介します。
テキスト生成AIツール
概要: テキスト生成AIは、自然言語処理技術を活用し、人間のような文章を自動生成します。
活用方法: これらのツールは、ビジネス文書の作成、クリエイティブライティング、コンテンツ制作、翻訳・要約、プログラミングコードの生成、チャットボットの構築など、多岐にわたる用途で活用されています。
具体的なツールとその特徴は以下の通りです。
ChatGPT
OpenAIが開発した対話型AIで、広範な知識を持ち、多様なタスクに対応します。最新モデルのGPT-4は、テキスト、音声、画像、動画の入出力に対応するマルチモーダル機能を備えています。
無料でも使えますが、有料版を使うと制限なく、またより高度なAIを使うことが可能です。
![](https://assets.st-note.com/img/1733726066-MnDb8vo2dFGNtWwCqucfrp5g.png?width=1200)
Claude
Anthropic社のAIで、倫理的配慮を重視した設計が特徴です。長文処理に優れ、多言語対応もしています。
自然な言語での返答が多く、作文の書き換えや記事に向けた文章作成等で威力を発揮します。
![](https://assets.st-note.com/img/1733727278-7Cw6hpfGexSuFKqB1Jmnst3z.png?width=1200)
Gemini
Googleが開発したAIで、自然言語処理、画像認識、コード生成など多様なタスクに対応します。複数のバージョンがあり、用途に応じて選択可能です。
最新モデルは、テキスト、音声、画像、動画の入出力に対応するマルチモーダル機能を備えています。
Googleとの連携が可能なため、Google関連の機能との親和性があり、活用の幅が広いです。
![](https://assets.st-note.com/img/1733727313-rC4qa5R6fsuywniIhZGb3MVQ.png?width=1200)
Copilot
MicrosoftのAIアシスタントで、Office製品に統合され、メールの下書きやスライド作成などを支援します。
Microsoftと連携しているため、特にoffice製品関連で役立つことが期待される
![](https://assets.st-note.com/img/1733725952-X1mpdBetgISokZNyr2qxlhJF.png?width=1200)
Notion AI
ドキュメントツールNotionに組み込まれたAIで、文章の自動生成や校正、要約などを行います。
Perplexity AI
検索エンジンと生成AIの機能を統合したAIであり、リサーチにおいてかなり使いやすいです。ユーザーが入力した質問に対して、まずインターネットから関連情報を検索し、その結果を基に回答を生成するため、最新の情報をリアルタイムで取得し、提供することが可能です。
出力される情報には必ず出典元が明記されており、ユーザーはその信頼性を確認しやすいです。
![](https://assets.st-note.com/img/1733727648-Y56fa8nCe4gyRxp9cizqvTbZ.png?width=1200)
画像生成AIツール
概要: 画像生成AIは、テキスト入力から自動的に画像を生成する技術
活用方法:以下のツールは、イラストやアート作品の制作、製品や建築のデザイン、広告・マーケティング素材の作成、ゲームやアニメーションのキャラクターデザインなどに利用されています。画像生成系はテキスト生成系に比べて、有料のものが多く、無料で特にリアルな画像を作るのは難しい傾向があります。複数のツールを検討したうえで、課金も視野に入れるとよいかもしれません。
具体的なAIとその特徴は以下の通りです。
Stable diffusion
Stability AIが開発したオープンソースの画像生成AIである
特に、フォトリアリズムに優れています
ローカルやgoogle colaboratoryで環境構築を行い実行するのが基本だが、Dream Studio、Stable Diffusion Online、Mage.space等にアクセスしてセットアップなく使うことも可能です
以下のような画像を簡単に作り出すことができる
![](https://assets.st-note.com/img/1733729503-5wzm4e3WFKLlfoysDHgYpEcO.jpg?width=1200)
Midjourney
Discord上で動作する画像生成AIで、高品質な画像を簡単に生成できます
有料での使用しか現在認められておらず、月々最低10$払う必要があります。
![](https://assets.st-note.com/img/1733730682-SgW2olhnvIeqpCxcf9Dds0r4.png?width=1200)
DaLL-E3
OpenAIが開発した画像生成AIで、テキスト入力から多様なスタイルの画像を生成します。
chat gpt上で画像生成を行うようなPromptを実行する場合に、Dall E3が機能しているようです
![](https://assets.st-note.com/img/1733730419-zidF6QxlXRcA9GorPj3K2CWV.png?width=1200)
![](https://assets.st-note.com/img/1733730591-S7FiMjPUCQBTOg2HcoDxKyuE.png?width=1200)
Canva AI
デザインツールCanvaに搭載されたAI機能で、テキストから画像を生成する「Dream Lab」などの機能を提供しています。
無料で用いることができます。canvaのデザインを簡単に素敵なものにすることができ、かなり使用しやすいです。
Artguru
オンラインで利用可能な画像生成ツール、バックにどのようなモデルを使っているかはわからないが、リアルな画像生成にもかなり強みを持っている印象。
無料で使える。
![](https://assets.st-note.com/img/1733731008-6lhQI2Y0dR8pJPHvDZSAGmfy.png?width=1200)
Akuma
オンラインで利用可能な画像生成ツール、バックにどのようなモデルを使っているかはわからないが、アニメの画像生成にもかなり強みを持っている印象
一部、無料で使える
![](https://assets.st-note.com/img/1733731356-SQOe9tKl0RC5BYHGjAVXmnkc.png?width=1200)
![](https://assets.st-note.com/img/1733731362-hsHPedrFuxcSJbj0KyRgkACi.png?width=1200)
音声生成AI
音声生成AIは、テキストデータを人間のような自然な音声に変換する技術です。ナレーションや音声ガイドの作成、オーディオブックやポッドキャストの制作、バーチャルアシスタントの音声、教育コンテンツの音声化などに活用されています。主なツールとその特徴は以下の通りです。
Google Text-to-Speech AI
Googleの音声生成AIで、380種類以上の音声と50以上の言語をサポートしています。
入れたtextを音声に変更してくれます。語学学習とかで使えそうです。
Vall-E
Microsoftが開発した音声合成AIモデルで、わずか3秒の音声サンプルからその人の声を再現できます。
Resemble AI
10秒の音声サンプルから自然なAI音声を生成し、リアルタイムでの変換や合成が可能です。
voice vox
ずんだもんや様々な有名キャラクターのしゃべり方のまま、テキストを読み上げさせることが可能
音楽生成AI
音楽生成AIは、Promptに従って新しい音楽を生成する技術です。様々なミュージック、BGMの作成などに活用されています。主なツールとその特徴は以下の通りです。
Suno
Promptから音楽を生成してくれます。例えば、"a country music with the hip pop rythm and beautiful piano sounds"といった簡単なpromptで驚くような素敵なミュージックを作ってくれます。
音楽をアップロードしてそれを基に作成してもらうことも可能なので、鼻歌ベースで本格的な曲にしてもらうことも可能です。
soundful
Soundfulは、コンテンツクリエーターや音楽アーティストがビデオ、ストリーム、ポッドキャストなどに使用できるロイヤリティフリーのバックグラウンド音楽を生成するAIミュージックジェネレーター
自分でゼロから作るというより、気に入った様々な音楽を選んでいくことで、バックグラウンドミュージックを生成できるという感じ
stable audio
Promptから音楽を生成してくれます。
音楽をアップロードしてそれを基に作成してもらうことも可能なので、鼻歌ベースで本格的な曲にしてもらうことも可能です。
実際に鼻歌を基に音楽を作ってもらおうとしたが異様に時間がかかる…
beatoven.ai
Promptから音楽を生成してくれます。
簡単なPromptを投げてもかなりおしゃれな音楽にしてくれる
動画生成AI
概要:動画生成AIは、テキストや静止画像を基に自動で動画を生成する技術です。
活用方法:広告・マーケティング動画の作成、教育用コンテンツの生成、エンターテインメント分野での短編映画やアニメーションの制作、製品デモンストレーションなどに利用されています。
主なツールとその特徴は以下の通りです。
invideo ai
テキストプロンプトを使用して動画を作成できる革新的なAIツール
ナレーションの変更や動画の細かい編集等も可能で、従来時間がかかっていた動画作成を簡単にスムーズに行うことが可能。
実際に作ってみましたが、簡単なスクリプトで素敵なmovieを作ってもらえました。意外と作成まで早く5分くらいで生成が終わります。
Runway
高品質な5秒間の動画を迅速に作成できるツールで、スマホアプリでも操作可能です。
現在利用者が多く、少し回線は重めだが、pngや動画等を基に5-10秒等のショート動画の作成が可能、以下のようなgif形式の動画を作った。
![](https://assets.st-note.com/production/uploads/images/165084114/picture_pc_18d4af04b9dc4cf6c1f62f63dc1344ac.gif)
veed io
簡単に動画を作ってくれます。
ゼロから動画を生成するというよりは、ありものの動画を組み合わせたりアバターにtextで入力したことを喋らせたりすることができるので、ある程度の枠の中で自由に動画を作れるというイメージに近いです。
dream machine
画像と動画両方の生成が可能。luma AIが使われているAIツール
5秒程度の美しい動画を生成することが可能
Stable Animation
Stability AIが開発したアニメーション生成ツールで、テキストや画像を基にアニメーションを生成します。
ただ、有料版でしか使用できないため、今回私は使っていません。
Kapwig
チームでのコラボレーションや個人でのビデオ編集を驚くほど簡単にし、クリエイティブなプロセスを加速させるAIツール
ただ、有料版でしか使用できないため、今回私は使っていません。
Sora
Open AIから出ている動画生成AIツール。企業向けに公開されている一方、まだ個人では使うことができない…徐々にリリースされるか。
Lumiere
Googleから出ている動画生成AIツール。
Lumiereは、Googleの研究部門Google Researchが発表した動画生成AIですが、始め方や登録方法についてもまだ一般公開されていない…今後徐々にリリースされるか…!