見出し画像

Google Gemma2でショートショートを生成してみた

しばらく多忙のため記事を更新できておらず申し訳ございません。

まだあまり時間が取れないのですが、記事の更新だけはしておきたかったので、短い記事になりますがご容赦ください。

今回は、Google Gemma2を利用して生成したショートショートとその作り方を簡単にご紹介します。


生成されたショートショート

失われた旋律

薄暗く静かな部屋に、パソコンディスプレイの青い光が反射していた。私は大学で音響工学を専攻しているけど、本気で興味のあるのは母のあの優しい声だった。母の声は、まるで鈴の音のように美しく、私の幼い心をいつも暖かく包み込んでくれた。でも、事故で彼女を失ってから、その声が聞けていない。「忘れられた旋律」というピアノ曲が大好きだったんだけど、母が亡くなって以来、どこへ行ったのか分からなくなってしまったんだ。Ariaと出会ったのはSNSで。AI技術の最先端を走るこのプログラムは、「デジタル幽霊」と呼ばれるものを作ることができるらしい。人の過去の映像や音声データを分析して、その人を再現するのだという。最初は半信半疑だったけど、Ariaが故人を再現する能力を使って「忘れられた旋律」を探してくれるかもしれないと、私は希望を見出したんだ。

Ariaの画面に映し出されるのは、精緻なデータによって構築された、まるで人形のような女性の顔だ。瞳は青く、優しく笑っている。しかし、その笑顔にはどこか冷たさが感じられる。これは本物ではないのだ、という事実を突きつけられたような気がした。それでも、私はAriaの提案を受け入れた。母の声を探し出すために。

Ariaは私の過去の写真や動画、友人からの証言などを収集していく。彼女の分析能力は驚異的だった。詩集の中に隠されたメロディーのヒントを見つけたり、母の好きな花の種類から曲調を推測したりと、まるで私と同じように母親のことを考えているような気がした。それでも、重要な部分だけが残る「忘れられた旋律」の再現には限界があることを Aria は認めた。「デジタル幽霊は過去のデータを基に作られるものだから、お母様の真情は完全に再現できないんだ」

Ariaの言葉は私の心を痛めた。デジタル技術で作ったものは、本物の感情や経験を置き換えられないのだ。それでも、私は諦めなかった。過去の思い出を語り始めると、母の愛しさと温かさを感じることができた。彼女の笑顔、優しい声、いつもかけてくれた「頑張ってね」という言葉……。Ariaがそれらをデータに変換していく様子を見ながら、私は母への感謝の気持ちが溢れ出てきたんだ。

ついに、「忘れられた旋律」は完成した。Ariaの声を通して、母の歌声が聞こえてくる。それは、かすかなノイズやデジタルな歪みを感じさせるものだったけど、それでもあの懐かしい音色に私の心が包まれた。まるで母が再びそばにいてくれるような錯覚に陥ったんだ。

この物語は、テクノロジーの進化と人間の感情の関係を描いたものである。AIによって故人が再現されるという未来は素晴らしいかもしれないけれど、それは本当に人間の本質を理解できるのか? この問いを私はこれからも深く考えたいと思っている。


※上記の文章は、Gemma2に筆者がプロンプトを入力して生成させたものです。出力結果を分析するため、筆者は文章を修正しておりません。

Gemma 2とは?

Gemma 2はGoogleが2024年6月27日にリリースしたオープンモデルです。9Bと27Bモデルが発表され、その後7月31日に2Bモデル、10月3日には日本語版2Bモデルも公開されました。

Gemma2の使い方

環境

  • Windows11

  • RTX3060 (12GB)

  • Ollama

Ollamaのダウンロードとインストール

Ollamaとは、ローカル環境でLLMを容易に実行できるツールです。OpenAIのサーバーで動作しているChatGPTと違って自分のPC内で動作するので、ネット接続がなくてもいいですし、料金も電気代のみで利用できます。

なお、使っているPCのGPUによってローカルで動作できるLLMのサイズが変わります。場合によっては動作しないこともあるので注意してください。

以下の公式サイトからダウンロードして使うことができます。

「Download」ボタンをクリック。

OSを選んでボタンをクリック。

ダウンロードしたexeファイルをダブルクリックするとセットアップ画面になります。「Install」ボタンをクリック。

インストールが完了すると自動的にウインドウが閉じます。これでインストールは完了です。

続いてOllamaを実際に使っていきます。スタートメニューを開いて「cmd」と入力してエンターキーでコマンドプロンプトを実行します。

次にコマンドプロンプトに以下を入力してOllamaのバージョンを確認します。

ollama --version

下記の表示が出てくればOK。

ollama version is 0.3.14

Ollamaの使い方

次にgemma2のモデルをダウンロードします。以下を実行すると、gemma2 9Bモデルをダウンロードできます。

ollama pull gemma2

小さいモデルの方を使いたい場合は、2Bモデルを指定してください。

ollama pull gemma:2b

モデルのダウンロードが完了したら以下で実行できます。

ollama run [モデル名]

モデル名は適宜入れ替えてください。例えばgemma2を実行する場合は下記になります。

ollama run gemma2

実行すると、下記のような表示になります。「Send a message」のところにプロンプトを入力します。

たとえばこんな感じ。

AI作家くんは自炊しないみたいです。

終了する時は「Ctrl」キー+「D」キーです。

冒頭のショートショートは、筆者が執筆フローをデザインして最初の方向性をプロンプトで与えたあと、プログラム側で複数回生成して得られた出力です。OllamaのAPIを使っています。

Ollamaでは、Gemma2の他にもさまざまなオープンモデルが利用できるので試してみてください。

ちなみにOllamaの公式ページにて使用できるモデルを確認できます。

では。

(短くするつもりが、割と長くなっちゃった……)


この記事が気に入ったらサポートをしてみませんか?