![見出し画像](https://assets.st-note.com/production/uploads/images/157821412/rectangle_large_type_2_8215e72befde54a292c578a6f389c13a.png?width=1200)
週刊4mirai:プロンプトのコツ、AIでポッドキャストを自動作成、国産LLMの意義(2024年10月15日号)
「未来に挑むITエンジニアのリアル」を深掘りするマガジン。
技術の最前線で活躍するITエンジニアの視点を学び、最新の技術トレンドやAI活用法で自分のスキルを磨こう!行動のヒントが盛りだくさん。
毎週火曜日発行。
今週のざっくばらん
中島聡さんがAIを活用してポッドキャストを始めた
私が尊敬する中島聡さんの「週刊 Life is beautiful」はテキスト形式の配信のみでしたが、「Life is Artificial」というSpotifyのポッドキャストを始められました。
ポッドキャストを作る際の技術スタックを公開されていて、ITエンジニアとしては興味を惹かれました。
私のメルマガの英語版Podcast。AIのおかげで生産効率爆上げで、もう3つもエピソードが出来た(未配信)。
— Satoshi Nakajima @GraphAI (@snakajima) October 7, 2024
使っているツールは、
- ChatGPT 4o with canvas(脚本)
- TSS Playground(音声)
- Rendernet, @rendernet_ai(挿絵)
- Suno(音楽)
- Garageband(編集)
- Spotify for podcaster pic.twitter.com/ybURY6sd8Q
私もYouTubeでこのブログの音声版を配信していますが、台本作りや音声化で改善したい所があったので中島さんのツールを真似させていただこうと思います。
ネックになるのが、中島さんが英語で、私は日本語の音声配信を考えているところです。
私はVoiceBoxのずんだもんでテキストを音声化していますが、VoiceBoxが知らない単語の発音は毎回手打ちしているので、作業効率が非常に悪いです。
日本語はイントネーションの違いで意味が異なるし、漢字・ひらがな・カタカナがあったり、アルファベット英語(Apple)とカタカナ英語(アップル)が混じったりと、非常に複雑な言語だと再認識しました。
近頃は、AIによって言語の自動翻訳が実装されています。日本語もちゃんと対応されています。
しかし、それは日本が現時点では魅力的であるからだと思います。日本人の技術力の低下、若い労働力の不足など、何もしなければ魅力は失われます。観光業で売り出した際に、ヨーロッパ・中国はAI翻訳対応しているのに日本語は対応していない、という状況になればインバウンドも見込めません。
つまり、日本人のためのAIは日本人が作るしかない、と言うことです。
日本語特化のLMM「EZOシリーズ」を応援したい!
日本語に特化したLLMを作られているホーダチさんという方がいます。今までは活動は知っていましたが「ふーん」って感じでした。しかし、このように深く考えてみると日本にとって非常に意義のある活動をされていると感じ、応援したくなりました。同じ日本人として協力すべきだと思いました。
クラファンで資金を募集されていたのは知っていたので支援しようとしましたが、募集が終わっていました。私ができることは、ホーダチさんの活動を皆さんに知っていただくことです。以下のクラファンサイトにホーダチさんの活動が分かりやすく解説されているので、皆様ぜひ見ていただけるとありがたいです!
個人のアプリ開発速度が加速している
AIの登場で、AIを活用している人の開発速度がブーストされまくっていると感じています。
中島聡さんが音声コンテンツの配信を始められたのもそうですが、文字起こしアプリ、GraphRAGを使ったAIチャットアプリ、など色々と毎週のようにリリースされています。
非エンジニアがwebアプリを作ったり、エンジニアがメディアコンテンツを作ったりと、スキルを身につける工程をすっ飛ばして「創作したい」という熱量だけでモノが出来上がっています。
私はITエンジニアですが、ちゃんとしたwebアプリ(DBを使ったもの)をリリースした経験はまだありません。
そのため、その勉強も兼ねてCursorハッカソンでは「中島聡さんのメルマガを読む専用アプリ」の開発に挑んでいます。
DB構成やセキュリティなどは知識が乏しいため、AIが提案してくれたものに「本当に正しいか?」と思いながら開発しています。
ハッカソンの締切まであと2週間なので、その辺りは後回しにしつつ、最終的な形あるモノの完成を第一に考えて頑張ろうと思います!
AIと英会話の勉強を無料でしてみた
ChatGPTの「高度な音声モード(Advanced Voice Mode)」が無料版の私にも開放されたので、前々からやりたかったAIとの英会話学習をやってみました。
感想としては、めちゃくちゃ良い、です!
ChatGPTの「高度な音声モード(Advanced Voice Mode)」のAIに、英会話の相手をしてもらった!普通に良い感じ✨文字起こしもしてくれて後から見返せるし、無料版でも使えるので、ぜひお試しあれ!🌞 pic.twitter.com/PovmVgxZVe
— なぎそら@IT&AI&ビジネスが分かるマガジン「週刊4mirai」無料で毎週発行中! (@nagisora_) October 9, 2024
良い点としては、
相手がAIなので気を使わなくて良い
日本語を交えても対応してくれる
ベットでゴロゴロしながら勉強できる
です。
私自身、英語に強くなりたいという思いがありTOEICなども勉強しましたが、英文は多少読めるようになったものの自分で英文を作ったりは出来ず、「コミュニケーションの基本は会話じゃね?」と思ったので、いつか英会話を勉強したいと思っていました。
DMM英会話やAI英会話などありますが貧乏ITエンジニアの私には高額なため出来ず、いつかAIが対応したらやろうと思っていたことがついに来ました!
無料版ユーザーだと10分/月しか使えませんが、AI英会話の可能性は非常に感じました。
そのため、自分専用の低コストのAI英会話アプリがほしいと思いました。無料で提供されている無限文字起こしの技術を参考にして、Geminiを使い文字起こしし、VoiceBoxを使って発音させることで低コスト化を実現できそうな気がするので、ハッカソンの開発が終わったらAI英会話アプリの開発を行おうと思っています。
git rebaseなんてものがある
私はフリーランスITエンジニアとしてマッチングアプリの開発に携わっています。
ブランチで作業していて本番リリース前にorigin mainとマージ(git pull origin main)してテストを行おうとしたら、origin mainの差分がGitHubのFile Changesにも出てきて「自分の差分だけ気軽に見れないんだけど!」となりました。
そこで先輩にヘルプを求めた所、「git rebase使うと良いよ」と教えてもらい解決しました!
git rebaseとは、ブランチの起点を最新の状態に変更する、コマンドです。git pull origin mainしてしまうと、自分のソースコードに他人がorigin mainにマージしたものも含まれてしまいますが、git rebaseすることで差分を取り込まずにブランチを最新の状態にすることが出来ます。
git rebaseにはコミットの起点を変えてしまう、ことがデメリットであるとAIに教えてもらいましたが、まだそれを実感できてないので、本番リリース前のテストにはgit rebaseを使おうと思います。
今週注目の最新AIツールまとめ
無限もじおこし:無料で文字起こしし放題なiphoneアプリ。無料という所が革新的
私の目に止まった記事
いいね・リポストをもらう方法
AI系の実践的な情報を発信されている吉波さんが、いいね・リポストをもらえる要素(フォロワーを増やす方法)の大喜利をやられていたので参加させていただきました!
Xでいいね・リポストをもらえる要素
— 吉波拓夢 | DiningX CTO (@yoshi8__) October 6, 2024
- 他の人が知らない
- インパクトがある
- 信頼できる情報源である
- 受け手の得意分野に落とし込める
あと一つ挙げるとしたら?
吉波さんのポストについて、自分の理解は、
他の人が知らない → 最新情報を伝える
インパクトがある → 興味を惹かれた
信頼できる情報源である → ポストした人、ポストした情報が信用できる
受け手の得意分野に落とし込める → 役に立つと思える
です。
リプライで私が興味を惹かれたのは、
応援したくなる(なぎそら)
自分の頭の中を言語化してくれた(kkさん)
です。
まとめると、
面白い:好奇心が刺激された、初めて知った役立ち情報
好感度:共感した
かなと。
私が最近フォローした方で当てはまるのが、元木さん、Makiさんです。
元木さんはご自身で有益なAI情報をポストしまくるほか、有益な情報をリポストされるなど、AIに関する有益な情報が元木さん1人をフォローするだけで補えてしまう感じです。
Makiさんは、IT系の面白そうなこと実際に手を動かして試されており、それをアウトプットとしてXに垂れ流しされています。
2人の共通する所として、ITエンジニアが興味が惹かれたり・役立つ内容であること、過剰に煽ったりせず・ポジショントークになってないため純粋さが見える、ことでしょうか。
中島聡さんも仰っていますが、これからのAI時代は個人のフォロワー数が大事になって来ます。そのためには、誰かの役に立ち、透明性のあるポストによって、いいね・リポストの獲得からフォロワー数の増加に繋がるのではと思います。
スティーブ・ジョブズが散歩しまくっていた理由
ジョブズは難しい問題に直面した時に、「10分考えて解決しなければ散歩に行く」ことを習慣にしていたそうです。それにより脳がリフレッシュされ、彼の高度な問題解決力や創造性の発揮に繋がったということです。
私も最近は難しい開発を任せてもらえるようになり、頭をフル回転させてシステム設計を行っています。正直、「もう頭が思考するのは嫌だ」と何度も思います。
昼食後には会社近くの公園を1周するという習慣を毎日行っており、その時に思考が整理され「こうしてみるか」などアイディアが浮かぶことがあります。
また、1時間に1度は席を立ち、会社が入っているビルの最上階まで階段で上り(5階分)、自社フロアまで階段で降りてくるという散歩もしています。
ITエンジニアは椅子に座ったままになりがちだと思います。
適度な散歩は仕事にも健康にも良いと思うので、皆さんも習慣にされることをおすすめします。
Google、全Geminiユーザーに「Imagen 3」を開放
GeminiでImagen 3という高性能モデルがだれでも使えるようになったようです。
ブログのアイキャッチを作ってもらえるのが楽かとおもいました。
また、無料版ユーザーは人物出力に対応していないので、人物が入る場合は「まもなくGemini Advancedで人物の画像生成を利用できるようになります」と出てしまいます。
その場合は、プロンプトに「人間は含めなくてよいです。」と追加してあげると問題なく出力されました。
Godotを簡単にコンソール機へ移植する「W4 Consoles」
Godotで作ったゲームがワンクリックでSwitchに対応できるサービス。
自分が作ったゲームを子供にやらせたいと思っており、興味を惹かれました。
ふと考えてみると、Steam Linkでリビングのテレビに飛ばせば良いだけかと思ったので、価格がもう少し安るなったら考えようと思います。
任天堂のハードに自分がゲーム出せるとか憧れますよね!
脳に優しい、仕事と勉強の両立術
脳が疲れた時は「書くことが良い」と紹介されていました。
私は複雑なシステムの設計を最近やっており、めちゃくちゃ脳が疲れます。
そのため、帰宅後は「もう頭使いたくない!」となりますが、パソコンを起動してテキストを何か書き始めると2時間くらい経過していることがあります。
コーディングとなると「脳がもう無理!」と腰が重くなりますが、その日のタスク整理のような簡単なテキストならハードルが低いので、帰宅後はこういうことから始め、副業の作業時間を確保していこうと思います。
質問コーナー
AIの結果を良くするためのプロンプトのコツ
【質問】
AIを使っている時に回答が微妙だと思うことがあります。求めている回答を出すためのプロンプトのコツなどありましたら教えていただけないでしょうか?
【回答】
私もAIの回答が微妙だと思うことは良くあります。
AIが変な答えを返した時は、「強気な口調で否定し、こうして欲しい、と追加で情報を与えてあげる」ことがおすすめです。
人間でも怒られるとちゃんとしますよね?それはAIも同じで、AIは人間がやり取りを用いて学習しているので、強く否定すると回答の精度が良くなります。
そして、人間でも必要な情報が足りないと変な回答になり、それもAIは同じなので、補足情報を与えてあげると良いです。
あと、AIは会話履歴も考慮して返事をするので、全然別のことを聞く場合には「新しくチャットを始める」で、新規に質問を開始するのは非常に大切です。
また、プロンプトジェネレータという良い感じのプロンプトを生成してくれるAIもあるので、それを使うのが良いと思います。
ChatGPTのOpen AIがプロンプトジェネレータを出していて良さそうです。(私はまだ使えていません)
”Orby AI”を知っていますか?
【質問】
最近、”Orby AI”という業務を自動化するAIが出たようですが、このサービスについてどう思われますか?
【回答】
Orby AIは初耳です。教えていただきありがとうございます。
AIによる業務自動化については、企業からエンジニアに自動化ツールの作成依頼が来て、エンジニアがAIを作ってその企業に特化したオリジナル自動化ツールを作る、という未来を予測していました。
良く考えてみれば、今までも汎用的なRPAが主流だったので、AIを使って汎用RPAを作る人が現れてもおかしくないと思いました。
メール返信、勤怠、会計、などはどこの会社でもやることは同じだと思うので、基本は同じでAIを活用して少しのカスタマイズに対応できるRPAがシェアを取りそうですね。
なぎそらの個人的な話
webエンジニア頑張ってるよ!
私はweb未経験で今年4月に今の会社にアルバイトで入社しました。その後、2ヵ月の下積みを経て、LINEスタンプと同等の機能を、開発期間1ヵ月で自社マッチングアプリに実装するまで成長しました。
ユーザには沢山使われ、管理者からも好評で「気になる点はあるが、最低限必要な機能を使いやすく作ってくれて、私達のことをすごく考えてくれてありがとう!」とお褒めの言葉を頂けました。
私結構頑張ってる気がする!🙌
— なぎそら@IT&AI&ビジネスが分かるマガジン「週刊4mirai」無料で毎週発行中! (@nagisora_) October 10, 2024
web未経験で4月に入社し2ヵ月の下積みを経て、LINEスタンプと同等の機能を1ヵ月で実装。ユーザには沢山使われ、管理者からも好評で「使いやすく作ってくれてありがとう!」とお褒め頂けた。ちな10年前にCOBOLやってた。これも #AI と #Cursor のおかげ。
15年前の大学生時代にはC言語で、10年前の会社員時代にCOBOLはやっていましたが、webの開発は多少趣味でやっていましたが苦手でした。
でも、「自分のプロダクト持つならwebアプリだよな」と思い、web開発未経験でも雇ってくれる今の会社に巡り合い働いています。
最初は「ちゃんとできるかな」と不安でしたが、社内は親切なエンジニアばかりで色々と教えて頂けるので非常に助けられましたし、最近のAIの急速な発展により、web開発の雰囲気だけ知っていれば自然言語でプログラミングができることが、開発のハードルを非常に下げていると思います。
cssとかバリデーションとか苦手ですが、「それこっちにして!」「セキュリティ実装して」とか言うとちゃんとAIがやってくれるので、私はAIが作成したプログラムのファクトチェックのみすれば良いだけです。
また、自社ではCursorを使って良いルールであることも良かったです。
なぎそらの目標
note、ブログ、YouTubeの制作が標準化できて安定してきたので、次の段階のことを考えよと思いました。次の段階とは、世の中の誰かに刺さる(ニッチ)なものを提供することで、収益を得ることです。
私の最終的な目的は、なぎそら個人として月10万(手取り)を稼ぐことです。
その先は、余剰資金を何かに投資して増やし(税金をあまり納めない形で)、イーロン・マスクさんのように札束で何でも思い通りにできるようになり、政治家の影響を受けない形で、日本を良くするために何か出来ればと思っています。
フォロワー数を増やしたい
なぎそら個人として利益を上げるためには、「フォロワー数」が重要だと思いました。中島聡さんもそう言っています。
なので、フォロワー数を増やす施策を考えてみました。
コンバージョン(最終目標)
noteのメンバーシップへの加入
100,000円(毎月の目標金額)÷500円(サブスク料金)✕90%(手数料)=250人
コンバージョンへの導線
noteのメンバーシップへ加入するメリットは、なぎそらに質問し放題
少なくとも250人の方に「なぎそらに教えてもらいたい」「なぎそらを応援したい」と思って頂けるようにしないといけない
noteに投稿しても初週以外はあまり伸びない。もっと色んなSNS(X、Zennなど)で存在をアピールし、総合的にフォロワーを増やしていく必要がある。
X(旧twitter)のフォロワー数の増やし方
先にも書いた吉波さんのポストを参考に「いいね」を稼ぎ、元木さんをフルリスペクト(丸パクリ)して私が有益であるとアピールしていく。
元木さんをマネて、有益そうなものをリポスト、コメント付きでリポストを行う
今まではブックマークしただけだったけど、リポストするようにする
note(マガジン)の内容を小分けしてXでポストするようにする。中島さんみたいにハッシュタグ付けたい。「#メルマガのネタ」は中島さんが使われているので、「#週刊4miraiのネタ」でポストしていこうと思います。
ちなみに、YouTube版でずんだもんを全面に押し出す必要性を感じなくなったので、なぎそらアイコンに交代し、単純接触効果により自身のアピールをしていこうと思います!
石丸さん✕玉木さんの日本を良くするための議論が面白すぎた
YouTubeのReHacQという番組で、石丸さんと国民民主の玉木さんが対談されているのを見ましたが、非常に面白かったので共有させていただきます!
面白かった点は、
エネルギー自給率を高めるために原発は必要
遺産相続が90歳から70歳へと高齢者間で行われていて、若い世代にお金が回らない。教育国債の発行等で解決したい
最低賃金は上がったが社会保険料も上がっているので、手取りは何も変わっていない。(解決方法は何か仰っていたが忘れました
今の時代にあっていないゾンビ法律を無くしたい。基礎控除の上限が103万円など。
です。他にももっとありましたが、忘れました。
今の日本の政治に希望を持てない方はぜひ見てください!非常に建設的な議論がお二人の間でなされていますので!
WordPressで予約投稿が失敗する
キャッシュ系プラグインを使っていると失敗するようです。
この記事を参考に設定してもダメでした。
手動でやります(涙)
中島聡さんの「週刊 Life is beautiful」で良かった内容まとめ
私の尊敬するエンジニアの中島聡さんのメルマガから、私が覚えておきたい内容を抜粋してまとめています。中島さんはWindows95を作った凄い人で、次に買うべきテック株の精度の高い情報もメルマガ内にあるので、気になった方は初月無料なので読んでみることをおすすめします!
・情報が溢れている今の時代、一番の武器は「フォロアー数」だと言って、間違いはないと思います。
・エンジニアを作業員としか見ておらず、プロジェクト管理だとか仕様書作りなどの技術的でない仕事をする人を優遇する会社であったとすれば、エンジニアとして働く価値はないと思います。
・私たちソフトウェア・エンジニアの仕事は、新しいハードやシステムを上手に利用して、世の中に価値を提供するアプリケーション(サービスも含む)を作ることです。
・可能な限り「会議」は避けるべきで、「実装方針を共有」のようなものは、オンラインツールを使って、非同期に行うべきです。
来週以降に書く予定のもの
特に次の週に書くことが決まっているわけではありませんが、マガジンを執筆していて「このテーマも書かなければ!」と思いつくことがしばしばあります。そこで、そんなテーマはここに備忘録として書いておくことにします。ただし、来週号に書けるとは限らないので、ご了承ください。
Amazonらくらくベビー
お金に余裕がある人が多く負担するサブスク方式
プロンプトを音声入力したい
なぎそらの注目エンジニアまとめ
Cursor(VScode)で関数ジャンプする方法
なぎそらオススメAIツールまとめ
眠れない夜はデエピゴがおすすめ
身近な人が余命宣告された
生きていれば山あり谷あり
AIと軍事
AIによりポッドキャスト化されたYouTube版の週刊4miraiもよろしくお願いします!
週刊4miraiの作者なぎそらを応援してくださる方は、各種SNSのフォローや、noteのメンバーシップ加入、して頂けますと嬉しいです!!
私へのご質問やご要望などのお問い合わせは、noteのメンバーシップ掲示板からお願いします。 すべての質問に答えられるとは限りませんが、読者の方から送られて来たものにはすべて目を通していますし、可能なかぎり回答したいと考えています。
質問の内容や回数に特に制限はもうけていませんので、気軽にお願いします。ちなみに、回答は原則としてマガジン紙面上で行いますので、公開されては困るような質問の場合は、そこを明確にしていただけると助かります。
このマガジンの一部をブログなどに引用の形で利用することは、出典を明確にしていただく限り、個別に許可を取らなくても結構です。
マガジン内に掲載されている画像は記事リンク先からの引用です。記事のリンクがないものはクリエイティブ・コモンズ・ライセンスにより許可されたもの、もしくは著者所有の画像です。
この記事が気に入ったらチップで応援してみませんか?