にょす

にょすです。時間無制限で、無料で文字起こし放題なアプリ「無限もじおこし」を運営してます。

にょす

にょすです。時間無制限で、無料で文字起こし放題なアプリ「無限もじおこし」を運営してます。

マガジン

  • 「無限もじおこし」マガジン

    「無限もじおこし」に関する情報をまとめていきます。購読いただくと最新情報を収集しやすくなります(もちろん無料です)

  • 「シャべマル」マガジン✉️

    音声メモ日記アプリ「シャべマル」の記事をまとめたマガジンです。快適に使うための使い方Tipsや、開発者が考えていること、活用事例などをまとめていく予定です!

  • microsoft / Guidanceの調査レポ

    microsoft社が公開しているGuidanceについての調査です。Guidanceは従来のプロンプトやチェーンよりも効果的かつ効率的に最新の言語モデルを制御できるOSSです。

最近の記事

  • 固定された記事

時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。

みなさん、こんにちは!9月は久しぶりに個人開発をしてました。 今回はGeminiを使って、ちょっと変わった文字起こしアプリを開発したので、その裏側をお話ししていきたいと思います。その名も「無限もじおこし」です! 「無限もじおこし」はその名の通り、時間無制限、無料で使える文字起こしアプリです。普通に考えたら「え?大丈夫なの?」って感じですよね笑 でも、ちゃんと収益的に成り立つ算段を立てています。この記事ではそこらへんの考えや、アプリ開発における技術的な学びについてまとめて

    • 【無限もじおこし】文字起こしの処理の安定化を行いました!(v1.0.5)

      時間無制限で、無料で使える文字起こしアプリ「無限もじおこし」のアップデート情報です! バージョンアップはこちらから↓ 以下、アップデート内容になります! バックグラウンド文字起こし処理の安定化これまでバックグラウンド処理を行うと、途中から文字起こしが途切れてしまう、あるいは文字起こしがされずに終わってしまうという事象の報告がありました。こちら大変申し訳ございません…。🙇‍♂️ 原因は音声検出処理がバックグラウンドで処理できないことが原因となって発生しておりました。こち

      • 【有料公開】バズった「無限もじおこし」の宣伝効果と収支の現状

        10月5日に公開した「無限もじおこし」ですが、想像以上に多くの人に見ていただけました! 個人開発なので自由に数値を公表できる機会ということもあり、せっかくなのでこのバズりによって、どれくらいのPVやインストールにつながったのか、また実際に利用されてみての収支の現状について、まとめてみようと思います。 インストール数や収支などは、あまり大々的に公開するものでもないと思うので、あくまでインターネット上に置いておき、本当に見たい人が見れるという形にするスタンスなので、有料記事と

        ¥3,000
        • 【無限もじおこし】文字起こし元の音声が再生できるようになりました!(v1.0.4)

          時間無制限で、無料で使える文字起こしアプリ「無限もじおこし」のアップデート情報です! バージョンアップはこちらから↓ 以下、アップデート内容になります! 音声ファイルを再生・削除・共有が可能に要望の声として届いていた一つとして、文字起こしの元となっている音声を再生したり、保存できるようにして欲しい!という声がありました。 文字起こしされた内容が本当にあっているか あとから話した内容を振り返りたい 別アプリに保存できるようにしてほしい そこで今回のアップデートで、

        • 固定された記事

        時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。

        • 【無限もじおこし】文字起こしの処理の安定化を行いました!(v1.0.5)

        • 【有料公開】バズった「無限もじおこし」の宣伝効果と収支の現状

          ¥3,000
        • 【無限もじおこし】文字起こし元の音声が再生できるようになりました!(v1.0.4)

        マガジン

        • 「無限もじおこし」マガジン
          5本
        • 「シャべマル」マガジン✉️
          3本
        • microsoft / Guidanceの調査レポ
          8本

        記事

          (随時更新)「無限もじおこし」の新機能&バージョンアップ情報まとめ

          いつも「無限もじおこし」をご利用いただきありがとうございます! アップデート内容はこちらから一覧で確認することができます。 2024年10月28日文字起こし処理の安定化を行いました バックグラウンド処理の不具合を改修 文字起こし処理の失敗する確率を解消 音声検出精度の向上 2024年10月14日文字起こしの元となった音声ファイルを再生できるようになりました! 2024年10月9日・文字起こしの精度を向上しました! ・長時間の音声の文字起こしの不具合を解消しました

          (随時更新)「無限もじおこし」の新機能&バージョンアップ情報まとめ

          フィードバックを受けて、無限もじおこしをアップデートしました!(v1.0.3)

          ありがたいことに、以下の記事を中心に想像を超える反響がありました! この「無限もじおこし」では様々な経路で、利用者さんからのフィードバックをいただく接点を作ってます。それらを通して、ご利用いただいている方々から様々な声をいただきました。 こちらを踏まえまして、2024年10月9日にアプリのアップデートを行いましたので共有させてください! アップデートはこちらから↓ アップデート内容🙆‍♂️ 長時間音声の文字起こしを安定化 音声ファイルが1時間を超えると、文字起こし処

          フィードバックを受けて、無限もじおこしをアップデートしました!(v1.0.3)

          にょすです。生成AIなんでも展示会に出展します!

          4/21(日)本日、こちらのイベントに出展者として参加してきます! 気合を入れてチラシも作りました!💪 僕は「技術を日常生活の中に溶け込むような体験に落とし込むこと」にハマっており、そのコンセプトを主軸に制作活動をしてきました。今日の展示会ではそれらを展示しようと思っています! シャべマル:しゃべって丸投げメモアプリ「メモを取るという体験をもっと楽しく、もっと便利にできないか?」そんな思いからこのアプリの開発を始めました。 まず着目したのが、音声入力です。手書きやキー

          にょすです。生成AIなんでも展示会に出展します!

          Gemini 1.5 Proで文字起こしを試してみた

          Gemini 1.5 Proが音声ファイルにも対応したということで、Whisper大好きマンとして、どれほどのものなのかを簡単に調査したいと思います。 利用の仕方Vertex AIから利用ができました。Google AI Studioからも利用できるようです。詳細はこちら。 また今回検証する音声は以下のエネルギーに関する部分を利用します。 さっそく文字起こしを試してみるプロンプトによって出力結果に大きく影響がする感じがあります。まずは捻りのない感じでストレートなプロンプ

          Gemini 1.5 Proで文字起こしを試してみた

          音声合成モデルStyle-Bert-VITS2をサーバレスアーキテクチャでWeb API化する

          夢が詰まっているこちらのリポジトリを、Web APIとして立てて動かすための解説記事です。 この解説記事を書くにあたって、以下の記事を大変参考にしました。ありがとうございます!ただバージョンの違いがあったのか、これだけでは動かなかったため、補足という形で本記事は情報を補うものとしています。 概要サーバレスで動かすにあたって、今回はRunPod.ioを利用します。こちらでリクエストが来たタイミングでコンテナを立ち上げて、レスポンスを返すAPIを作ろうと思います。 また常時

          音声合成モデルStyle-Bert-VITS2をサーバレスアーキテクチャでWeb API化する

          某掲示板風のスレッド生成アプリ「ねらーAI」の今後の開発計画

          多くの方に遊んでもらっている「ねらーAI」ですが、現状まだまだ改善点があるので、継続的な開発を通じてより面白いアプリにしていきたいと思っています。 開発宣言をしておいた方が自分のモチベーションにもつながるので、現在課題として感じていることと、今後の開発計画についてまとめていきます。 今後の開発計画以下の優先度で対応していこうと思っています。 スレッドの内容の面白さを向上 続き生成の指示がより効くように 他ユーザーとの交流設計 面白いスレッドを見つけやすくする 内

          某掲示板風のスレッド生成アプリ「ねらーAI」の今後の開発計画

          Claude3を使った架空AI掲示板アプリ「ねらーAI」を開発しました!

          みなさん、Claude 3を使ってますか!? 2024年3月4日でたClaude v3シリーズですが、かなり日本語の性能が高いと話題です。僕自身もこれまではGPT-4を使っていましたが、Web版に関しては完全にClaudeに乗り換えてしまったくらい、使い勝手が良いです! さてTwitter界隈では、みなさんがClaude 3の使い方を模索していた訳ですが、中でも面白い使い方として盛り上がっていたのがこちらです。 (saipさんの投稿、いつもすごい好きです) というわけ

          Claude3を使った架空AI掲示板アプリ「ねらーAI」を開発しました!

          2chスレ生成タスクで、Claude3 Haiku, Sonnet, Opusを比較する

          Haiku APIが出たので、どこまでできるのか検証。 2ch風のスレを生成してもらってるのですが、Haiku APIも形式的には生成できそう。ただ実際の中身はどうなのか!?について検証してみます! プロンプトHaiku APIに合わせて、ある程度ちゃんとそれっぽいスレを生成してくれるようなプロンプトを作りました!こちらを使って、それぞれのモデルで試してみます! あなたは2chスレッド風のユーモアあふれる議論のスレッドを生成します。ユーザーから与えられたタイトルを元に、

          2chスレ生成タスクで、Claude3 Haiku, Sonnet, Opusを比較する

          「シャベマル」の英語版をリリース戦略と開発における学び

          音声から文字起こしをしてメモを作成できる「シャベマル」の英語版をリリースしました! この記事では英語版を開発するにあたっての学びや、仮説検証として考えていることなどをまとめていきたいと思います! 現在Product Huntに挑戦中です!💪 なぜ英語版を開発しようと思ったのかシャベマルは、音声でさくっとメモをすることができるメモアプリです。 高精度な音声認識(文字起こし)の機能と、文字起こし内容に対してタイトルや絵文字、カテゴリ分類などが自動で行うことで、ストレスフリ

          「シャベマル」の英語版をリリース戦略と開発における学び

          推しのプロンプト実験管理ツール「promptfoo」を解説

          最近、推したいプロンプト実験管理方法を見つけたので、そちらの紹介記事になります!これを見つけてから、めちゃ楽になりました! 前提「ん?実験管理?」と思う方もいるかもなので、軽く背景のところから共有したいのですが、システムに組み込むプロンプト作りは、すごい難易度が高いなーと思ってます。 何が大変かというと、求められる品質が高いからです! 出力形式が期待通りでないとシステムエラーになってしまう。10回中9回成功しても、それはエラー率10%なので安定とは言えない。 様々な要

          推しのプロンプト実験管理ツール「promptfoo」を解説

          OpenAI WhisperAPIのwordレベルでの文字起こしを試したみた

          こちらの投稿を見て、少し気になったので試してみました! 公式ドキュメントを読むこちらを参考にしています。 新しく `timestamp_granularities[]` というパラメータが追加されたようです(多分前は無かったはず)。ここで word と指定すると文字レベルで分割された文字起こし結果が出力されます。 また `response_format` を verbose_json にする必要もありそうです。 流石OpenAIといった感じで、ドキュメントの右側にリク

          OpenAI WhisperAPIのwordレベルでの文字起こしを試したみた

          生成AIによって「既存の仕事は代替されるが、新しい仕事が生まれる」ということに対して

          ここについて色々なレポートや本などを読みながら、思考を整理しています。 情報量が膨大な中で、また様々な意見があり、こういった思考を整理する際には「間違っていたとしても、あえて自分はこうだと思う」というスタンスを取ることが理解を深めるのに大事なステップだと思っているので、 忘れないように、2024年1月時点での、自分の考えのスタンスをまとめていきます。 スタンスChatGPTをはじめとした、生成AIの技術によって仕事は徐々に補完されていき、そこからさらなる技術的なブレイク

          生成AIによって「既存の仕事は代替されるが、新しい仕事が生まれる」ということに対して