最近の記事

AI進化論と現在地 - 汎用人工知能への過程:AIエージェント

OpenAIが提唱するAIの5段階進化論OpenAIは、AIの進化を5つの明確なレベルに分類することで、私たちの現在地点と、目指すべき未来への道筋を示しています。 レベル1:チャットボット - 対話の入り口 現在、最も身近なAIの形態であるチャットボットは、AIの進化における第一段階として位置づけられています。初期のChatGPTやSiri、Alexaなどがその代表例です。ただし、このレベルのAIは複雑な問題解決や創造的な思考には限界があります。 レベル2:推論者 -

    • 意志力の本質と生成AIによる意志力の節約

      参考文献『意志力の科学』- ロイ・F・バウマイスター、ジョン・ティアニー著 こんにちは!今回は、私たちの日常生活に大きく影響する「意志力」について、生成AI時代における効果的な活用法を考察します。 🤔 意志力って実は限られた資源だった私たちは毎日、様々な場面で意志力を使っています。 朝早く起きる 仕事に集中する 運動を継続する 食事を制限する など... 実は、これらすべての行動に使われている意志力は「同じ1つの資源」なんです。 意志力の4つの重要な特徴

      • 再生

        Claude Computer Use でDifyのDSLエクスポートの自動化?

        Claude Computer Use でDifyのDSLエクスポートの自動化の実験。 # 前提 ・Difyのユーザーとパスワードは実験用に一時的に変更 ・制限時間を超えるため、ログイン処理とバックアップ処理で2回に分ける ※補足:念のためあえて画質を落とし、識別情報はマスクをかけているため少し見ずらいです。 # 観点 〇画面表示は英語だが日本語で指示しても対応可能か? 〇カーソルを合わせないと見えない3dotボタンを認識できるか? 〇「アプリケーションブロックがマス目状に並んでいる」状態を認識できるか? # プロンプト ## 1回目:ログイン処理 ``` 以下のタスクを実行してください。 1. ブラウザを起動する。 2. 「https://[Difyサーバドメイン]/apps」に接続する。 3. email addressに [ユーザアカウント] を入力し、passwordに [パスワード] を入力する。 4. sing inする。 ``` ## 2回目:バックアップ処理 ``` 1. パスワードの保存について聞かれた場合は、「保存しない」を選択してください。 2. 左上にアイコンが表示された四角いブロック単位に複数のアプリケーションが表示されているので、それぞれのアプリケーションに対して、2-1から2-3を順番に行ってください。 2-1. アプリケーションブロックの右下にカーソルをもっていくと3dotボタンが表示されます。 2-2. 3dotボタンをクリックするとメニューが表示されるので「DSL をエクスポート」を選択してください。それによりDSLファイルがダウンロードされます。 2-3. 今選んだアプリケーションのブロックとは別のブロックに対して2-1から実施してください。 ``` # 結果 〇プロトタイプということで速度はもっさり、精度もそこそこ、時間制限でちょくちょく落ちる。 〇とはいえRPAのような座標指定が不要で、あいまいな自然言語による指示でも段階的に考えながら対応してくれているのがすごい! 例: ・通常見えない3dotボタンを探し出してくれる。 ・(制限時間で連続性の確認は出来なかったが)次のアプリケーションブロックが右となりということはちゃんと認知してくれた。 ・3dotボタンの右にある「タグを追加」がまちがって表示されてても、そのあと3dotボタンをちゃんと選択してくれた(1回目の動作の記憶?) #まとめ DSLのバックアップ自体は現時点では手で取った方が早いですが、そこは単に得意不得意があるというだけ。 そんなことよりも、RPAでは感じられない「リモートでつながっている仕事のパートナー感」がすごいです。 「ちょっとこれやっといて。終わったらおしえて」みたいなことが普通にできそうです。ちょっと感動します。 安全性の課題はまだありそうですが、これがリリース時点でどのようなかたちになるか、今から楽しみです!

        • Markdown×LLMで実現する開発ドキュメントの提案

          なぜ今、Markdownなのかエンジニアの皆さん、こんにちは。 毎日のように更新される要件定義書やプロジェクト文書の作成に、頭を悩ませていませんか? 今、個人的に「Markdown + LLM」という新しいドキュメント作成手法に注目しています。この組み合わせは、以下のような悩みが一気に解決できる可能性を秘めていると考えています。 📝ドキュメント作成に時間がかかりすぎる 🔄 バージョン管理が面倒 👥 チームでの共同編集がスムーズにいかない 🤖 AIツールとの連携がう

          誰でも見れちゃう!?Difyアプリを守るNginx認証テクニック

          はじめに「作ったDifyのアプリのURLがばれて知らない人に使われちゃうか心配...」 そんな悩みを抱えているDifyユーザーの皆さん! 実は、Nginxの機能を使えば、あなたのDifyアプリで、簡単にパスワード認証(Basic認証)が実装できるんです。 今回は、NginxのBasic認証を使って、Difyアプリにアクセス制限をかける方法をご紹介します。 以下の記事を参考にさせていただきました。 注意点「アプリごとにユーザを設定する」方法ではありません。 補足:アプリ

          誰でも見れちゃう!?Difyアプリを守るNginx認証テクニック

          (備忘)Dify - 証明書期限切れで「保護されていない通信」となった話(Let's Encrypt)

          補足: わたしはセルフホストでLet‘s Encryptを使ってhttps化しています。 Xserver VPSのアプリイメージからhttps化されている場合はXserverの実装に依存しますので、この限りではありません。(もしかしたら証明書自動更新のしくみが備わっているのかもしれません) はじめに 0.9.1 fix-1 への更新後、Difyにhttps接続したところ「保護されていない通信」となってしまうという事象が発生。 一瞬「あれ?バージョンアップで何か失敗したかな

          (備忘)Dify - 証明書期限切れで「保護されていない通信」となった話(Let's Encrypt)

          速攻で最新技術をインプット!Felo翻訳で海外動画をフル活用

          はじめに新しい技術やトレンドは、海外で先行して発信されることが多く、最新の情報をキャッチするには海外のコンテンツをチェックするのが効果的です。しかし、言語の壁や専門用語の多さから、理解が難しいと感じる方もいるでしょう。そこで活用したいのが、Chromeの拡張機能「Felo翻訳」です。この記事では、Felo翻訳を使って海外の動画コンテンツから効果的に最新情報を収集・学習する方法をご紹介します。 Felo翻訳とは?Felo翻訳は、Chromeブラウザで利用できる拡張機能で、Yo

          速攻で最新技術をインプット!Felo翻訳で海外動画をフル活用

          (備忘)Dify Update「no space left on device」エラー

          経緯Difyのアップデート(0.8.3 -> 0.9.1)を実施後、docker compose up -d にて起動中に「no space left on device」(デバイスに空き領域がありません)というエラーが発生。 記事の目的「やったこと」と「結果」の共有であり、「解決手段」の提供ではありません。実施においては個人の責任と判断でお願いいたします。 情報収集まず以下サイトを参考にさせていただきました。 参考情報 この情報から、同メッセージには以下の2パターン

          (備忘)Dify Update「no space left on device」エラー

          DifyでTeratermマクロのRAG構築

          はじめにTeratermマクロというニッチな(かつクセつよなコード)を、汎用的な生成AIでコード生成すると、ハルシネーションがおきまくります(経験測)。Difyのオープンチャットでお聞きしたところ、Cursor にコマンドリファレンスのドキュメントを渡してコード生成をされている方が多いようでした。 せっかくなので、DifyでRAGに出来たらいいなっていうのがきっかけで作ってみました。 参考にしたワークフローDiscordのDify.ai 公式サーバのチャンネル「workf

          DifyでTeratermマクロのRAG構築

          Genspark Autopilot Agent で「アナログ規制見直しの取組」後の需要考察

          はじめにうわさのGenspark Autopilot Agentを使って、Dify公式アンバサダーであるSangminさんも注目しているデジ庁の「アナログ規制見直しの取組」がどのような需要につながるのか?について考察してもらいました。 Genspark Autopilot AgentについてGensparkで記事にしてみました。 そのうえで「こちらの記事わかりやすくて参考になります」って書こうとしたら、以下記事がGensparkで作った記事の情報ソースになってました笑

          Genspark Autopilot Agent で「アナログ規制見直しの取組」後の需要考察

          STEP4. Dify WebApp × 認証機能の統合

          はじめに今回は、以前に以下の記事で検証したアプリの機能をマージして「認証機能付きのチャットアプリ」にしてみます。 (以前書いた記事の続編になります) ※STEP1 は本記事の前提ではありません。 前提Supabaseの登録含め、前述の「Next.js+Supabaseで認証機能の実装」と「Next.js × Vercel × Dify:WebAppでフロントエンドアプリ作成」の実装が完了していること。 Next.jsの機能統合などナレッジ共有が目的であり、完全なアプリの提

          STEP4. Dify WebApp × 認証機能の統合

          生成AIのAPI利用で再学習はされないのか?

          前提今回APIを対象として整理をしました。そのためGUIで使うサービスは含みません。 たとえばChatGPTのブラウザ版は有料版でも学習させないためにはオプトアウト設定が必要ですし、無料版のcopilotなども学習される場合がありそうです。 はじめに先日、オープンチャットで興味深い質問がありました。「生成AIのAPIを使へば、本当にLLMの再学習に利用されないのか?」というものです。この疑問は、多くの人が抱いているものの、明確な答えを見つけるのが難しい話題です。そこで、この

          生成AIのAPI利用で再学習はされないのか?

          STEP3. Next.js × Vercel × Dify:WebAppでフロントエンドアプリ作成

          はじめにVercelは、Next.jsの開発元であり、Next.jsとの親和性が非常に高いホスティングプラットフォームです。また最近、Vercelで提供されているV0もプロダクト生成で注目を集めています。 GitHub、Vercel、それと公式から提供されているNext.jsで作成されたWebAppテンプレートを組み合わせてDifyのフロントエンドを開発する手順を解説いたします。 アーキテクチャーイメージ 完成後のイメージ ほぼDifyで見る画面と同じですが、ベースはN

          STEP3. Next.js × Vercel × Dify:WebAppでフロントエンドアプリ作成

          GitHub × Next.js × VercelでDifyのフロントエンドを作るメリット

          はじめにVercelは、Next.jsの開発元であり、Next.jsとの親和性が非常に高いホスティングプラットフォームです。また最近、Vercelで提供されているV0もプロダクト生成で注目を集めています。 GitHub、Next.js、Vercelを組み合わせてDifyのフロントエンドを開発するメリットと、それがどのようにGitHubやNext.jsと連携しているかを詳述します。 実際の作成手順については以下記事をご参照ください。 シームレスなデプロイメント自動デプロイ:

          GitHub × Next.js × VercelでDifyのフロントエンドを作るメリット

          STEP1. Xserver × Dify:AIチャットボットの自作環境をつくろう!

          AIチャットボットが身近になった今、自分だけのAIアシスタントを作ってみたいと思いませんか? そんな夢、実は意外と簡単に実現できるんです。 今回は、多くの方に馴染みのあるXserverと、AIアプリケーション開発プラットフォームのDifyを組み合わせて、オリジナルのAIチャットボット環境を構築する方法をご紹介します。 技術の進歩により、かつては専門家だけのものだったAI開発が、今や個人レベルでも手の届くところまで来ています。このガイドを通じて、まずはAIアプリケーション開発

          ¥300

          STEP1. Xserver × Dify:AIチャットボットの自作環境をつくろう!

          ¥300

          インフラエンジニアの生成AI活用術

          インフラエンジニアの皆さん、生成AIの波が押し寄せる中、こんな悩みを抱えていませんか? 普段の業務で生成AIを使う機会がほとんどない クライアント先ではパブリックな生成AIの使用が制限されている そもそも生成AIの有効な使い方がわからない 確かに、インフラエンジニアの業務において、一般的な生成AIツールの活用は難しい面があります。セキュリティ上の制約や、専門的な知識が必要な場面が多いためです。 しかし、適切な方法を知れば、生成AIはインフラエンジニアの強力な味方にな

          インフラエンジニアの生成AI活用術