木村たろう

現在、某ユーザ企業の情報システム部門、いわゆる「情シス」に所属。 以前はソフトウェア会社に勤務をしてプログラミングやプロジェクト・リーダーなどをやってきたが、また歳もとってきており、ソフトウェア開発で働き続けることに未来への漠然な不安から現在の会社に所属。

木村たろう

現在、某ユーザ企業の情報システム部門、いわゆる「情シス」に所属。 以前はソフトウェア会社に勤務をしてプログラミングやプロジェクト・リーダーなどをやってきたが、また歳もとってきており、ソフトウェア開発で働き続けることに未来への漠然な不安から現在の会社に所属。

最近の記事

  • 固定された記事

ローカルLLMの進化:Llama3.2で特許検索システムを再構築!

はじめに今回は、「ローカルLLM」にリベンジします。以前、ローカル環境にLLMを構築した際、その過程を記事にまとめました。しかし、結果として応答に10分以上かかることが多く、実用には程遠い状況でした。(記事公開後も再度トライしてみましたが、1時間以上応答がないことも珍しくありませんでした…) 諦めかけていたところ、@coitateさんの投稿を見て、もう一度挑戦してみることにしました。Meta社からLlama3.2が発表され、さらに軽量化されたという記事を読んだからです。@c

    • YOLOで6枚の画像から奇跡の6,144枚データ拡張とその壮絶な結末

      はじめに先日、YOLOを使用して10ファイルほどの画像を元にアノテーションファイルを作成し、自分で「重み付けファイル」を生成しました。その後、「学習」「検証」、そして最終的に「検出」を実施しましたが、期待していたような結果を得ることができませんでした。 その主な原因として、画像データの圧倒的な不足が挙げられます。 この記事では、画像ファイルとアノテーションファイルを自動生成してデータを増やし、改めて「学習」「検証」「検出」に挑戦しました。 データ拡張この記事を書く過程で初

      • Replitで10分でWebシステムを作ろう

        はじめに冒頭のカレンダーですが、私はほぼ毎日ジョギングをしており、その履歴を紙のカレンダーに記録しています。「走」はジョギングをした日を表し、その横に記載している数字は体重です。「飲」は夜にお酒を飲んだこと、「筋」は筋トレをしたこと、「外」は外食をしたことをそれぞれ示しています。外食をした翌日は、たいてい体重が増えてしまいます💦 このように紙のカレンダーに記録しているものの、体重の増減をグラフで視覚的に確認したくなりました。そこで、毎日Webシステムに体重を登録し、それをグ

        • 水入り?空っぽ?コップの中身をYOLOが画像判定!

          はじめに皆さん、突然ですが「このコップ、水が入っているのかな?」と考えたことはありませんか?私はといえば、家にいるときや作業中、ふと目の前のコップを見て「水が入っているか、空なのか」が気になることがあります。そして、あるときQiitaの記事を読んでいて思いつきました。 「これ、機械に判断させることってできないのかな?」と。 今回の挑戦はそんな日常の疑問から始まりました。さらに、以前見た`Raspberry Pi`の自動餌やり機の記事がヒントになりました。家で飼っているハム

        • 固定された記事

        ローカルLLMの進化:Llama3.2で特許検索システムを再構築!

          ディスプレイ切替で毎回ウィンドウが大暴れ!? そのイライラを一発解消する方法!

          はじめに 現在の職場では、私は軽量なモバイルPCを持ち歩き、打ち合わせなどに参加しています。モバイルPCは持ち運びに便利な反面、ディスプレイが小さく、複数のウィンドウを開くと画面がすぐにいっぱいになり、ウィンドウが重なることも多々あります。  会社ではこの点を配慮し、デスクには大きな外部ディスプレイを設置しています。そのため、デスクで作業するときには、2画面で作業ができ、効率も数倍向上するとの話を書籍で目にしたこともあり、とても快適に仕事を進められています。  一方で、打

          ディスプレイ切替で毎回ウィンドウが大暴れ!? そのイライラを一発解消する方法!

          会社の資料を今すぐDifyで要約しよう!

          はじめに最近、Qiitaに投稿される記事を見ていると、「Dify」という単語をよく目にするようになりました。記事の内容から、自分のPC上でChatGPTのような「チャットボット」を簡単に作成できるツールのようだと感じたため、今回はDifyの構築方法や操作感について確認してみることにしました。 DifyのインストールDifyのインストールと環境設定は、公式サイトの以下のページを参考に進めました。 https://docs.dify.ai/ja-jp/getting-star

          会社の資料を今すぐDifyで要約しよう!

          Ollamaによるチャンクサイズとモデル精度の関係を検証

          はじめに@SNAMGNさんより「チャンクサイズ」が回答精度に影響する可能性があるとのご指南をいただき、貴重なアドバイスをもらいました。この場を借りてお礼申し上げます! また、前回の記事の公開後、「1か月以内に新しい記事を出す」と宣言していたので、何とかまとめることができてよかったです。 前回の記事: 実は、今回は自分のPCのGPUをフル活用して処理を高速化する予定でしたが、残念ながらうまくいかず、結局CPUのみでの処理となっています。 GPU利用に失敗した記事: 私

          Ollamaによるチャンクサイズとモデル精度の関係を検証

          GPUサポートに挑戦!Ollamaの処理速度向上を目指すWindowsセットアップガイド

          はじめに現在、自分のPCでOllamaを使用し、複数モデルの「処理速度」と「回答精度」に関する記事作成のため、朝から晩までフル稼働させています。PCも全力で処理をこなしているため、内蔵ファンの「ガーーー」という音が常に響いています。その結果、今朝は「電子レンジ」と「魚焼き機」を同時に使った際、普段は落ちないブレーカーがついに落ちてしまいました💦 そんなわけで、少しでも処理を速くしたいと思い、「GPUはどのくらい活用されているのだろう?」と気になり、確認してみることにしました

          GPUサポートに挑戦!Ollamaの処理速度向上を目指すWindowsセットアップガイド

          クラウドソーシングのデータ入力を自動化する:PythonとSeleniumによる効率化の実践

          はじめに最近、クラウドソーシングで様々な案件を探している中、「データ入力」の案件に出会いました。生成AIを使えば、迅速かつ低コストで対応できるのではないかと直感しました。 そこでPythonを使った自動化プログラムを検討しましたが、Webブラウザの画面遷移で別タブに移動したり、モーダルウィンドウが表示されたりといった動作があり、実現が難しいと感じ、今回は断念しました。 しかし、クラウドソーシングには、BYMAやeBayなどのECサイト向けのデータ入力作業が多く依頼されてい

          クラウドソーシングのデータ入力を自動化する:PythonとSeleniumによる効率化の実践

          特許情報を用いたOllamaモデルの性能評価:llmとEmbeddingの違い

          はじめに以前、私の投稿でOllamaのllmモデルとembeddingモデルを使って、自分のPCでRAG(Retrieval-Augmented Generation)を実現したことについて書きました。 その後、@SNAMGNさんから貴重なアドバイスをいただき、Ollamaにはさまざまなモデルが存在することを教えていただきました。私自身も確認したところ、確かに多くのモデルがあることがわかりました。 そこで今回は、Ollamaに登録されているllmとembeddingモデル

          特許情報を用いたOllamaモデルの性能評価:llmとEmbeddingの違い

          Doxygen+gpt-4o+Neo4jによるシステム構成図自動化

          はじめにシステム開発者であれば、一度は「システム関連図」を自動化できないかと考えたことがあるはずです。私も、過去の投稿記事でPDFや画像認識を使って自動生成できないか試みましたが、精度や汎用性に限界を感じました。最終的に、Excelのシェープ(円や四角)を利用して関連性を基づき作図する方法に行き着きました。結果としては十分な精度が得られたものの、シェープ同士の関係性を手作業で定義するのは非常に手間がかかり、現実的ではありません。 過去の試行錯誤については、以下の投稿記事にま

          Doxygen+gpt-4o+Neo4jによるシステム構成図自動化

          HeyGenで次世代動画制作を実現!Pythonで一気通貫の自動化に挑戦

          はじめに先日、HeyGenを使ったAPI活用法を紹介しましたが、今回はさらに進化させてみました。Curlを使ったAPIコールで、自由自在にアバターを作成するだけでなく、Pythonを使って一気通貫で動画を自動生成できるように挑戦しています。 これにより、手元にある「アバター」と「音声」さえあれば、あとは指定したスクリプトをアバターが代わりに読み上げてくれる!もう、面倒な編集作業に悩まされることはありません。AIアバターが、あなたのコンテンツを24時間365日サポートしてくれ

          HeyGenで次世代動画制作を実現!Pythonで一気通貫の自動化に挑戦

          生成AIを活用したアバターの可能性: HeyGenで未来のインタラクティブ体験を試す

          はじめに最近では、生成AIを活用したさまざまなサービスが続々と登場し、これらを組み合わせることで、今は想像もつかないような革新的なアイデアが生まれる可能性を感じています。今回はその中でも、HeyGenというサービスを試してみたので、ご紹介します。 HeyGenは、撮影した動画や音声データをもとに、AIがアバターを通じて発話したり、インタラクティブな対話が可能になるプラットフォームです。私は特に、将来的にコールセンター業務などをアバターを使ったチャット形式に置き換えることで、

          生成AIを活用したアバターの可能性: HeyGenで未来のインタラクティブ体験を試す

          Neo4jの自前構築に挑戦 - 無償版期限切れの対応

          背景・目的以前投稿した記事では、グラフ描画にNeo4j Auraを使用していましたが、無償版の有効期限が切れてしまい、サービスを利用できなくなりました。そこで今回は、Neo4jを自前で構築し、運用することにしました。また、以前の記事では実現できなかった、作成したグラフに対してChainlitで質問を行う機能にも挑戦してみました。 参考にした記事はこちらです: これらの記事では、Neo4jの環境構築からPDFファイルをグラフ化する方法、そしてChainlitを利用した質問応

          Neo4jの自前構築に挑戦 - 無償版期限切れの対応

          PowerShellを駆使してQiita閲覧数を効率化!作業時間30万円分を節約する自動ツール

          はじめに 「夏が過ぎ 風あざみ 誰の憧れに彷徨う」――これは井上陽水の「少年時代」の冒頭の一節ですが、それを思わせる美しい風景画像を見つけました。(うっとり) ただし、この風景画像はAIが生成したものです。これに限らず、AI技術の進化には本当に驚かされます。企業においても、こうした技術を早く導入しないと、気がつけば「コダック」や「シアーズ」、「ブラックベリー」のように時代に取り残されてしまうのではないかと感じています。  さて、脱線はここまでにして、今日はWindowsだけで

          PowerShellを駆使してQiita閲覧数を効率化!作業時間30万円分を節約する自動ツール

          一気通貫で実現するLlama3.2: ローカルLLMとローカルEmbeddingの構築

          はじめに前回、自宅のPCに軽量な「オープンLLM」であるLlama3.2を導入し、その性能を確認しました。レスポンスもまずまずで、緊急性の低いプロジェクトであれば十分に活用できることが分かりました。これは非常に喜ばしい結果です。 ただ、これだけでは「自前のRAG」を作成するにはまだ不十分です。もう一つ必要なものがあり、それが「embedding」です。これは文章をベクトル化する技術で、クラウドサービスではすでに利用可能ですが、オンプレミス環境でのオープンソースによる情報はな

          一気通貫で実現するLlama3.2: ローカルLLMとローカルEmbeddingの構築