shi3z

ハッカー / テクニカルエンスージアスト UberEats配達員(多忙のため休業中)

shi3z

ハッカー / テクニカルエンスージアスト UberEats配達員(多忙のため休業中)

ウィジェット

  • 商品画像

    検索から生成へ 生成AIによるパラダイムシフトの行方

    清水 亮
  • 商品画像

    教養としての生成AI (幻冬舎新書)

    清水亮
  • 商品画像

    マンガ-教養としてのプログラミング講座 (単行本)

    清水亮

マガジン

  • shi3z note

  • ど素人のLisp入門 進化計算のためのLLMとLisp

    進化計算のために今更Lispを真面目に勉強してみます。

  • shi3酒乱

    shi3zが酒乱となって世界の食と酒を堪能するッ!

  • 商品画像

    検索から生成へ 生成AIによるパラダイムシフトの行方

    清水 亮
  • 商品画像

    教養としての生成AI (幻冬舎新書)

    清水亮
  • 商品画像

    マンガ-教養としてのプログラミング講座 (単行本)

    清水亮

最近の記事

  • 固定された記事

学生起業で絶対に失敗しない方法(増補版)

増補版前書き 一年も前に書いたエントリが、昨日になって急に100部以上売れた。 東京藝大の八谷和彦先生がXで紹介してくれたおかげだろう。 一年前の内容であることと、僕自身もあの後会社を数社作り、最近はAIを社長にした会社(https://free-ai.ltd)を作ったりしていて、個人的にもアップデートがあるので今売れてることだし増補版を書くこととする。また、僕のnoteの特徴でもあるが、売れた作品には加筆し、その都度値上げし、以後絶対に値下げしないこととしている。従って

¥2,100
    • MacのOBSをMIDIパッドから操作するためのバッドノウハウ

      4KスイッチャーがわりにOBS Studioを使うことにしたのはいいのだが、キーボード操作ではいかにも味気ない。 ここはMIDIパッドを使ったらいいんじゃないの? ということでMIDIパッドからOBSを使うことにした。 ここでハマる。 まず、なぜかOBSのMIDI対応プラグインはMacで動かないと言われてるものが多い。 次に、最新のプラグインなら動くというわけでもなさそうだ。 というわけで吾輩は色々フォーラムを見てたどり着いたのは、OBS-MIDI-MG 2.3.0であ

      • A6000を入れた

        ドスパラの中古で買ったA6000を大沼さんに換装してもらった。 まあ不器用ですから、自分。 ドスパラの中古を買うのに昔は抵抗があった(主に大人気ないという意味で)のだが、流石にA6000を買いたくて貯金してるキッズはいないだろうから容赦無く買う。 やはりA6000くらいがバランスがいいんだよ。多分。 A100は高すぎるし扱いが難しい(特に冷却) A6000は48GBもVRAMがあるけどファンは内蔵してるし4090より小さいから取り回ししやすい。 AIにとってVRAMは正

        • NDIからMLX-VLMに接続して画面にどんなものが写ってるのかリアルタイムに説明させる

          NDIで遊べるようになった吾輩はいてもたってもいられなくなり、そのままアドレナリンが出っ放しの状態でなんとかNDIとAIをどうにかイングリモングリできないものかと思案した。 Ubuntuに入れようかと思ったのだが、NDIのライブラリがどうもPythonとのバインディングが微妙で上手く行かなかった上に、やはりUbuntu+GPUは高価すぎるのでもう少しセコいマシン構成が通用する世界観はないものかと色々考えた結果、MacBookのMLXを使うことにした。MLX便利だ。 そして

        • 固定された記事

        学生起業で絶対に失敗しない方法(増補版)

        ¥2,100
        • MacのOBSをMIDIパッドから操作するためのバッドノウハウ

        • A6000を入れた

        • NDIからMLX-VLMに接続して画面にどんなものが写ってるのかリアルタイムに説明させる

        マガジン

        • shi3z note
          515本
        • ど素人のLisp入門 進化計算のためのLLMとLisp
          2本
        • shi3酒乱
          134本

        記事

          4K配信スタジオを激安環境で実現する

          人生には全く意味のないことというのがいくつかある。 僕は中学の頃は放送委員会で、操作卓を操作するのが憧れだった。 僕の中学の放送設備は非常に充実していて、本格的な操作卓に防音のスタジオ、本格的なテレビカメラ、全教室へのテレビ放送システムだけでなく、各教室から放送室に映像を伝送する逆送システムまで備えていた。 ところがこの操作卓、本格的すぎて理解している先生が一人も残っていなかった。先生は愚か先輩も残っていない。 というのも、放送設備は「放送委員会」が管理するもので、この

          4K配信スタジオを激安環境で実現する

          動画生成AIをファインチューニングできるようになったようだ

          CogVideoXというのがApache2.0ライセンスでファインチューニングできるようになったみたいなので、自分のYouTube番組を学習させて動画を出してみた。 まあ全然違うんだが、デフォルトのCogVideoでは日本人男性出すことすらできないので胸のマイクとか髭とか、プロンプトで指定しなくても再現されているので、「寄せる」ことには成功していると言えるかもしれない。 StableDiffusionのファインチューニングと違って、まだどんなプロンプトを使って学習させれば

          動画生成AIをファインチューニングできるようになったようだ

          AIの発言を理解するために、量子力学の計算を勉強することにした。で、すごいいい本があった

          誰だ。AIが進化すると仕事が楽になると言ったやつは。 AIが勝手に金を稼いでくれて本人は遊んで暮らせるようになるはずとか言ってたやつは。もしくは全ての仕事をAIが奪ってしまって、人間はやることがなくなってしまうとか言ってたやつもいたな。 面白い。お前らが言ったことは実は全部間違ってる。まあ俺も言ってた気がするが。 AIが進歩すればするほど、これまで諦めていたことや、一生縁がないだろうと思っていたことを「やってみようかな」と思う機会が増えてしまう。ちょっと前までは絵を描く練

          AIの発言を理解するために、量子力学の計算を勉強することにした。で、すごいいい本があった

          AIに新しい数学体系を考案させてみた

          ChatGPTの新しいバージョン o1は、数学オリンピックの問題が解けるほど数学に詳しいらしい。 最近、僕は乱数の方が実数よりも重要なのではないかと思っていて、乱数テンソルを基準とした新しい数学的体系を作れないか、GPT-o1に考えさせてみた。 与えたプロンプトは「実数が表現できるのは現実世界に比べると非常に限定された範囲と考えざるを得ない。したがって実数よりも現実世界にある乱数のほうが遥かに大きいと考えられる。そこで、任意の階数を持つ乱数Tを中心とした新しい数学体系を定

          AIに新しい数学体系を考案させてみた

          ただでネットをクローリングしてJSON形式でデータを取り出す

          Crawl4aiは、LLM用のクローラーだ。内部ではSeleniumとlitellmを使用していて、任意のWebサイトから情報を抽出できる。 元々のサンプルはOpenAIのAPIを呼んでいたが、金がかかるし、APIの呼び出しリミットが来ると嫌なのでOllama+Reflectionでやれないか試したら、できた。 import osimport timefrom crawl4ai.web_crawler import WebCrawlerfrom crawl4ai.chun

          ただでネットをクローリングしてJSON形式でデータを取り出す

          アニメじゃない #ど素人のピュアオーディオ入門

          目が覚めると、俺はヴァン・ネス通りの安宿に居た。 多少の頭痛。おかしいな。白ワインで頭痛がするほど飲んだことなんか一度もないのに。 昨日の記憶がはっきりしない。無人運転のタクシーで釣り人の埠頭を冷やかしたあと、ポーク通りの仏越料理でベトベトの蟹を食い、ワインを部屋に持ち込んで・・・。 そうか、あいつをほったらかしにしてそのまま寝てしまったのか。 寝ぼけ眼のまま配信をする。これはもう日課みたいなもので、俺の唯一のルーティン化された仕事でもある。デイリーAIニュース。今日

          アニメじゃない #ど素人のピュアオーディオ入門

          LLama3.1-70BをReflection化するReflectionプロンプトを試す/ついでにTanuki-8Bでも試してみる

          Reflection的なやり方はシステムプロンプトを変更するとできるそうで、Llama-3.1:70Bにシステムプロンプトを設定してやってみた。 設定すべきプロンプトはこれ You are an AI assistant designed to provide detailed, step-by-step responses. Your outputs should follow this structure:1. Begin with a <thinking> sect

          LLama3.1-70BをReflection化するReflectionプロンプトを試す/ついでにTanuki-8Bでも試してみる

          Reflection-70BとLlama-3.1-70Bを比較する

          Llama3.1をファインチューニングして性能がすごく良くなったという「Reflection-70B」だが、実はLlama3.1ではなくてLlama3をファインチューニングしたのでは?という疑惑もある。 まあとりあえず百聞は一見に如かず、なので触ってみることにした。 Reflectionの特徴は、その名の通り「反射」という仕組みによって自己批判的に推論していくこと。 まずはReflection-70Bに日本のアニメ産業について聞いてみた。 <thinking></thin

          Reflection-70BとLlama-3.1-70Bを比較する

          大西洋上空38000フィート

          気がつけばシカゴまで二時間半の距離に来ていた。 初めて乗ったオーストリア航空の大陸間横断便のキャビンは日経航空会社に匹敵する快適さだ。飯もうまい。 まもなくアメリカ合衆国の領空に到着すると思うと、長い旅が終わりに差し掛かっていることを感じる。奇妙なものだ。まだ故郷まで地球を半周するほどにも距離があるというのに。 ウィーンでダウンロードしておいた漫画はあらかた読み終わってしまった。VisionProにしこたま溜め込んでいた映画も見終わった。 機内WiFiに接続するとAI関

          大西洋上空38000フィート

          ど素人のLisp入門#2 MacでTanukiのローカルLLMを呼び出して結果を取得する

          進化計算のためにいよいよ40年の刻を超えてLispを多少真面目にやろうかなと思っている今日この頃。 なぜ#1がないのに#2からやるのかというと、#1であるべき入門について書くのは本当に面倒なので、前回の記事を参考にしていただきたい。 このマガジンではsbclとMacを基本的に使うものとする。 まず、吾輩は世界を放浪中のため、できれば電波のいい環境でローカルLLMでやりたい。そこで東大松尾研が作った日本最高峰(現在)のオープンかつローカル動作するLLMであるtanuki-8

          ど素人のLisp入門#2 MacでTanukiのローカルLLMを呼び出して結果を取得する

          あの日見たベルギーワッフルの味を俺はずっと知らない

          先週はブリュッセルに居た。 言わずと知れたEUの本拠地である。 言わずと知れたとは言ったが、EUの本拠地がブリュッセルであることはブリュッセルに到着してから知った。 なるほど大都会であって、Uberが縦横無尽に走り、ベルギービールとベルギーチョコレートとベルギーワッフルがお友達。そんな感じの街だった。 特にあちこちどっちを見てもショコラティエの通りがあって、各店舗シノギを削っていた。ここはチョコのラジオデパートや! さらに、やはりベルギーといえばワッフル。 実は吾輩、ワ

          あの日見たベルギーワッフルの味を俺はずっと知らない

          進化的プログラミング超入門 108行でわかる / ど素人のLisp入門#1

          進化計算が流行ってる。昨日NVIDIAから150億円相当の出資を受けたSakana.aiを筆頭に、進化計算ベンチャーとでもいうべきカテゴリーが生まれつつある。僕が創業に関わったギリア株式会社も、Ghelia Spectreという進化計算ソリューションによるビジネスを数年前から展開している。 進化計算の重要な点は、原理はともかく極めて有効であることがわかっていることだ。しかも恐ろしく強力なのである。 これから先、進化計算の重要性はますます上がってくる。僕が単なる人工知能の研

          進化的プログラミング超入門 108行でわかる / ど素人のLisp入門#1