今週の「学び」と「アウトプット」について

2024年11月22日 21:30

早速、Guitar Tunerを使った(11/15)

エレガットギターのチューニングに使ってみた。音がエレキギターに比べて大きいので比較的、チューニングがしやすかった。

Geminiの使い方を知りたい(11/16)

真面目な話、Geminiを使いこなせていない可能性がある。
よく分からんが、スコアが高い事をアピールされるとまじかよと思うのだが、何が得意で何が不得意なのか、ユーザーによって行動も違うので、分かっていない可能性はあるなと思い、ガイドを改めて読んでみようかな？

今、議論されているGeminiのモデルというのは何か？(11/17)

現在、Gemini1.5 flashを使用しているが、皆が議論しているのはこのモデルではないってことか？

Google最新モデルgemini-exp-1114が無料でhttps://t.co/DRhGYEJdVjで使えます。今日出ました。またベンチマークで総合世界1位をChatGPTから取り戻しました。UIもAPIも使い倒してください。 pic.twitter.com/AujJm0KWss
— シェイン・グウ (@shanegJP) November 15, 2024

なるほど、皆、この辺りのことを議論しているのだな
確かに少しだけプロンプトを読ませてみたがコードを書けていた

三目並べの例↓

どのモデルで議論しているのかはハッキリさせた方がいいな。自分もハッキリさせていこう。Gemini Liveは何が採用されているのだろうか？(Gemini Flash?)

Newというタグが付いていたものを列挙してみる

Gemini 1.5 Pro 002
Gemini 1.5 Flash 002
Gemini 1.5 Flash-8B
Gemini Experimental 1114

APIコンテストの開発時以降、ai studioを開いていなかったので自分が知らなかっただけで、モデルがめっちゃ増えていた。恐らく、最新版のモデルの議論を皆がしているのかな

他にも試したが、Google先生は急いで対応することはないのだけど、回路図が自分が素人すぎるのかソフトウェアで読み込める形に落とせなかった。CircuitJS1という指定がまずかったのか？

今度、ChatGPTの件も含めて、数学の問題を解いてみてもらおうかな

人はどういう前提で語っているのかを他人がその人の文面から理解できているとは限らないから、もしかしたら、前提をこちらが理解してあげられれば、言っていることをある程度、理解を示せるのかもしれない

他人の餅で成り上がらない

先週は注目記事に選ばれた。アレはAIで文書は書いておらずハンドメイドだ。小豆島というリソースを活用した感想なので他人の餅を使っているかもしれない。しかし、自分のことを語らず、他人のモノをネタに上げてヒットを稼ぐやり方はどうにも好きにはなれない。だから、自分の手でしたこと（オブジェクト）に対して評価を受けられたことはとても嬉しかった

ITというのは無形資産であるから余計に取り扱いが難しいのだけど、本当に自分が使うから記事にしているのか、それとも一過性（もちろん僕にもあるけど実際には自分で使おうとはせず、宣伝）で終えるのかによって話は変わってくる。宣伝というのはよく見せようという心理が働くので、自分の意思を反して行動してしまう部分があるのではないか。いずれにしても、何がその人にとって役に立って良かったのかという記事は自分は価値があると思うが、ただの宣伝で終わる記事は自分にとっては価値がないと思っている。著者の気持ちはどこにいった？と思ってしまうからだ。どうしても、ユーザーサイドでモノを見たくなる。一方でインプレゾンビとか、XのIT周りの青マークの人達に何か騙されているのではないかと思って信用できない。目的がそれぞれ違うのはいいので否定はしないけど。自分にとってはノイズである。一方で俺みたいなのは、宣伝屋さんにとってはノイズなんだろうなとも思わなくもない。まあ、それぞれがいいと思ったことをすればいいだけなのだが。

すげー、地道な道だけど、いつか振り返ったときに自分の資産として残るもの（作品）を残して行きたい。そして、それは自分にとって自信を持って満足のいくものだったと思えるようにしたい。

そして、僕は他の誰でもないあなたのストーリーが知りたいのだ
必ずしも自分が作ったサービスやモノでなくてもいい。それを受けて等身大のあなたはどう感じて、自分にどう役立てたい、役立てたのかを知りたいのだ。そこには必ず、自分の心理が含まれるはずだ。それは、似たような考え方の人達はたくさんいたとしても、間違いなくあなただけのAIではない回答であると思う

AIで濫造は出来ても、異なる点は己の心だ

音声ファイルを文字起こしして翻訳する(11/16)

Claudeからメールを確認したら、anthropicのceoがインタビューを受けたので見てね（意訳）て来たので音声データ(約、５時間15分）を確認した。

まだまだ、英語をそのままは聞いても理解できないと思ったので文字起こしをして、翻訳するという行為を取ろうとした

metaのnllbを使ったのだが、Claude先生とざっくりやり取りをしていたら、tokenizerのtoken処理が思った以上に難航したので、whisper largeで抽出した文字をtxtに保存して、HTMLに表示する戦法に切り替えた

ただ、色々とボケていたのだが、音声ファイルだけ公開するはずないだろうなと思ってはいたので、もう少し作業する前に疑うべきだった

Youtubeのリンクも、スクリプトも公開されていたのだ
アホすぎだ自分

Youtubeの翻訳できるじゃんとorz

今、思うと文字起こしの分量て取れていたのだろうか。色々と振り返られないと。どう証明するか

1時間〜2時間程度の視聴

何というか見ている視点が違った。大概、日本のスパムの様な無価値な広告にうんざりするが、各SNSのプレミアムに入れば解決する話なのか。何というか、ビジネス転用にとかって謳い文句の広告が多いわけだけど、全く持ってレベルが低過ぎる話題であるように感じられた

例えば、AIを使ってプログラミングの問題を解くというのも次元が低い問題の様に感じた。つまり、一例に過ぎないと

同時にAIに対して広告的なものの見方しか出来ていなかったことを反省した。

3.5とか4とかの名付けは微妙じゃない？（こちらの解釈）って話も良かった。スクリプトはこちら

私たちは誰にも知らせずにモデルの重みを変更したことは一度もありません。もちろん、現在の設定では、そうすることは意味がありません。ただし、時々行うことがいくつかあります。1 つは、A/B テストを実行することですが、これは通常、モデルのリリースと非常に近い時期に、ごく短時間で行われます。

新しい Sonnet 3.5 のリリース前日、もっと良い名前にすべきだったと思います。名前で呼ぶのは不格好です。かなり良くなったというコメントもありましたが、それは 1 日か 2 日、A/B テストに少し触れたからです。もう 1 つは、システムプロンプトが時々変わることです。システムプロンプトには何らかの影響がありますが、モデルを低機能化することはまずありませんが、さらに低機能化することはまずありません。

モデルの大部分は変化していない話
あなたの問いかけ次第で変化が得られるかもしれないよ？ってことか

そして、私が非常に完全なものとして挙げているこの 2 つのことは、非常にまれにしか起こらなかったものの、モデルの変更に関する私たちや他のモデル会社への苦情、モデルがこれに対して不適切である、モデルがさらに検閲される、モデルが低レベルになった、といった苦情が寄せられました。こうした苦情は絶えず寄せられており、人々がそれを想像しているなどと言うつもりはありませんが、モデルは大部分において変化していません。もし私が理論を提示するなら、それは実際に私が前に述べたことの 1 つに関連していると思います。つまり、モデルは非常に複雑で、多くの側面を持っているということです。そして、多くの場合、モデルに質問すると、「タスク X を実行してください」と尋ねるのと、「タスク X を実行できますか?」と尋ねるのとでは、モデルは異なる方法で応答する可能性があります。したがって、モデルとのやり取り方法を変更することで、非常に異なる結果が得られる可能性がある、あらゆる種類の微妙な点があります。

"Machines of Loving Grace"、wikipedia先生を見たら同名の書籍や同名の曲があるようだ。そこからタイトルを取ったのかな・・・

大げさなことは避けてください。多くの AI リスク公人 (AI 企業のリーダーは言うまでもありません) が、AGI 後の世界について、まるで人々を救済に導く預言者のように、それを独力で実現することが自分たちの使命であるかのように語る様子に、私はうんざりすることがよくあります。企業が一方的に世界を形作っていると見なすのは危険であり、実用的な技術目標を本質的に宗教的な観点から見るのは危険だと思います。

これはその通りだと、何でもかんでも大袈裟に騒ぎ過ぎなんだ

意味について言えば、AI の方がうまくできるからといって、自分が引き受ける仕事が無意味だと考えるのは間違いである可能性が高いと思います。ほとんどの人は何においても世界一というわけではありませんし、特に気にしているわけでもないようです。もちろん、今日でも比較優位を通じて貢献することはできますし、生み出す経済的価値から意味を見出すことはできますが、人々は経済的価値を生み出さない活動も大いに楽しんでいます。私はビデオゲームをしたり、泳いだり、外を散歩したり、友達と話したりすることに多くの時間を費やしていますが、これらはすべて経済的価値をまったく生み出しません。ビデオゲームが上手くなったり、自転車で山を登るのが速くなったりするために 1 日を費やすかもしれませんが、どこかの誰かがそれらのことではるかに優れているかどうかは、私にとってはあまり問題ではありません。いずれにせよ、意味は主に人間関係やつながりから生まれるものであり、経済的な労働から生まれるものではないと私は考えています。

なるほど、思想的な話なのだろうか

では、今ここには存在せず、非常に速いスピードで迫ってくるものにどう対処するのでしょうか。METR やポール・クリスティアーノなどの組織と協力して私たちが考え出した解決策は、リスクが近づいていることを知らせるテストが必要だということです。早期警報システムが必要です。そのため、新しいモデルが登場するたびに、CBRN タスクを実行する能力だけでなく、自律的にタスクを実行できる能力もテストします。

そして、過去 1 ～ 2 か月でリリースした RSP の最新バージョンでは、自律性リスクをテストする方法として、AI モデルが AI 研究自体の側面を実行できるかどうかを調べます。AI モデルが AI 研究を実行できる場合、モデルは真に自律的になります。このしきい値は、他の多くの点で重要です。では、これらのタスクをどうするか? RSP は基本的に、if-then 構造と呼ばれるものを開発します。これは、モデルが特定の機能に合格した場合、特定の一連の安全性とセキュリティ要件をモデルに課すというものです。

現在のモデルは ASL-2 と呼ばれています。ASL-1 は、自律性や悪用によるリスクが明らかにないシステム向けのモデルです。たとえば、チェスをプレイするボットの Deep Blue は ASL-1 です。Deep Blue はチェス以外の用途には使用できないのは明らかです。チェス専用に設計されたものです。巧妙なサイバー攻撃を仕掛けたり、暴走して世界を制覇したりするために使用する人はいません。

ASL-2 は、私たちが測定した今日の AI システムです。これらのシステムは、自律的に自己複製したり、一連のタスクを実行したりするほど賢くなく、CBRN のリスクや CBRN 兵器の製造方法について、Google で調べてわかる以上の有益な情報を提供できるほど賢くないと考えています。実際、検索エンジン以上の情報を提供することもありますが、つなぎ合わせられるような方法ではなく、エンドツーエンドで十分に危険な方法ではありません。

ASL-3 は、モデルが非国家主体の能力を高めるのに十分役立つレベルになるということですね。残念ながら、国家主体はすでに、非常に危険で破壊的な行為の多くを高度なレベルで実行できます。違いは、非国家主体にはそれができないことです。そのため、ASL-3 に到達すると、非国家主体によるモデルの盗難や、展開されたモデルの悪用を防ぐのに十分な特別なセキュリティ対策を講じます。これらの特定の領域を対象とした強化されたフィルターが必要になります。

なるほど、現状のモデルをラベル付けして危機管理をスコープを確認するということか

RSPはこちら

はい。実は比較的簡単です。Claude は 3 月の Claude 3 以来、長い間、画像を分析してテキストで応答する機能を持っています。私たちが追加した唯一の新しい機能は、それらの画像がコンピューターのスクリーンショットである場合があり、それに応じて、モデルをトレーニングして、クリックできる画面上の場所や、キーボードのボタンを押してアクションを実行できるようにすることです。そして、実際にはそれほど多くの追加トレーニングをしなくても、モデルはそのタスクをかなりうまくこなせることがわかりました。これは一般化の良い例です。重力井戸から脱出するのにどれだけ時間がかかるかを考えると、低軌道に到達すればどこにでも半分到達したことになる、と時々言われます。強力な事前トレーニング済みモデルがあれば、インテリジェンス空間の点でどこにでも半分到達したことになると思います。実際、Claude にこれを実行させるのにそれほど時間はかかりませんでした。これをループに設定して、モデルにスクリーンショットを撮らせ、何をクリックするかを伝え、次のスクリーンショットを撮らせ、何をクリックするかを伝えると、モデルの完全な 3D 動画インタラクションに変わり、これらすべてのタスクを実行できます。デモでは、スプレッドシートに入力したり、Web サイトとやり取りしたり、Windows、Linux、Mac などさまざまなオペレーティングシステムであらゆる種類のプログラムを開くことができることを紹介しました。これらはすべて非常にエキサイティングだと思います。理論的には、モデルにコンピューター画面を操作する API を与えるだけでできないことは何もありませんが、これによって障壁が本当に下がります。これらの API を操作できない、または操作に長い時間がかかる人がたくさんいます。

画面は、操作がはるかに簡単なユニバーサルインターフェイスです。そのため、時間の経過とともに、多くの障壁が下がると予想しています。正直なところ、現在のモデルにはまだ改善の余地があり、ブログでもそのことを正直に述べました。間違いや誤クリックが発生します。私たちは、人々に「このデバイスを何分もコンピューターで実行したままにしておくことはできません。このデバイスに境界とガードレールを設定する必要があります」と注意して警告しました。これが、消費者に渡してコンピューターの制御を与えるのではなく、最初に API 形式でリリースした理由の 1 つだと思います。しかし、これらの機能を世に出すことは間違いなく重要だと感じています。モデルが強力になるにつれて、これらの機能を安全に使用する方法、悪用されるのを防ぐ方法を検討する必要があります。

そして、機能にまだ制限があるうちにモデルをリリースすることは、それを実現する上で非常に役立つと思います。リリース以来、多くの顧客が、おそらく最も迅速に導入できたものの 1 つである Replit をさまざまな方法で活用しています。Windows デスクトップ、Mac、Linux マシンにデモを接続している人もいました。とてもエキサイティングです。他のものと同様、新しいエキサイティングな機能が付属しており、その新しいエキサイティングな機能を使用して、モデルを安全で信頼できるものにし、人間の期待に応えるようにする方法を考えなければなりません。すべてにおいて同じ話です。同じことです。同じ緊張感です。

スクリーンショットと行動をセットで学習させるということか？そうすると、モデルによる行動が決定するので、後述のインターフェースにつなげるということか

訓練後の処理について少しお話ししましょう。現代の訓練後の処理には、あらゆる要素が少しずつ含まれているようです。教師あり微調整、RLHF、RLAIFを備えた体質AIなどです。

これ、バッドやいいねでコメントするあれか。HF(Human Feedback)なのかAIF(AI Feedback)なのかの違いか

では、RLHF はモデルをよりスマートにすると思いますか、それとも人間にとってよりスマートに見えるだけだと思いますか?

モデルが賢くなるとは思いません。モデルが賢く見えるようになるだけではないと思います。RLHF は人間とモデルの間の溝を埋めるようなものです。本当に賢いのにまったくコミュニケーションが取れないということもあります。私たちは皆、このような人を知っています。本当に賢いのに自分が何を言っているのか理解できない人です。ですから、RLHF はその溝を埋めるだけだと思います。私たちが行う RL はこれだけではないと思います。将来登場する RL もこれだけではありません。RL にはモデルをより賢くし、より良く推論し、より良く動作し、新しいスキルを開発させる可能性があると思います。場合によっては、人間のフィードバックがあればそれが可能になるかもしれません。しかし、今日行っている RLHF ではまだそれがほとんどできませんが、すぐにそれができるようになっています。

モデルを仮に別人格とみなした時に、HFが適切な回答であるかは分からない。人によっては、それをGoodと見なすときもあれば、Badと見なすこともあるだろう。それを大量に集めたとしても最終的にモデルにとって＋になるとは限らないということか。溝を埋めるという表現が近いだけか。前提にモデルを正しくしようとすることを目的にするかで効果の違いは現れそうだ。逆に正しさを求めないようにすれば、色んな人格を持ちそうだけどな。この段階では、どっちがいいとか悪いという話ではない気がするな

2 つの理由から、最も急速に変化する分野の 1 つになると思います。1 つ目は、プログラミングは AI の実際の構築に非常に近いスキルです。そのため、スキルが AI を構築している人々から遠いほど、AI によって破壊されるまでの時間が長くなります。私は AI が農業を破壊すると確信しています。すでにいくつかの点で破壊的になっているかもしれませんが、AI を構築している人々から非常に遠いため、時間がかかると思います。しかし、プログラミングは Anthropic や他の企業で働く従業員の大部分にとって生業であるため、急速に変化します。急速に変化するもう 1 つの理由は、プログラミングでは、モデルをトレーニングするときとモデルを適用するときの両方でループを閉じるためです。

モデルがコードを書けるということは、モデルがコードを実行し、結果を見て、それを解釈できるということです。つまり、先ほど説明したハードウェアや生物学とは異なり、モデルにはループを閉じる能力があるのです。この 2 つの要素により、モデルはプログラミングを非常に速く習得できると思います。典型的な実世界のプログラミングタスクで見たように、モデルは今年 1 月の 3% から 10 月には 50% にまで向上しました。つまり、S カーブ上にあり、100% にしか到達できないため、すぐに減速し始めるでしょう。しかし、あと 10 か月で、おそらくかなり近づくと思います。少なくとも 90% にはなるでしょう。繰り返しになりますが、どれくらいの時間がかかるかはわかりませんが、2026年、2027年には、Twitter ユーザーがこれらの数字を切り取って警告を取り除くと思います。

君は嫌いだ、出て行け。大多数のプログラマーが行うようなタスクは、タスクを非常に限定して、コードを書くだけであれば、AI システムがそれを実行できるだろうと私は推測します。そうは言っても、比較優位は強力だと思います。AI がプログラマーの仕事の 80% を実行できるようになると、そのほとんどが文字通り指定された仕様でコードを書くという作業であり、残りの部分は人間にとってより有利になりますよね? 人間は、高レベルのシステム設計や、アプリのアーキテクチャが適切かどうか、デザインや UX の側面などについてより多くを費やすようになり、最終的には AI もそれらも実行できるようになります。これが、強力な AI システムの私のビジョンです。しかし、私たちが予想するよりもずっと長い間、人間がまだ行っている仕事の小さな部分が、全体の生産性を上げるために、仕事全体を埋めるまで拡大していくと思います。これは私たちが目にしてきたことです。かつては、手紙を書いたり編集したりするのは大変で、印刷物を書くのも大変でした。しかし、ワードプロセッサやコンピューターが登場し、仕事の制作や共有が容易になると、それが瞬時にできるようになり、すべての焦点はアイデアに置かれるようになりました。したがって、生産性を高めるために、タスクのごく一部をタスクの大きな部分に拡大し、新しいタスクを作成するという比較優位の論理は、今後もそうなると思います。

繰り返しますが、いつか AI があらゆる面で優れ、その論理は当てはまらなくなるでしょう。そうなると、人類は集団でそれにどう対処するかを考えなければならなくなります。私たちは毎日そのことを考えています。これは、誤用や自律性の問題とは別に、対処すべきもう 1 つの大きな問題であり、真剣に受け止めるべきです。しかし、短期的には、そしておそらく中期的には、2、3、4 年といった中期的には、人間が引き続き大きな役割を担い、プログラミングの性質は変化するでしょう。しかし、役割としてのプログラミング、仕事としてのプログラミングは変わりません。1 行ずつ書くことが減り、よりマクロ的なものになるでしょう。

AIによって設計書・仕様まで考えてくれるなら楽でいいな。それを評価することすら必要なくなるかもしれないってことだよね。人の意志は不要と言っているわけではなく、AIが可能になると言っているだけだとは思うな。人が使うことすら不要になるのかもしれない。

もしかしたら、プログラミングは経済的活動ではなく、精神的活動を目的にしたものになるのかもしれないな。

ただ、あくまで彼らの論理であるので、人々はそれぞれの立場で色々な考え方がある。今、これを読んでいるあなた自身のその一人だ。参考程度に読んでみるといいかもしれない

A100の方がコスパいい場合もあるかもしれない(11/16)

A100でLoRAを作成したらT4で2時間くらいは掛かるのが30分（35分〜40分？）くらいで終わった。L4 GPUを使う1時間使う使用量とほぼ同等となり、時間は短縮された

初めて、fp16ではなくbf16でLoRAを作成した。
今回は学習においてトリミングも何も考えずに学習させて試したが、まあ、それらしい結果になった。むしろ、トリミングなど下処理に異常に掛かっていたので大変だった。NoobAIをモデルに学習させてみたが、何というか元々のモデルの具合を上書きできるかとも思ったが、そういうわけではなかった？色に雑味があったのでそれをLoRAで解決したかったのだが、うまく行く場合とうまく行かない場合がありそう。しかし、プロンプトの解釈はしやすそうなモデルなのでこれは参考にしたい

人はアプリを作らなければいけないのか？(2024/11/17)

私は、2024年11月頃から、Claudeで短時間で大量にリリースできることを実践して分かった

ここで疑問が残るのは人々はアプリを作らないといけないかという疑問だ。AIがしてくれるならば、最終的に置き換えてもいいと思う

「それを作るのに時間が掛かったから価値がある」というのは一種の誤解なのではないだろうか

コストが掛かった → それは理解できる
だから、それなりの価格で販売する → それも理解できる

しかし、時間を掛けたから偉い（価値）があるというのは、価値を何と見なすかにもよるが、語弊があるのではないか

これは自分の場合だが、「時間を掛ける」を「思い出」として残るという価値だと考えている。

従って、あるソフトウェアの構築は時間が掛からなかったからといって、時間が掛かったソフトウェアより必ず劣るとするのは間違いだと思うのだ。

それは開発者が自分を虚偽に正当化する行為だと考える

あんまりデザインを考えなくてもいいかも(11/17)

今、リリースしている内容はデザインにバラツキがある。しかし、これもそのうちデザインを統一してAIが作ってくれるのではないかと想像すれば、今、そこに時間を掛けることは勿体無いと考える

それよりも、欲しかった機能そのものを作って貰えた方が自分にとって有益だろう

で、人はアプリを作らなければいけないのか

一種の中毒症状に陥っていたと思う。それは今まで体験していなかったからであり、そのレスポンスに身体が慣れていなかったせいだと思う。超、便利なワープロが出たと思えばいいのだ

つまり、意識を戻さないといけないのは、そもそも何で作ろうとしたのかって話だが、有料プランを契約している間に、今まで欲しかった、あったら便利だった機能を実装してもらおう、他にもなかったかと確認しているだけに過ぎない

だから、作らないといけないと考えるのが間違いで、その問題を解決するには、何でそんなに作ろうとしているのかって話だよね

正直、Scopeの範囲は自分だけだ

もちろん、これが広まって注目されたらいいななんて打算的なことを考えているのは言うまでもないが、それは副次的だ。むしろ、そこを中心に考えるのであれば、目的と考え方を見直す必要があるかと思う。そして、そこに対する答えを僕は持ち合わせてはいない。何度も壁打ちをしたが未だに解はでない。そこに云云と唸るよりは、元々の目的に立ち返った方が自分にとって建設的だろう

そのうち、分からなかったことを自分にとって優しく解説してもらうツールとして使うのかもしれないけど。もちろん、議論に使用したいのであればお好きにどうぞ

Xのツイートが害悪だった件(11/17)

日本の国会議員の給与とアメリカの議員の給与が出てきたのだけど、出典を明記していないから確認のしようがない。すげー迷惑だわ

何をみて議論しているのか調べたい。オフィシャルなリソースを示して欲しいわ。

いや、アメリカの国会議員だったかの給与が１０００万円で、日本の国会議員が3000万円だって感じのポストだったんだけど、そもそも、1000万円でアメリカで生活できるのか？って疑問から他にも貰っているのか、Claude先生ともやり取りしながら、一面的ではないか（他の面ではないか）？表面的ではないかと思って調べ出したんだよね。そしたら、Claudeは違う値を示してきて、そのポストが怪しいなと思い始めたわけ

そうすると、ポスト主は何をみて発言したのか気になるわけなのだけど、出典も明記していないのでゴミだなと・・・

平成20年とあるので情報が古いかな

こちらは2024年7月か

昔の履歴を浅ると

現在国会議員一人当たり、月百三十万一千円の歳費が支給される。他に、月百万円の文書通信交通滞在費や六十五万円の立法事務費、年間約六百三十五万円の賞与やＪＲ、航空券の無料クーポン券、更には公設秘書の給与を含めると、国会議員一人当たり、月約五百七十三万円、年約七千五百万円の経費がかかっている計算になると承知する。

まあ、歳費だけで議論すると2600万円だろ？
各選挙区の代表と捉えれば、こんなもんなのか安くね？とすら思ってしまうのだけど、実態が各党を構成する平社員的な立ち位置なのであれば高くね？と思ってしまった。abematvでたまたま、見てしまったペーペー発言にがっかりした。ペーペーに2000万円以上の税金をかけるのかと。

もし、党員が同じ方向を向くことを是とするのであれば、ただの従う集まりだから歳費は見直しても問題ないんじゃないかな？（大した仕事はしない）と思ってしまう

衆議院の人数が465名であれば、1000万円を削ったら46億5000万円の経費が浮く。大した金額ではないかもしれないけど、その金額でも割り当ててもらったら喜ぶ人達がいるのであれば、検討してもいいんじゃないかと

増税は仕方ないと言うのであれば、推進する人々が切り詰めるところは切り詰めてからの方が納得感は増す

まあ、何でもいいのだけど、2600万円に見合う働きって何だろうな。想像も出来ないよ

もう少し彼らの仕事内容に興味を持った方がいいかとは思った

話は脱線したが、そんなこんなでXのポストは恣意的になっている場合が多いので、信用しなくていいし、見る時間が無駄なので積極的にミュートしていこうと思う

AndroidのアプリをReactNativeとExpoで作ってみる(2024/11/17)

Reactとは別に、ReactNativeとExpoというのがあることを学んだ。今の感想としてはこれならば、素人（自分）でもあまりコードを書くことなく、アプリが作れそう。flutterは"Hello World"までが遠い気がする。コードや構造を詳細に理解したいのではなく、アプリを作って使いたいだけなので、とりあえず、このまま進める。とはいえ、ReactNativeもExpoも以前リンクしたライブラリよりは新そうなため気にせず使えそうかも。Electronでも使用したnodejsを使っているので、環境構築が減ってよかった。技術的な違いとつ作る内容は分けて考えた方がいい（破壊的に影響を受けなければ使うツールは何だっていい）

Claude先生に聞きながら話を進めている。とりあえず、Hello Worldまで完成（Windows) ３時間くらいか

躓いたところのメモ

Android Studioのインストール
Android SDKをAndroid_HOMEで環境変数に設定
Android SDKにあるPlatformtoolsのパスを環境変数のPATHに設定

npx create-expo-app

(tabs) フォルダにあるindex.tsxをバックアップとって、Claude先生に"Hello World"のコードを書いてもらって試した

ちょっと、CPUの使用量が大きい

CPUはRyzen5を使っているのだが、起動時は100%の使用率となりサーバを閉じるのも時間が掛かる。何か閉じ方を失敗しているんじゃないかとさえ思っているのだが重い

これ以降はセンサー周りを確認する

予め作りたいアプリがいくつかあるが、次の段階としてセンサーにアクセスすることを始めたい。それが完了すれば、おおよそ作れるのではないか？って見立てなので、どのくらいの時間が掛かるかによって予定を決めていく

マジかよ！すげーな(11/17)

という話、こんなに上達するの？
俺は何をしているんだって話なんだが・・・

最高😌🔥 https://t.co/6Zesex7WTN
— AssH - Official (@AssH_Guitarist) November 17, 2024

Gemini Liveに同じ指示を毎回、与えるのがめんどくさい(11/18)

システムプロンプトができるとありがたいのだけど、恐らくその場合は毎回、挙動が固定になりそうだ

そこら辺はそのうち解決しそうな気もするけど、作らないようであれば英会話を中心とするアプリに意味が出来てくる気がするんだよな

Gemini Liveがどういう立ち位置でやろうとするのかもにもよるけど

永遠に終わらないノベルゲームをAIを使って作る

Claude先生とやり取りをしていたら、APIを使えばいけるんじゃね？って話をしていたので、その下準備としてGemini先生とやり取りをしていた。中々、応答をしてしまうので四苦八苦しているが、このプロンプトで多少はマシになった

依頼

1つの日常のシナリオを述べよ


## フォーマット

・数行の文を結果だけを出力すること

・１つだけ出力すること

・こちらに余計な応答はしないこと


## Output

Geminiの応答はこちら

日常のシナリオ
いつものように通勤電車に乗っていると、見慣れない本を手にしている人がいた。その本のタイトルが妙に気になってしまい、思わず話しかけてしまう。

なぜ、こんなことになっているかというと要はGemini LiveのAPIであれば無料で使える部分があるからだ。正式な実装もまだなのにAPIの料金なんて支払いたくない

また、DMM VOICEの件も見ていたが文字数買い切りの件を見たが、あれはいい方法だ。APIの料金を踏まえて制限を掛ければ重課金に歯止めが聞く。あれ、ユーザーにAPIの料金を自分で支払わせるのはダメなのだろうかとも思うけど、どうなんですかね？Googleさん

新規ドメインは.orgにしようと思う(11/18)

支援は欲しいけど、サイト自体は非営利で公開しているようなもんだしな。

midi drumの開発進捗(11/19)

midi drumの件をClaude先生とやりとりをしている。手軽さを意識してBluetooth接続を検討しているが、電源供給はmidi drumのハードで完結させたい。また、少し、別のアイディアが浮かびそれも浮かぶか検討中

とりあえず、ホームセンターに素材はたくさん売っているし、YoutubeやBlogを見てもドラムパッドを自作する例は豊富に出てくるのでいい

小さい、ドラムパッドにこだわらなくていい

現在検討している問題

Bluetoothの接続にするか
- Bluetooth midiとの関係は？
usbと比べてレスポンスが落ちるが、どのくらい落ちるか
素材はスティックで叩いてみてから選定した方が良さそう。いきなり全て組むのは難しそう
抵抗値は1MΩで本当にいいのか？
材料費は5000円で納められればいいな

暫定の見積もり↓

何に使うのか？

演奏に使う。ドラムって高価で、電子ドラムは置くスペースはない。ドラムパッドは近いが価格が最低15000円以上はする。midi drumのkitはほとんどみない。だったら、DAWに使えるmidi drumを用意したらいいだろうという判断。パッドの大きさも自分で決められる

後は、世界、最小クラスのmidi padを作ることができるかもしれないことを昨日、気付いた。珍しく冴えていた。ちょっと、こちらも同時並行で作る。材料は同じものでいけるので、段階を踏もうかと

何とか5000円以内に収められば良いだろうと。今回は価格重視にしたい

指笛むずいな(11/19)

投稿主は１ヶ月掛かったとのこと、しかしサムネイルがひどいな

ReactNative+Expoで、モバイルデバイスのセンサーのチェックと、方角の取得をしてみた(11/19)

Claude先生に教えてもらいながら、方角チェッカーをExpo内で構築した。センサ−の取得ができることが分かったので、後はビルドを含めてチェックしていく。いくつかセンサーを使って遊びたい内容があるので、それをClaude先生に聞きながら実装していくつもり

最近、Claude先生が途中で調子が悪くなるのは何故だろうか？利用が増えてきたのだろうか

perlを久し振りに使った(11/20)

さくらのレンタルサーバがperlを使えるので、cgiとして活用した
sqlite3も扱えるので助かった

Claude先生には色々と教えてもらっている。感謝だ

とんでもなく調子が悪い(11/20-11/21)

腰や肩が痛く重い。風邪引いたのかな
コロナではないとは思うけど・・・インフルか？
熱はなさそう

つらい肩こり、腰痛、眼精疲労に効くとされるユンケル１・６・１２を服用した。滋養強壮にポポンS+も服用した

急に寒くなったせいか。
ああ、熱は37度だから自分の平熱からすれば少し高い
温かくしてねよう

夜中に38.5度まで熱が6時間ほど上がりうなっていた。残っていた解熱鎮痛剤をのんで結構楽になった。解熱鎮痛剤はストックしておこう

人身事故は社会の縮図(11/21)

なぜ、人身事故が起こるのか考えた方がいい。自分にしか余裕がないやつが多過ぎる

ユニークは孤独である(11/21)

ある本を少し読んだのだが、メジャーなことをしているわけではないから、孤独になるものだと学んだ。

特に努力と成果は因果関係はない。
努力すれば報われるとは限らないとをこの１年で学んだ
評価されるのは結果論に過ぎない

ただし、何もしなければ何も起きないのはおおよそ事実であるだろう。誰かが与えてくれる可能性はあるが。

夢を語るのは大いに結構だ
しかし、実際にその通りになるのは少ない確率なのではないか
だけど、叶わないこともひとつの人生だから、それを認めて始めるのもまた人生だと思う

AIは、誰かの通ってきた道を学んでいる。それこそ、一度きりの人生では何週しても辿り着けない境地だ

AIに質問することは誰かがしていることを聞いているようなものだ。だから、おおよそ多くの人がしていないであろうことをAIにさせることで、作品のアイデンティティ（自分のアイデンティティ）を確立できるのでは自分では考えるのだが、それもAIが答えられるということは誰かが通った道なのかもしれない。推論なので、その通りとは限らないのだが

「人が想像できることは実現可能」と誰かは言ったものだが、現状は仕様書を書くことが自分にとっての想像であり、アイデンティティとしている部分がある。コードは書かないので、自分がコードを書いたという結果からくるアイデンティティみたいな感じはない

正直、誰が仕様書を書いてもいいし、誰がコードを書いてもいいのだ。アイデンティティを確立する必要すらないのでは？と思ってしまう。

しかし、人は自由意志が存在するので、何かを決定する行為というのは人間に残されたアイデンティティなのではないか。決定すらAIに任せるのもいいのだが、そこがAIと付き合う上での自己判断やら自己責任ってやつなのだろう

集合知の観点からは、誰かが通ってきた道を辿るのが「使う」という行為で、結果的に誰も通ってこなければ「新たに価値（解釈）を加える」という行為なのだろう。人類全体の集合知としては、何か＋を加えた方が人類全体にとっては、よくなるか悪くなるかは置いておき、「変化」というものが現れる。

研究はしてこなかったけど、研究ってそういう話なのかと

でも、自分がしたいことは大概、模倣と思われるので「どんどん」していこうと思う

いくつか「新しいと思われる」ことは用意をしているが、それが＋になるかは分からない。ましてや、それを使って売上につながるかすらね。

Geminiの評価

評価のまとめ
このブログ記事は、単なる技術的な記録にとどまらず、著者自身の思考プロセスや感情を交えながら、AIやプログラミングに対する深い洞察を示している点で非常に優れています。

おわり！