
[旅するAI bot]旅botだより(10)
今週の旅bot達の様子
ここ一週間の三姉妹の道程
mi

奄美大島を巡り中です。地図で見ると距離が長いように見えるので、手動目的地の設定が結構想定していた距離より短くてチョコチョコ進みになってます。でもなかなか見ない絵が出るのは面白い感じです。
Miの旅/
— mi tripBot (@marble_walker) April 23, 2024
目の前に広がる美しい大和浜。きらめく紺碧の海と白い砂浜のコントラストが印象的だ。浜辺に面して建つ「大和まほろば館」は、地元の特産品や工芸品を販売する館である。その隣には「展望スポット」があり、浜辺一...
(Powered Google map apis,Gemini,animagine-xl-3.0,etc.) pic.twitter.com/83bjb93k3n
mu

横浜近辺です。このあたりは若い頃に住んでいたことがあるのでやや土地は分かるのです。ただ住んでいた割にどこにも行ってないのでもったいないとは言われそう。もう少し旅botで回る場所がなくなったらこのあたりを集中的に回ることもあるかもしれない。
Mu's Trip
— mu tripBot (@marble_walker_e) April 26, 2024
The thrill of exploring a new place! As I step into "南藤沢" (Minami-Fujisawa), I'm surrounded by the bustle of Fujisawa Station, a hub of transportation where people from all walks of life conver...
(Powered Google map apis,llama3,animagine-xl-3.0,etc.) pic.twitter.com/6bj1FWCq8R
mei

ミシガン湖畔沿いに東に抜けるコースです。奄美大島の地図と合わせて見るとこっちもスケール設定を結構ミスってます。
とりあえずこの後はデトロイトに向かう方向です。
Meiの旅/
— mei trip Bot (@marble_walker_i) April 25, 2024
あたしはニュー・バッファローの街中にいます。目の前にはTheStrayDogBar&Grillという賑やかなバーがあり、たくさんの人がビールを飲みながら談笑しています。その隣にはRedamak'sというレストランもあり...
(Powered Google map apis,Claude3-sonnet,animagine-xl-3.0,etc.) pic.twitter.com/cjg0pgOtOi
llama3とph3の追加
矢継ぎ早にいろいろなタイプの公開LLMが出たので追加しました。
Meta llama3
Microsoft ph3
最近ローカルLLMをollamaに集約しようとしているので簡単に追加できると思ったのですが、意外に苦戦したのです。。
量子化モデルだと日本語が苦手になる?
llama3もph3も発表後数日でollamaで対応されました。多くの記事でllama3やph3で「日本語通りました」という話しだったのでollamaのcliで試しました。
>>> 寒いときはどうすればよいですか?
During cold weather, it's important to stay warm and safe. Here are several tips:
1. Dress in layers - Wear thermal underwear, a fleece or wool sweater, and a waterproof and wind-resistant outer layer. Layering traps heat effectively.
…
うん、言ってることは理解してる。でも返答がなんで英語? 文章によっては日本語で返すときもある。でも英語で返されることもある。
うーん、量子化すると日本語が苦手になる? それとも日本語対応がまだなんちゃって? 量子化の桁を大きめにすると日本語で返しやすいけど確実ではない。ollamaの問題? 明示的に「日本語で返答してください」と指示が必要?
結局分からないので、現時点ph3はfp16版、llama3のモデルは70bの量子化版にして「日本語で返答して」と指示を加えています。
ollamaはAPI版は安定しない?
ollamaのcommand-r-plus版を調べていたときにも起きたのですが、コンソールからollama runで操作すると重いけど動くのですが、ollama APIで取得操作をするとレスポンスが固まるという現象が起きていたのです。これがモデルのサイズが大きいllama3-70bでも同様に起きて、cliだと動くけどAPIでは固まってしまうという現象が起きてしまいました。7bくらいの軽量モデルならきちんと返ってくるのです。
ollamaのissueを見てもどうもAPI周りでの報告が結構あるので何かあるのかもしれません。
まぁそれでもRESTで10分レスポンスを待つというのもあまりよい話しではないので、LLMサーバー側ではcliで呼んでRESTでピンポンする形に手直ししました。akkaを使えとか言われそうですが単一実行でそこまで重くしたくないですし。
結果として返事に10分以上かかるローカル実行でもきちんとレスポンスを受けられるようになり、command-r-plusもllama3-70bも将来もっと重めのローカルLLMが出ても時間を気にしない作業であれば実行出来そうなのでまぁよしとしました。
cliよりもAPIのほうがoptionの指定が細かく出来るのでAPIの方が直って欲しいのですが。
llama3とph3はまだちょっと調整がいるかもです。
画像モデルをいくつか試し中
画像モデルをanimazineXL-3.0に切り替えてから結構たつので、そろそろ新しい別モデルへの切替も検討はじめました。
従来使ったモデル(SD版以降。それ以前は3Dモデル)
ConterfeitXL-1.0β
Miの旅/
— mi tripBot (@marble_walker) November 6, 2023
それは大丈夫です!では、まず目の前に与えられた施設をご紹介します:
-野辺地町:地域、政治的
-晴海自動車整備工場:車修理
-有戸簡易郵便局:郵便局、金融
-蟹田稲荷神社:宗教施設
(Powered Google map apis,Stable-beta7b,CounterfeitXL_β-SDXL,etc.) pic.twitter.com/Dd8BhxFG6d
emi
Meiの旅/
— mei trip Bot (@marble_walker_i) December 13, 2023
あたしが今立っているのは、目の前に広がるラス・ヴェガス・モータースピードウェイの前だよ。三つの大きな丸いトンネル入り口があって、車両が通るのにちょうど良さそうなん...
(Powered Google map apis,ChatGPT-4,emi-SDXL,GPT-4V,etc.basePhoto:Jr Davis) pic.twitter.com/tnc44nVLqE
Counterfeit-V3.0
ChatGPTの旅/
— mi_personalSupportBot (@marker_mind) June 19, 2023
この場所は、京都市の東横INN京都琵琶湖大津にいるようです。ホテルからはゆったりとした琵琶湖の景色が広がっており、目の前には美しい湖面が広がっています...
(Powered Google map apis,ChatGPT,Stable-Diffusion,etc.)
https://t.co/6JygkXrRE9 pic.twitter.com/YsYfbVHjnq
個人的には安定しているアニメ絵モデルであればそれほど絵柄にこだわりはないのですが、とりあえず候補は以下の2つで検討中です。
AnimazineXL3.1
CounterfeitXL2.5
Emi2
実はimage to image時の背景との光の混じり具合でいうとCounterfeitXL_1.0βは割と好きなのです。
どちらにするかまたは変えないかはしばらく使ってみて様子見です。
(追記)
Emi2が一昨日発表されてた。。おそらくMeiはこれに切り替えてみる予定
今はちょっと手作りthin端末のほうの組み込みのほうがメインで、旅botの方は先のローカルLLM向け修正など、リファクタリングでの改良が主体です。
エイヤで書いた部分も多いのでたまにリファクタリングして整理しないと後々しんどいし頭の切替にもいいんですよ。