![見出し画像](https://assets.st-note.com/production/uploads/images/147135486/rectangle_large_type_2_d2daa76fd50312415fe4731303386785.png?width=1200)
【日記】 #cm_odyssey 4日連続 2024/07/11(木)
Journeyman( @beajourneyman )と呼ばれている。日々noteで【日記】を書いている(1日1本以上になるケースもある)。
1日遅れになった朝の挨拶
追い付いてきた。【日記】が追い付いてきた。日曜分を書き終えた。前々日分を書くスタイルなのでやっと1日遅れまで戻せた。今日さらに2本、月曜火曜分を公開できたらキャッチアップだ。今週末の静岡はあいにくほぼずっと雨らしい。要対策だ。
【緊急配信】宇宙最速で7/11のBedrock大型アプデを雑談解説
ハッシュタグは #bedrock_saisoku だ。AWS Summit NYC のアップデートだ。
気になったポスト
最大のプラットフォーマーのひとつが動き出したようだ。オマージュとしての二次創作もあり、それを推奨しているクリエイターもいる。自動的に「タグ」が付く仕組みにすると良いとは思うが、夥しい数をチェックするコトは人力では難しいだろう。
良い
— 深津 貴之 / THE GUILD (@fladdict) July 10, 2024
reading… YouTube、声・肖像を無断使用したAI生成コンテンツの削除要請可能に | Musicman https://t.co/qwzbtTWNo4
3連休は梅雨前線が停滞する予報だった。この時点で、真剣に富士登山の延期を考え始めた。もう51回登頂しているので、悪天候の危険はイメージがつく。残念なのは、遠征してイベント参加するので雨がほぼ確定したコト。
今週末の遠征はずっと雨かな。 / 三連休は梅雨前線の活動が活発 来週は梅雨明け可能性も夏空安定せずhttps://t.co/BfVO0U7MMD
— Journeyman(ジャニ)🍑🥟 03/02(土) #JAWSDAYS2024 E-1登壇🦈 (@beajourneyman) July 11, 2024
mushさんこと植田めぐみさんという富士宮口山頂で勤務されている方のまとめだ。雪がパラついた経験も台風直撃で登山道の脇に「幻の滝」が現れた荒天も経験しているので、驚きはない。復習に良いまとめだった。
noteから「読まれてます」と通知が来ていた。約1ヶ月前、なんでだろう。
Windowsだけでなく、Macもアプデした。
Zoomアップデート。
— Journeyman(ジャニ)🍑🥟 03/02(土) #JAWSDAYS2024 E-1登壇🦈 (@beajourneyman) July 11, 2024
「Zoom」に最大深刻度「High」の脆弱性 ~最新版では修正済み/Windows版「Zoom Workplace」アプリで不適切な入力検証により権限昇格の恐れhttps://t.co/VbjWR7vyGL
週末の天気が‥
降水確率100%って。
— Journeyman(ジャニ)🍑🥟 03/02(土) #JAWSDAYS2024 E-1登壇🦈 (@beajourneyman) July 11, 2024
昼からながらでクラスメソッドオデッセイ4日目
ウェビナー週は4日目だ。今回も2トラックだったが、1トラック「生成AI」だけに参加した。ながらで視聴。イベントページとまとめをご紹介する。
仕事の都合で、聞きたかった真吾さんと得上さんのセッション聞けなかったので、アーカイブを楽しみにしている。
今日も可能な限り聞いてます。 #cm_odyssey
— Journeyman(ジャニ)🍑🥟 03/02(土) #JAWSDAYS2024 E-1登壇🦈 (@beajourneyman) July 11, 2024
参加したセッションは2つ
生成AIを評価するって一言で言うけど難しい:クラスメソッド大村 貴俊さん
GeminiとVector Searchによる生成的推薦とマルチモーダル意味検索:グーグル佐藤 一憲さん
以下、セッションごとのメモだ。気になったAWS公式ブログやドキュメントもログしてある。
生成AIを評価するって一言で言うけど難しい
大村さんの「生成AIの評価」示唆に溢れていた。視点と視座がアップデートされた感覚。キーワードで探してみたが、スライドもブログもシェアされていないようだ。
GeminiとVector Searchによる生成的推薦とマルチモーダル意味検索
普段はGeminiと自社のAOAIエンジンのチャットアシスタント使ってる。とても楽しみにしていた。マイクが良いのか、とても音声が聞き取りやすく快適だった。音声大事。やっぱり、複数の視点で学ぶ必要性を感じた。
LLM Geminiのおさらいから、本題「マルチモーダル意味検索」の流れだった。タグもラベルもいらない。Geminiに聞いてみた。
「Visual Language Model」視覚言語モデル。画像とテキストの両方の情報を処理して理解し、新しい画像やテキストを生成できるAIモデル。従来の言語モデル(LLM)はテキストのみを扱っていましたが、VLMは画像も扱えるため、より高度な生成が可能。
RAGを作るコト自体が非常に難易度は高い。
「生成AI」ではなく「推論AI」と言える。生成は10%、推論は80%のパワーを使っている。どんなクエリを投げれば良いかGemini自体に考えさせる。
マルチモーダルセマンティック検索:画像とテキストを超えた深い理解。従来の検索は、キーワード一致などシンプルな方法でしたが、マルチモーダルセマンティック検索は、画像とテキストの両方の意味を理解し、関連性の高い情報を引き出す高度な検索技術です。
素晴らしいセッションでした!ありがとうございます!!
アンケート回答しました。#cm_odyssey #アンケート大事
— Journeyman(ジャニ)🍑🥟 03/02(土) #JAWSDAYS2024 E-1登壇🦈 (@beajourneyman) July 11, 2024
いろいろ一杯だった。翌日の自分に託した。
𝕏ドメインに移行が始まっているようなので併記。
𝕏(旧Twitter): https://x.com/beajourneyman <- https://twitter.com/beajourneyman