Google VertexAIのマルチモーダル機能のSample promptsを一通り試してみた!
GoogleのVertex AIに「マルチモーダル」というメニューがありますが、ここでは色々できるようになっており、未来の可能性を感じさせます。
どのような機能があるのかをSample promptsをそのまま、もしくは少しいじって叩き、使い方を考えてみます。
Extract Text to Image : 手描き文字の読み取りも可能に
OCRと何が違うのか理解できていませんが、複雑な手書き文字も読めるということで精度が上がったということでしょうか?
日本語もやってみ