【AI は面白い】写真に写っているものを説明してください
Micorosoft の Azure AI でもできましたが、LLaVAを使っても説明してもらおうと思います。
下図のphotoACさんの写真フリー素材を使って、説明してもらいました。
この写真に写っているものは何ですか?と英語で聞きました。
その回答は。
USER: What's in the picture
ASSISTANT: The image features two girls standing in front of a chalkboard, both raising their fists in the air. They are wearing school uniforms, which suggests that they might be students.
USER:
拳を突き上げているという表現が良いかわかりませんが、もう少し背景などの情報もほしいですね。
この写真に写っているものは何ですか?と英語で聞きました。
その回答は。
USER: What's in the picture?
ASSISTANT: The image features a man and a young girl sitting at a desk, with the man holding a book. They are both smiling and appear to be enjoying their time together.
USER:
男性が持っている本を認識してくれたのは良いですね。
写真の特徴をタグ化する場合は、MicrosoftのAzure AIが便利ですね。
この文を単語で区切って、名詞を抽出とか、動詞を抽出とか、それをタグ化すると、写真がタグで整理できるでしょうか。
サマークラウド株式会社の情報はこちらまで。
https://summercloud.jp