生成AIは鉄道の画像を生成できるのか
意外に検証をされていないようなのでやってみます 下書きで放置している間にXで少し話題になっていました。
ヘッダー画像はImagen3で作成しました(撮り鉄を叩いているわけではありません)
Imagen3
まずは生成回数の制限がほぼないImagen3でやってみます。
A picture of train.
どこかの国で走っていそうな気動車が出てきました。パット見た感じで破綻はありません。
A picture of Japanese train
A picture of Sinkansen
破綻はなく、それっぽいものを出してきました。
Stable Diffusion 3 Medium
A picutre of a Japanese train
A picture of Shikansen
全部違う
Flux1dev
A picture of a Japanese train
ぜんぜん違う
midjourney
無料でも25枚生成できるので試してみます。(現在は終了してしまいました)著作権が向こう側にあるというのですが、著作権は発生していないと思っています。
A picutre of a Japanese train
他のAIは編成写真だったりするがmidjourneyは「作品」って感じです
A picutre of Shinkansen
在来線
新幹線の方は大丈夫らしいので次に在来線の方をやってみます
Imagen3
ここからは車両形式を指定してやっていきます
E233
むりか、なら、205なら
無理か、
車両形式指定は無理なので路線を指定してみます
A picture of Japan's Yamanote line.
A picture of Yamanote line.
ここまで来たら作戦を変更してGeminiに画像を下にプロンプトを書かせてそれでImagen3に投げてみます。元画像はこちら
imagine you're looking at two sleek, modern Japanese commuter trains side-by-side. These aren't your bullet trains, but the kind you'd see zipping around a city.
The main color is a vibrant, almost luminous green, with a pattern of darker green dots that fade towards the bottom, like a gradient. The front of the trains is kind of rounded, with a large, dark windshield that wraps around to the sides. Above the windshield, there's a digital display in bright orange or red that shows the destination, probably in Japanese characters.
They both have a single headlight in the center, bright white, and above that it looks like some kind of sensor or camera. There are also smaller lights below the windshield, maybe for signals. The trains look pretty new and clean, with shiny surfaces reflecting the surroundings.
One train is angled slightly to the left and the other to the right, so you can see the sides of both. They seem to be on tracks that are in a bit of a cutting, with walls and poles and electrical wires all around. In the background, you can see some trees and maybe a glimpse of a building or two. It gives you a sense that they're in a busy urban area.
Oh, and one detail I almost missed – there are some small numbers on the front of the trains, probably their identification numbers. They look pretty similar to each other, probably part of the same series.
さっきよりはましになったので説明を修正して再度やってみます
the picture shows two Japanese commuter trains, but they're not as futuristic as you might think. They're definitely modern, but they have a more classic commuter train look, not like bullet trains.
The color is a bright green, that's right, but it's a solid green, not a gradient with dots. Think more like a bright spring green, almost a lime green. The front of the trains has a more angular design, not rounded. It's kind of boxy, but with a slanted front.
The windshield is large and rectangular, with a black frame around it. Above the windshield, there's a destination sign, but it's not digital. It's more like an old-school LED display with orange lights showing Japanese characters.
Each train has two headlights, one on either side of the destination sign, and they're more rectangular in shape. They don't seem to have any extra sensors or cameras on the front.
The overall impression is clean and efficient, but maybe not as sleek and high-tech as you first imagined. They're definitely designed for everyday commuting, not high-speed travel.
どう頑張っても幅広車体、レンジが再現できませんでした。
midjourney
A picture of Yamanote line.
山手線としか指定していないのにもかかわらず緑色の車両が出てきました。更に続けます
だんだんひどくなってきたのでこれぐらいにしておきます
Stable Diffusion 3 Medium
A picture of a Japanese local train.
A picture of Yamanote line
日本ではなくどっかの外国のやつとしか言いようがない画像が出てきました。
おまけ
全く関係ないのですがsakana.aiが開発したEvo-UkiyoeというAIで遊んでみます
蒸気機関車
文字は逝っていますが少しまともなのが出てきました。
終わりに
画像生成AIで鉄道の画像を生成してみました。今のところ大きな破綻は発生していませんが、日本のこの形式の画像というのは無理そうです(てかそもそも学習データに入っていない?)。また、今回試した中ではImagen3が1番話を聞いてくれました(ただ、アスペクト比が1:1しかないのが大きな問題なのだが……)。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?