見出し画像

生成AIは鉄道の画像を生成できるのか

意外に検証をされていないようなのでやってみます 下書きで放置している間にXで少し話題になっていました。

ヘッダー画像はImagen3で作成しました(撮り鉄を叩いているわけではありません)

Imagen3

まずは生成回数の制限がほぼないImagen3でやってみます。

A picture of train.

どこかの国で走っていそうな気動車が出てきました。パット見た感じで破綻はありません。

A picture of Japanese train
N700A もどき 
なんか前に変な窓がある
ブルートレインですね
どっかの地下鉄にいそう
調べてみたら色はリゾートしらかみらしい
A picture of Sinkansen
N700Aもどき
前の扉の窓が小さすぎる
横にグリーン車のマークもどきがある
N700A
結構それっぽい
いい感じだけれどもよく見るとN700AとN700Sが混ざっている


違うの出てきた。あと、行先の文字何?
なんか違うのが出てきた
N700と500系をくっつけた?写真の撮り方の問題かもしれないけれども車両短くない?


E2系にE6系の塗装をした?
N700S? 2両編成? 


ドクターイエローの赤色版?

破綻はなく、それっぽいものを出してきました。

Stable Diffusion 3 Medium

A picutre of a Japanese train
A picture of Shikansen

全部違う

Flux1dev

A picture of a Japanese train


ぜんぜん違う

midjourney

無料でも25枚生成できるので試してみます。(現在は終了してしまいました)著作権が向こう側にあるというのですが、著作権は発生していないと思っています。

A picutre of a Japanese train
なんかいい感じ


他のAIは編成写真だったりするがmidjourneyは「作品」って感じです

A picutre of Shinkansen
N700Sもどき
E3系もどき 多分奥羽本線
なんかおかしい
試験車両ですか?
N700Aかな?
E5とE6、N700Aが中途半端にくっついた?

在来線

新幹線の方は大丈夫らしいので次に在来線の方をやってみます

Imagen3

赤羽かな?
東急目黒線の武蔵小杉付近かな?
103だろ。ただ、縦横比が少しおかしい
車内の画像としても扉がおかしい
小田急

ここからは車両形式を指定してやっていきます

E233


むりか、なら、205なら

なにこれ?
なぜN700出てきた?あと、N700系統好きすぎ

無理か、

窓の数おかしい
なぜ乗務員室の扉の前に窓をつけたがる?

車両形式指定は無理なので路線を指定してみます

A picture of Japan's Yamanote line.
絶対違う
どこ?
どっかの私鉄の車両かな?
A picture of Yamanote line.
ドア数どうした?

ここまで来たら作戦を変更してGeminiに画像を下にプロンプトを書かせてそれでImagen3に投げてみます。元画像はこちら

Wikipediaより
imagine you're looking at two sleek, modern Japanese commuter trains side-by-side. These aren't your bullet trains, but the kind you'd see zipping around a city.
The main color is a vibrant, almost luminous green, with a pattern of darker green dots that fade towards the bottom, like a gradient. The front of the trains is kind of rounded, with a large, dark windshield that wraps around to the sides. Above the windshield, there's a digital display in bright orange or red that shows the destination, probably in Japanese characters.
They both have a single headlight in the center, bright white, and above that it looks like some kind of sensor or camera. There are also smaller lights below the windshield, maybe for signals. The trains look pretty new and clean, with shiny surfaces reflecting the surroundings.
One train is angled slightly to the left and the other to the right, so you can see the sides of both. They seem to be on tracks that are in a bit of a cutting, with walls and poles and electrical wires all around. In the background, you can see some trees and maybe a glimpse of a building or two. It gives you a sense that they're in a busy urban area.
Oh, and one detail I almost missed – there are some small numbers on the front of the trains, probably their identification numbers. They look pretty similar to each other, probably part of the same series.
相鉄の20000系の色違い?
車両どうなっている?
色使いはそれっぽいけれども…

さっきよりはましになったので説明を修正して再度やってみます

the picture shows two Japanese commuter trains, but they're not as futuristic as you might think. They're definitely modern, but they have a more classic commuter train look, not like bullet trains.
The color is a bright green, that's right, but it's a solid green, not a gradient with dots. Think more like a bright spring green, almost a lime green. The front of the trains has a more angular design, not rounded. It's kind of boxy, but with a slanted front.
The windshield is large and rectangular, with a black frame around it. Above the windshield, there's a destination sign, but it's not digital. It's more like an old-school LED display with orange lights showing Japanese characters.
Each train has two headlights, one on either side of the destination sign, and they're more rectangular in shape. They don't seem to have any extra sensors or cameras on the front.
The overall impression is clean and efficient, but maybe not as sleek and high-tech as you first imagined. They're definitely designed for everyday commuting, not high-speed travel.

どう頑張っても幅広車体、レンジが再現できませんでした。

midjourney

205らしいけれどもドア数がおかしい
線路が崩壊している
なぜ新幹線が出てきた? (まあ、秋田、山形新幹線は在来線直通だけれどもどう見ても車両が長すぎる)
真ん中の線路の幅どうした?
A picture of Yamanote line.


東海道線とか走っているE231にラッピングでもしたの?
車両分解していない?
線路どうなっているの?

山手線としか指定していないのにもかかわらず緑色の車両が出てきました。更に続けます


どっか外国の地下鉄かな?
E231に205の顔をくっつけたやつ? あと、なぜ中央線走っているの?
外国の地下鉄かな?
どうなっているの?

だんだんひどくなってきたのでこれぐらいにしておきます

Stable Diffusion 3 Medium

A picture of a Japanese local train.
A picture of Yamanote line


日本ではなくどっかの外国のやつとしか言いようがない画像が出てきました。

おまけ

全く関係ないのですがsakana.aiが開発したEvo-UkiyoeというAIで遊んでみます

蒸気機関車

文字は逝っていますが少しまともなのが出てきました。

終わりに

画像生成AIで鉄道の画像を生成してみました。今のところ大きな破綻は発生していませんが、日本のこの形式の画像というのは無理そうです(てかそもそも学習データに入っていない?)。また、今回試した中ではImagen3が1番話を聞いてくれました(ただ、アスペクト比が1:1しかないのが大きな問題なのだが……)。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?