本物のエベレストの写真はどっち?

でも、このように「それっぽい自然」と「本当の物理現象に基づいたヴァーチャルな自然」が混在した状況だからこそ、大切なのが冒頭にも話題に出た審美眼です。どこまでがそれっぽいAIでどこまでがヴァーチャルか、それとも実在か。その境界線を見定める能力が、AIを使いこなせるかどうかを分けるのだと僕は考えています。もちろん、表現は常に更新されるので、AIっぽいものも美しい実存を超えたものになるかもしれません。

審美眼の重要性を知るために、簡単に実験してみましょう。

たとえば、僕がエベレストの頂上から見た写真が欲しいと思い、画像AIに「エベレストの頂上から撮影した、フォトリアリスティックな写真を生成してくれますか」という指示を与えてみたとします。

せっかくなので、ChatGPTに組み込まれている画像生成AIの「DALL・E3」(画像1参照)と、同じく画像生成AIの「Midjourney」(画像2参照)を使って、画像をつくってみました。どうでしょうか? 仮に同じ指示を与えても、どの生成AIを使うかによって、出来上がるデータには多少の差が生まれることがわかります。

【画像1】DALL・E3でつくったエベレストの写真(左)、【画像2】Midjourneyでつくったエベレストの写真(右)
【画像1】DALL・E3でつくったエベレストの写真(左)、【画像2】Midjourneyでつくったエベレストの写真(右)(出所=『落合陽一責任編集 生成AIが変える未来―加速するデジタルネイチャー革命―』)

偽者っぽいほうがリアルに近かった

ただし、問題は、僕自身がエベレストの山頂に登ったことがないという点です。だから、本当に正しいエベレストからの風景とは何かがよくわかっていないので、「これは山脈があるからエベレストっぽいな」といったなんとなくのイメージからしか選ぶことができません。

そこで、2つのAIでつくった画像を比較してみると、「『DALL・E3』でつくった写真(画像1)よりも、『Midjourney』でつくった写真(画像2)のほうが本物に近いように見えるなぁ」と思いました。

では、いざ本当のエベレストの写真(画像3)を見てみてください。どうでしょうか? 生成したデータは、実物とは案外違うことがわかります。そして、僕自身が「こっちのほうが偽物っぽいな」と思っていたほうの写真が、実はリアルなエベレストの光景に近かったという結果になりました。

【画像3】本物のエベレストの写真
写真=iStock.com/DanielPrudek
【画像3】本物のエベレストの写真

このように、審美眼がないと、一見、偽物っぽくてリアリスティックでないもののほうが、実は本物に近いと判断してしまう。そして、これと同じようなケースは、今後多々発生すると思います。しかし、本物が重要かどうかも変わってくるかもしれませんね。