Aiには「自我」がない
Stable Diffusionを使って分かったこと
これ、いい感じに不気味な写真でしょう。
私の個人的なプロジェクトのためにStable Diffusionで試しに作ってみた画像です。
A Japanese woman hold Stuffed rabbit, tired, dirty, photograph, cinematic,
「ひとりの日本人の女性がぬいぐるみのウサギを抱いている、くたびれて、汚れた感じ、写真、映画っぽく」
というプロンプト(呪文)で生成したのですが、問題がいくつかあります。
「”A” Japanese woman」と指示しているのに、2人になっています。これがよくあるのです。”A”とか”Solo”とか”One”とか書いても2人にしてくる。
そして手が繋がってますね。シャム双生児かよ。
「悪魔のシスター」ブライアン・デ・パルマですね。
そういう意味ではなかなかいい絵だと思います。
いやいや、でもそういう狙いじゃないからダメよ。
1人でいいんだって。
One fortune teller, an old Japanese woman, late at night, under a bridge, candle light, photograph, cinematic
「ひとりの占い師、ひとりの日本人の老婆、夜遅く、橋の下で、ロウソクの光、写真、映画っぽく」
これも“One”って最初に書いているのに2人になっています。
橋の下でもないですね。
まあ双子の占い師のばーさん、不気味でいいですけど。
ある意味、私のイマジネーションを拡張してくれている。サンキュー。
Stable Diffusionでは常にこういう「1人でいいのに2人作ってくる」という問題が起きます。それを1人に戻すのにすごく苦労します。
また、さっきの手が繋がってるなんてのはいい方で、1つの体から首が2本みたいな怖いのも出てきます。
「遊星からの物体X」かよ。
それで、あーなるほどと気がつきました。
Aiには「自我」がない
私たち人間は「私」=「自分」=「個」と認識していて、それが世界を認識する基本単位なのですが、Aiは違うのです。
Aiには「個」=「1人」という概念がないのです。
たぶん、体がないからですね。
人間は生まれた時から皮膚で世界と隔絶されていて、それによって「個」という概念を認識の最小単位として揺るぎなく持っているのですが、Aiはそんなの知らないのです。
だから「1人」っていう描画が自然にできない。
人間を画像としてしか把握していないからです。
なぜ「2人」にしたがるのかは謎ですが。
ChatGPTを使っているときは、まるで誰かと会話しているようなので「相手」がいるような気持ちになってしまいます。
でもStable Diffusionをやると分かります。
「相手」はいないのです。
Aiには「自我」がないから。
これは面白いなと思いました。
「自我」がないやつと交信したのは初めてだ。
犬だって猫だって、多分「自我」がある。自分や相手を「個」として認識していると思います。
でも、Aiには「自我」がないのです。
「Her/世界でひとつの彼女」っていう映画、そういう意味でもよくできてたなと思います。
スカーレット・ヨハンソンがAiの声で、ホアキン・フェニックスがその声に恋をするんだけど、彼女は「個」ではないのです。日本語タイトルはものすごく間違ってますね。あるいは人間からの捉え方として、あえてそういうタイトルにしたのか?
スパイク・ジョーンズすごいな、10年前にAiの本質が分かってたんだ。
すごくいい映画なので、見てない人はぜひ。
Stable Diffusionも他のAiも、私たちが使えば使うほど、人間らしさを学習して、付き合いやすいまるで友達のような存在になっていくでしょう。
それはそれでいいことだと思います。
ですが、Aiは本質として「自我」がない「知性」なのだということを忘れないようにしておくべきです。私は初期のAiを触った人間としてそう記しておきます。
間もなくそう意識することが難しくなっていくだろうと思いますので。
おまけ
ちなみにStable Diffusionは指の表現が超苦手で、「握手」を描かせるとこんなことになります。
handshake, a man and a woman, Close-up of hand, photograph, cinematic
酷いね。
もうひとつ、ちなみに「1人」が苦手なら「双子」はどうなのかとやってみました。
「シャイニング」的に。
Beautiful twin little girls, wearing pale blue dresses, standing in front of an elevator, in a big hotel, photograph, cinematic, like “shining”
4人になりました。なんで倍にするんだろう?エレベーターほぼ無視されています。
それにしても美少女系は得意ですね、Ai。右の子の指は変だけど。
「Japanese」ってプロンプトを入れてないのに東洋人なのは、私に合わせてきたのだろうか?そういう学習も進んでいるのでしょうか?
最後にもうひとつおまけ。
Stuffed rabbit, tired, dirty, photograph, cinematic
また2匹だ。なかなかかわいい。