Soraが降りてきた
焦らしに焦らしてとうとうOpenAIのSoraが一般公開されました。
2月の発表から実に10ヶ月です。
日本時間の12月10日(アメリカでは9日)に公開されたのですが、その日は全然ログインできませんでした。世界中のAIオタクが待ち焦がれてたんだからね、そりゃそうだろう。乃木坂の齋藤飛鳥の卒コンを越えるトラフィック状態だったに違いない(すいませんファンなんです)。
ようやく入れたのが14日の朝。
では、試しに使ってみましょう。
いろんなとこ書いてあるのでご存知でしょうが、Soraは有料です。ChatGPTの課金プランに入っている必要があり、ChatGPT Plusが月3000円、ChatGPT Proが月30000円です。高い!私はPlusを使っています。
Soraの発表からの10ヶ月で動画生成AIは群雄割拠状態になっています。
私は現在、Runway gen3とKlingを使っています。他にもLuma dream machineとかHailuo AIとかいろいろあって追いきれない状況です。とりあえずSoraを私が使ってる2つと比べてみます。
まずですね、いきなりSoraつまづきました。
Midjourneyで生成した画像でImage to Videoをやろうとしたのですが、どうやらChatGPT Plusのアカウントだと人物が入っている画像は素材として使用できないようです。こんなメッセージが出ます。
まじかよ。”People”がいたらアカンて、それはいきなり使えないじゃんか。
じゃあね、Soraが得意だと言われているText to Videoでやってみましょう。
プロンプトは”k-pop artist, male, singing dancing, full body shot”です。「K-popの男が歌って踊ってる全身ショット」です。
出てきたのがこれ。
なかなかですね。画質は480pなので粗いですが動きはとてもいいです。K-popぽいし。
しかし480pっていうのは使えないなあ。720pもできるように書いてあるのですが、なぜか480pしか生成できませんでした。理由は今後検証します。
Runwayはこちら。RunwayはText to Videoがどこにあるのかわからなくなっていたので、Text to Imageで静止画を生成してからそれをImage to Videoで動画化しました。
まあなんと言うかね。悪くないけどしょぼいのが出ましたね(笑)。
でもRunwayは720pです。
で、Klingはこちら。
これは相当面白いですね。Klingは中国のAIなのでK-popというより中国の体操選手みたいです。
こう見ると動きは圧倒的にSoraがいいです。そこは素晴らしい。
でもね、まずImage to Videoで人物が使えない。それはダメです。月3万円払えばいいのでしょうが、そこまでの価値があるかというと今のところ疑問です。私はまだ試していないのですが、他の方がYouTubeにアップしていた検証動画によると、キャラクターの統一性にも問題があるようです。同じ人物を複数カットで生成できないということですね。これは困ります。
狙った通りの映像を作るにはSoraは今のところ適していない気がします。来月には変わっているかもしれませんが。
OpenAIはものすごくコンプライアンスを考えてSoraを育てているのだと感じます。それはとても大切なことで、今現在不便でも将来的にはビジネスや教育領域でその取り組みが役に立つでしょう。
でもね、今私がこれに月3万円払うかというと、払いませんね。多分、数ヶ月経つともっと使いやすくなってくると思います。それからでいい気がします。この価格設定は、今後の生成AIのサブスクリプションの値段に影響を与えそうなので、そこは心配です。
今はKlingがいいです。体操選手が好きなわけではありません。今日の検証だと分かりにくいですが、自然さと安定感において現在はRunwayより上を行っています。
Klingについてはまた改めて書きます。