ちょうど一年前に AI画像生成で毒キノコづくり で Adobe Fireflyや、ミッドジャーニーで画像生成したブログ記事を書いたことを思いだし、この一年で画像生成がどのくらい進化したのか、AI画像・動画生成で遊びながらみていきたいと思います。
まずは、Adobe Fireflyで画像生成
上/イラストタッチ、下/写真タッチ
「ゲームの世界観」「かわいい」「丸い」が咀嚼されておらず、去年の画像生成結果と比べるとプロンプトの再現性が劣っているように感じました。
↓ 同じプロンプトで昨年生成した画像
ミッドジャニーで動画生成が可能に・・!
同様のプロンプトでミッドジャーニーで画像生成。なぜかキャラ化されました 笑。「ゲームの世界観」「くつろぐ」というワードがキャラへ発展させたのかもしれませんね。
丸くコロンとしており、なかなかかわいい仕上がりです。
森の中を冒険していたのかな?・・と想像力をかきたてられるリアルさもあり、構図や色合いなども素晴らしいです。一枚絵としての魅力もあり画像生成のクオリティは、ミッドジャーニーが群を抜いているように思います。
AI画像生成
ミッドジャーニーでは、作成した画像をボタンひとつで動画が生成できるようになりました。
数秒のとても短い尺動画ですが、ボタンひとつで動画作成が可能になりました。
音楽生成はまだ未対応ですが、将来的に実装されるのか期待しているところです。
シンプルな動きですが、かわいいです!
Geminiは音楽・効果音生成もできる!
同様のプロンプトにBGM生成の指示を足し、動画を作成しました。
プロンプト「ゲームの世界観、清涼感溢れる森林の中で、くつろぐ、赤白の水玉模様の、かわいい丸いキノコが揺れている。BGMは80年代日本のアニメソング。キノコはゆれるとフワフワ音がする」
画像生成のクオリティは目を瞑るとして・・笑
やはり尺は短いのですが、テキストからBGM付き動画作成ができることに感動です♪
「80年代日本のアニメソング」が再現されている・・!
ガラスでできた果物をカットする動画
少し前にバズっていた動画を模倣してみました。
果物をカットしている音が、なんとも気持ちの良い音です!
昨年と比較すると、Geminiの進化が圧倒的なのではないでしょうか。
Geminiの画像生成・動画生成は、イラストやアート系の生成は弱いけど、リアルタッチであれば驚くようなクオリティを発揮するときがあります。
AIの可能性は未知数!プロンプトに縛られない画像・動画生成
AIの進化は、私たちの想像をはるかに超えるスピードで進んでいます。プロンプトに縛られない自由な画像・動画生成の未来は、クリエイティブな表現の常識を根底から覆す可能性を秘めています。次にAIがどのような驚きをもたらしてくれるのか、目が離せません。