デジタル国家ウクライナ デジタル国家ウクライナ

リアル動画生成AIがもたらすビジネス変革

~2024年の最新技術と展望~

柏村 祐

目次

1.動画生成AIのさらなる進化

動画生成AIの技術は近年顕著な進歩を遂げており、その背景には深層学習技術と膨大なデータセットの利用がある。深層学習とは、人間の脳の働きを模倣した仕組みを用いて、大量のデータから複雑なパターンや関係性を学習する技術である。この技術を活用することにより、初期の段階では基本的なアニメーションの生成に限定されていた動画生成AIは、現在では複雑な物語性を含むリアルな動画を生成する能力をもつに至っている。

特に、文章による指示に基づく動画生成では、複雑な作業を行わずに動画を作成することができる。この技術は、映像制作における時間とコストの削減はもちろん、人間には不可能な独創的な視覚表現を生み出すことを可能とする。たとえば、広告業界や映画制作では、独自の世界観を持った映像を迅速に生成することで、視聴者に新たな体験を提供している。このように、AIは単に早くて簡単なツールを超え、クリエイティブな分野において人間とは異なる視点や表現を提供することで、その価値を高めている。

そのようなリアル動画生成AIは、映画制作や教育、医療など、様々な分野に大きな影響を与えようとしている。本レポートでは、最新技術の動向とビジネスへの応用例を紹介し、その将来性について考察する。

2.リアル動画生成AIの実態

以下では、最新版のリアル動画生成AIのレベルを具体的に検証することにより、その性能を詳しく確認する。本稿で取り上げる最新版のリアル動画生成AI(通称Sora)によって作成されたビデオは、合計48本である(注1)。このうち、43本はAIが創ったのか人間が創ったのかわからないほど高品質であり、まったく欠点が見当たらない。しかし残りの5本は、現実世界ではあり得ないような動画であった。ここでは、この双方の動画の内容を具体的に検証する。

リアル動画生成AIの技術は、高度な機械学習に基づくものである。この技術は、大量の画像と動画のデータセットから学び、人間が本物と見間違えるような映像を生成することができる。このプロセスには、敵対的生成ネットワーク(GAN)やトランスフォーマーモデルが用いられ、これらは単純なテキストの指示から映像を生成する能力を有している。この進化の一環として、AIは複雑な背景の理解、物体間の相互作用、そして人間の自然な動きや表情の再現を学んでいる

まず、欠点がまったく見当たらない動画の例として、犬が雪の中で遊んでいる動画を挙げる。AIに「雪の中で遊ぶゴールデンレトリバーの子犬たち。彼らの頭は雪に覆われ、雪から飛び出している」と指示したところ、指示通りの20秒の動画が生成された(図表1)。

図表 1
図表 1

また、欠点がまったく見当たらない動画の事例として、電車の窓から見える風景動画を挙げる。AIに「東京郊外を走る電車の窓から見える風景」と指示したところ、指示通りの8秒の動画が生成された。この動画では、電車の窓ガラス越しに見える東京郊外の街並みが映し出された直後、建物の前を電車が通過する瞬間に、光が遮断され、電車の窓に人の映り込む様子までが再現されている(図表2)。

図表 2
図表 2

次に、現実世界では想定できない映像を含む動画の一例として、空中に浮遊する椅子の動画を挙げる。AIに「考古学者が砂漠で一般的なプラスチックの椅子を発見」と指示したところ、13秒の動画が生成された。指示に沿ったリアルな動画が再現されているかに見えるが、途中からリアル動画生成AIは椅子の重さを動画上で再現することに失敗し、現実世界ではあり得ない椅子が数秒間空中に浮遊する様子が映し出された(図表3)。

図表 3
図表 3

また、現実世界では想定できない映像を含む動画のいま1つの事例として、動画の最初に登場する3匹の狼が分身して5匹になる動画を挙げる。AIに「草に囲まれた人里離れた砂利道で、5頭のハイイロオオカミの子供がじゃれ合い、追いかけっこをしている」と指示したところ、10秒の動画が生成された。初めに映し出された3匹の狼が、4匹、5匹と分身してしまい、現実世界では考えられない映像が生成された(図表4)。

図表 4
図表 4

以上のように、最新版のリアル動画生成AIが生み出す動画は、人間の目で見分けがつかないほど質の高いものが多数を占めた。しかし、一部には物理法則に矛盾したり、不自然な点が含まれる動画も生成された。これは、AIの学習データやアルゴリズムにまだ改善の余地があることを示している。今後も継続的な研究開発により、より完全なリアル動画の生成が可能になることが期待される。なお、完全自動生成された動画の内容に対する真偽判断は、引き続き重要な課題である。

3.リアル動画生成AIのビジネスへの応用

動画生成AIの技術は、ビジネス領域においてもその応用範囲を広げている。特に、リアル動画生成AIは、マーケティング、広告、教育、コンテンツ制作など、多岐にわたる業種で活用されている。

まず、マーケティングと広告分野では、リアル動画生成AIを用いることで、高品質なプロモーションビデオや商品紹介動画を短時間かつ低コストで制作できる。従来、高額な費用と多くの時間を要した映像制作が、AIの力により効率化されることで、中小企業でも競争力のあるマーケティング活動が可能になる。たとえば、特定の商品やサービスを宣伝する広告ビデオを制作する際に、リアルな人物や背景を含む動画をAIに生成させることができる。ターゲットオーディエンスに合わせたカスタマイズも容易になるだろう。

また教育分野では、リアル動画生成AIを活用することで、学習教材としての動画コンテンツを充実させることができる。歴史上の出来事を再現したり、科学的な実験をビジュアライズする動画を生成し、学生の理解を深めることが可能になる。このような教育現場での活用は、学習効果の飛躍的な向上に大きく貢献するだろう。

さらにエンターテイメント業界においては、リアル動画生成AIは映画やアニメーション制作に革命をもたらす可能性を秘めている。特に短編映画やミュージックビデオの制作において、AIを活用することで、従来は想像もつかなかったようなクリエイティブな表現が可能になり、制作の自由度が大きく広がることが予想される。さらに、リアルタイムで動画を生成する能力は、ライブイベントの演出に新たな可能性をもたらすかもしれない(図表5)。

図表 5
図表 5

4.リアル動画生成AIの将来性

現在、動画生成AIの品質は顕著に向上しており、人物の動きや表情、背景の描写がかなりリアルで自然になっている。これは、進化した深層学習アルゴリズムと、映像制作に特化した大規模なデータセットの活用によるものである。これらの技術の進化により、AIは実写と見分けがつかないほどの高品質な動画を生成する能力を有するに至っており、今後もさらなる発展が大いに期待されている。リアル動画生成AIの技術進化に伴い、ビジネスへの応用もますます拡大することが予想される。ただ同時に、生成された動画の内容の真偽を判断するためのガイドラインの策定や、倫理的な問題に対処するための枠組み作りも重要となってくるだろう。

リアル動画生成AIのビジネスでの活用は、新たな価値の創出という観点からも大きな期待が寄せられている。単に映像制作の効率化だけでなく、クリエイティブな表現に新たな地平を切り拓き、人々の想像力を豊かにすることにも寄与するからだ。その意味では、リアル動画生成AIは、社会全体に影響を与えるイノベーションと位置づけることができるのではないだろうか。

【注釈】

  1. OpenAI HPより
    https://openai.com/sora

柏村 祐


本資料は情報提供を目的として作成されたものであり、投資勧誘を目的としたものではありません。作成時点で、第一生命経済研究所が信ずるに足ると判断した情報に基づき作成していますが、その正確性、完全性に対する責任は負いません。見通しは予告なく変更されることがあります。また、記載された内容は、第一生命保険ないしはその関連会社の投資方針と常に整合的であるとは限りません。

柏村 祐

かしわむら たすく

ライフデザイン研究部 主席研究員 テクノロジーリサーチャー
専⾨分野: AI、テクノロジー、DX、イノベーション

執筆者の最新レポート

関連レポート

関連テーマ