OpenAI は、チャットボットの ChatGPT や AI 絵画ツールの DALL-E 3 に加え、「AI 映像生成」にも力を入れ始めました!最近、OpenAI は新しい映像生成モデル「Sora」を発表し、テキスト記述だけで 60 秒の超リアルな映像を生成できるようになりました。
現在、Sora はまだ公開されていませんが、すでに驚くべき実際の効果が期待され、正式にリリースされた後の発展が非常に楽しみです。
更に面白いコンテンツを観たい人は、Instagram @applealmondjp と Twitter X @Applealmond1 をフォローしてください!
Sora は、OpenAI が最近発表した映像生成モデルで、ユーザーは AI 絵画と同様にテキスト記述(プロンプト)を提供するだけで、ユーザーの要求に応じた 60 秒の映像を生成できます。
OpenAI によると、Sora はユーザーの記述内容を理解でき、記述された人物や物事が実世界でどのように存在するかを判断し、複雑なシーンや複数のキャラクター、特定の動作、正確な主題と背景の詳細を含む映像を生成します。
さらに、Sora は深い言語理解能力を持ち、テキスト記述を精確に解釈し、感情を持つキャラクターを生成できます。また、統一されたキャラクター像と視覚スタイルのもとで複数のカメラアングルの画面を生成することもできます。
そして、Soraの実際の効果は本当に驚くべきもので、生成された映像は超リアルです。以下は OpenAI が提供した例です:
しかし、OpenAI は Sora が現段階では開発途中であり、半製品の段階であるため、まだすべてのシーンの詳細を完全に細かく再現することはできないと述べています。たとえば、クッキーを食べた後にクッキーに噛み跡がない、人がランニングマシンで逆方向に走る、理由もなく複数の人物が突然現れるなどの問題があります。そのため、Sora はまだ一般には公開されていません。
現在、Sora は「Red Teaming」テストにのみ公開されており、モデルが潜在的な危害やリスクを持っているかどうかをテストしています。また、視覚芸術家、デザイナー、映画制作者などにも公開されており、専門家の意見を通じて Sora モデルを継続的に最適化することを目指しています。
OpenAI は、Sora の開発段階で早期に発表する目的は、外部との協力を早期に開始し、より多くのフィードバックを得るためであり、同時に将来の AI の能力について一般に理解を深めるためだと説明しています。
更に面白いコンテンツを観たい人は、Instagram @applealmondjp と Twitter X @Applealmond1 をフォローしてください!
もっと読む