OpenAI が新たに映像生成モデル「Sora」を発表、テキストから超リアルな映像を生成

OpenAI は、チャットボットの ChatGPT や AI 絵画ツールの DALL-E 3 に加え、「AI 映像生成」にも力を入れ始めました！最近、OpenAI は新しい映像生成モデル「Sora」を発表し、テキスト記述だけで 60 秒の超リアルな映像を生成できるようになりました。

現在、Sora はまだ公開されていませんが、すでに驚くべき実際の効果が期待され、正式にリリースされた後の発展が非常に楽しみです。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp と Twitter X @Applealmond1 をフォローしてください！

OpenAI の新しい映像生成モデル「Sora」

Sora は、OpenAI が最近発表した映像生成モデルで、ユーザーは AI 絵画と同様にテキスト記述（プロンプト）を提供するだけで、ユーザーの要求に応じた 60 秒の映像を生成できます。

OpenAI によると、Sora はユーザーの記述内容を理解でき、記述された人物や物事が実世界でどのように存在するかを判断し、複雑なシーンや複数のキャラクター、特定の動作、正確な主題と背景の詳細を含む映像を生成します。

複雑なシーンと複数のキャラクター：Soraは人物、動物、物体など複数の要素を含むシーンを創造でき、これらの要素間で相互作用が行われ、画面が物語性に溢れるようにします。
特定の動作：Soraは歩く、走る、跳ぶ、飛ぶなどの異なる動作を理解し描写でき、これらの動作は実世界の物理法則に合致します。
精確な主題と背景の詳細：Soraは主題と背景の詳細を正確に描写でき、人物の表情、服装、物体の外観、光影効果などが含まれます。

さらに、Sora は深い言語理解能力を持ち、テキスト記述を精確に解釈し、感情を持つキャラクターを生成できます。また、統一されたキャラクター像と視覚スタイルのもとで複数のカメラアングルの画面を生成することもできます。

そして、Soraの実際の効果は本当に驚くべきもので、生成された映像は超リアルです。以下は OpenAI が提供した例です：

Sora はまだ利用可能ではなく、詳細の改善が必要です

しかし、OpenAI は Sora が現段階では開発途中であり、半製品の段階であるため、まだすべてのシーンの詳細を完全に細かく再現することはできないと述べています。たとえば、クッキーを食べた後にクッキーに噛み跡がない、人がランニングマシンで逆方向に走る、理由もなく複数の人物が突然現れるなどの問題があります。そのため、Sora はまだ一般には公開されていません。

現在、Sora は「Red Teaming」テストにのみ公開されており、モデルが潜在的な危害やリスクを持っているかどうかをテストしています。また、視覚芸術家、デザイナー、映画制作者などにも公開されており、専門家の意見を通じて Sora モデルを継続的に最適化することを目指しています。

OpenAI は、Sora の開発段階で早期に発表する目的は、外部との協力を早期に開始し、より多くのフィードバックを得るためであり、同時に将来の AI の能力について一般に理解を深めるためだと説明しています。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp と Twitter X @Applealmond1 をフォローしてください！

もっと読む