OpenAI が新たに映像生成モデル「Sora」を発表、テキストから超リアルな映像を生成 - アップルジン

OpenAI は、チャットボットの ChatGPT や AI 絵画ツールの DALL-E 3 に加え、「AI 映像生成」にも力を入れ始めました！最近、OpenAI は新しい映像生成モデル「Sora」を発表し、テキスト記述だけで 60 秒の超リアルな映像を生成できるようになりました。

現在、Sora はまだ公開されていませんが、すでに驚くべき実際の効果が期待され、正式にリリースされた後の発展が非常に楽しみです。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp と Twitter X @Applealmond1 をフォローしてください！

OpenAI の新しい映像生成モデル「Sora」

Sora は、OpenAI が最近発表した映像生成モデルで、ユーザーは AI 絵画と同様にテキスト記述（プロンプト）を提供するだけで、ユーザーの要求に応じた 60 秒の映像を生成できます。

OpenAI によると、Sora はユーザーの記述内容を理解でき、記述された人物や物事が実世界でどのように存在するかを判断し、複雑なシーンや複数のキャラクター、特定の動作、正確な主題と背景の詳細を含む映像を生成します。

複雑なシーンと複数のキャラクター：Soraは人物、動物、物体など複数の要素を含むシーンを創造でき、これらの要素間で相互作用が行われ、画面が物語性に溢れるようにします。
特定の動作：Soraは歩く、走る、跳ぶ、飛ぶなどの異なる動作を理解し描写でき、これらの動作は実世界の物理法則に合致します。
精確な主題と背景の詳細：Soraは主題と背景の詳細を正確に描写でき、人物の表情、服装、物体の外観、光影効果などが含まれます。

さらに、Sora は深い言語理解能力を持ち、テキスト記述を精確に解釈し、感情を持つキャラクターを生成できます。また、統一されたキャラクター像と視覚スタイルのもとで複数のカメラアングルの画面を生成することもできます。

そして、Soraの実際の効果は本当に驚くべきもので、生成された映像は超リアルです。以下は OpenAI が提供した例です：

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) February 15, 2024

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq

— OpenAI (@OpenAI) February 15, 2024

Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6

— OpenAI (@OpenAI) February 15, 2024

Sora はまだ利用可能ではなく、詳細の改善が必要です

しかし、OpenAI は Sora が現段階では開発途中であり、半製品の段階であるため、まだすべてのシーンの詳細を完全に細かく再現することはできないと述べています。たとえば、クッキーを食べた後にクッキーに噛み跡がない、人がランニングマシンで逆方向に走る、理由もなく複数の人物が突然現れるなどの問題があります。そのため、Sora はまだ一般には公開されていません。

現在、Sora は「Red Teaming」テストにのみ公開されており、モデルが潜在的な危害やリスクを持っているかどうかをテストしています。また、視覚芸術家、デザイナー、映画制作者などにも公開されており、専門家の意見を通じて Sora モデルを継続的に最適化することを目指しています。

OpenAI は、Sora の開発段階で早期に発表する目的は、外部との協力を早期に開始し、より多くのフィードバックを得るためであり、同時に将来の AI の能力について一般に理解を深めるためだと説明しています。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp と Twitter X @Applealmond1 をフォローしてください！

もっと読む