Apple が開発した AI ツール:テキストを使って動的な画像を生成できる!

Apple が開発した AI ツール テキストで動的な画像を生成できる

最近、多くの人が bing や Midjourney のような AI ツールを使用して画像を作成していますが、Apple も今年 AI 関連の機能を強化すると見られています。先週、外国メディアが報じたところによると、Apple は「MGIE」という名前のオープンソース AI モデルを発表し、AI を使ってテキストをアニメーションに変換することができます。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp と Twitter X @Applealmond1 をフォローしてください!

Apple の研究者が AI オープンソースモデルを発表

Apple の研究者は先週、ユーザーが自然言語指示(VentureBeat 経由)で画像作業を処理できる新しいオープンソース AI インテリジェンスモデルをリリースしました。

実現できる内容には、画像の色調整、コントラスト調整、写真スタイルの変更などが含まれ、画像のトリミングやサイズ変更も Apple の MGIE モデルを通じて処理できます。

例えば、ピザの写真を与え、ピザをもっと健康的に見せるように指示すると、緑の野菜をピザに追加し、野菜があると健康的に見える感じを出します。

Apple 大型語言模型 AI

または、空を白雲から雷雲に変えたり、背景の雑物を取り除いたり、明るさを調整したり、ドーナツにベリージャムを加えたりすることも、Apple の MGIE モデルで実現できます。

Apple 大型語言模型 AI

テキストを使って動的な画像を生成

同時に、Apple は「Keyframer」という新しいツールも導入しました。自然言語入力だけで動的な画像を生成できます。

Apple のこの報告で示された2つの例のうちの1つは、宇宙の星が点滅し、惑星の周りの光輪も変化することです。もう1つは、宇宙ロケットが絶えず上昇するため、背景の月と雲が下降することです。

Apple 大型語言模型 AI

これらの画像は既存のAIツールで1枚ずつ生成できますが、毎回の生成結果が異なる可能性があるため、連続して不自然になることがあります。しかし、Apple の開発者は、AI 言語モデルと連携する彼らの開発ツールを使用して、これらの画像を1つの指示で生成しました。

Apple 大型語言模型 AI

さらに、この発表の内容は、Apple の開発者がカリフォルニア大学の研究者と共同で完成させ、国際学術会議で発表した成果です。

これらの機能が直接 Apple 製品で使用されるわけではありませんが、Apple はこれらの機能と技術を他のアプリケーションに統合することを考えていると思われます。

アナリストは、Apple が 2024 年には AI 分野でより大きな進展を見せると予測

Apple は常に AI を使用しており、写真の処理、状況や時間に応じて異なるウィジェットを表示する機能、Homekit 関連のアプリケーションなど、iPhone の多くの機能に実装されていますが、これらは比較的目立たないものです。ChatGPT、Bing、Google Gemini(以前のBard)と比較すると、「本当に AI ツールを使用している」という感覚はあまりありません。

iOS 18 と iPadOS 18 のリリース後、Apple は ChatGPT のような生成型 AI 機能を導入し、Siri に統合して Siri 2.0 に進化させると予想されています。これは、今年 6 月の WWDC で最初に見ることができるかもしれません。みなさん、楽しみにしてください。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp と Twitter X @Applealmond1 をフォローしてください!

関連記事