Apple の AI 人工知能アプリケーションは、ChatGPT とは少し異なります

Apple のXR(拡張現実)デバイスの主要な機能の一つは、Fitness+ サービスを中心に展開することです。

仮想空間を利用して、どこでも「ジム」に没入できるようになります。もちろん、仮想トレーナーも必要不可欠です。

以前は、「仮想トレーナー」は標準的な運動デモンストレーションだけを提供すると考えていましたが、Appleの計画では、「彼」にはさらに多くの「知識」が与えられるかもしれません。

Appleは、Apple Watchのヘルスエコシステムを拡大するため、ヘルス機能にAIを導入する計画です。

AIヘルスコーチを導入し、Apple Watchが記録したデータとアルゴリズムを利用して、ユーザーのエクササイズプランをカスタマイズし、飲食習慣を改善し、睡眠の質を向上させ、健康状態を維持または改善します。

これは、最近のAIとAppleとの関係における最新のニュースであり、しかしAppleのAIヘルスコーチは、現在人気のある生成型AI、例えばChatGPT、Bing、Bardとは明らかに異なります。

「AI ヘルスコーチ」は、ChatGPTのような新しい戦場を開拓するトレンドではなく、むしろ機能の一つという位置づけです。

Appleは、シリコンバレーで生成型AIの開発に熱中している企業に対して、自分たちで一線を引き、競争に参加せず、独自の道を歩むことを選択しました。これは他とは一線を画す行動です。

Siriは人工知能ではなく、Appleの人工知能は実際には微細な部分に隠れています。

12年前、Appleは初めてSiriを一般に公開し、それをiPhone 4sと共に市場に投入しました。

その後の展開で、Siri は Mac、iPad、HomePod、Apple Watch、さらには AirPods など、Apple の全てのスマート製品に応用されました。

Siri は最初から「スマート音声アシスタント」として定義されており、音声認識と自然言語処理を通じてユーザーの質問に答え、デバイスを制御し、タスクを実行することができます。

また、スマートフォンに音声アシスタントを搭載する流れをリードしました。その結果、Samsung の Bixby、Xiaomi の小愛同學、OPPO の小欧などが生まれました。

同じように、Siri は一般の大衆によく知られており、それは人工知能の一つの原型であると考えられています。

しかし、12 年間の進化の過程で、Apple は深層的なアップグレードをあまり行わず、主に機能点の補完に焦点を当ててきました。

現在でも、それは 2011 年のあの純粋さを保っており、困難な問題に直面した時にも、同様に率直に「私はよくわかりません、これはインターネットで見つけた答えです」と答えるでしょう。

2023 年、生成型 AI があふれている今日、Siri の「純粋さ」は、話術に長けた ChatGPT とは鮮やかな対比をなしています。

まるで、Apple は人工知能の開発には興味がなく、ただスマートフォンやコンピュータを売りたいだけのようですが、実際のところは本当にそうなのでしょうか?

実は Siri は、人工知能と呼ぶべきものではなく、答えのデータベース型の音声アシスタントに過ぎません。

ユーザーがそれを呼び出し、一連の指示を出すと、そのデータモデルはまずローカルで処理を行い、単純なローカルリクエスト(音量調整、アラーム設定など)かどうかを素早く確認します。これは既知の情報を用いて素早く処理を完了させるためのものです。

それ以外の場合、Siri はクラウドでより大きなデータベースを検索し、あなたに答えを提供するか、検索できない場合はウェブ検索結果を提示します(これが大半のケースです)。

一方で、ChatGPT は先にローカルを通じてクラウドへの手順を持っていません。問題に基づいて直接 Microsoft の Azure クラウド計算センターにアクセスし、大量の計算能力と対応するモデルを利用して推定を行います。理解できているかどうかに関わらず、「生成」された回答を提供します。

この点から見て、Siri と ChatGPT は二つの傾向を示しています。Apple は技術をローカルに展開し、問題解決にはまずローカルの計算能力を優先的に使用する傾向があります。一方で、ChatGPT は完全にインターネットとデータベースセンターの大規模な計算能力に依存しています。

Apple の AI も同様で、その多くは Apple の製品の数々の機能の中に隠されています。それは誰もが気づかないような存在ですが、ユーザー体験は大いに改善されています。

例えば、シャッターを押すと、iPhone は一連の写真を撮影し、対応するモデルアルゴリズムを使用して画像認識を行い、最良の結果を選択して最終的な画像としています。

また、Apple Pencil を iPad で使用すると、まるで本物のペンと紙で書いているかのような体験ができます。これには、筆跡追跡と手のひら認識が使用されています。これにより、筆跡がタイムリーに反応しながらも、手のひらがスクリーンに触れて誤ってタッチすることがありません。

同様のアプリケーションは Face ID にもあります。Face ID の安全性と効率性の両立により、ユーザーの顔の変化に対応し、眼鏡やひげの遮蔽により認識結果が影響を受けることはありません。

さらに、現在の iOS では、マスク解除もサポートされており、半分の顔だけで以前と同じ安全レベルの解除効果を達成しています。

これらの機能から Apple の多機器、プラットフォームの連携、相互接続などの特性まで、あらゆる面に Apple の Neural Engine(ニューラルエンジン)が参加しています。これが Apple AI の表現方法です。

生成型 AI とは異なり、Apple AI の重視点は、エンドユーザーの体験をどのように向上させるかです。

Siri が ChatGPT のようになる可能性はあるのでしょうか?

ChatGPT がリリースされてから間もなく、公式 API に接続する Web ベースのシェルアプリケーションも続々と登場しましたが、実際にシステムに組み込まれてエンドユーザーとのアプリケーションやインタラクションが実現するものはまだありません。

これは以前、ChatGPT や New Bing などの生成型 AI がまだ古典的な対話インタラクションにとどまっていると考えられた理由でもあります。

実際の人間とマシンの対話、またはエンドユーザーサービスはまだ実現していません。

OpenAI の CEO Sam Altman は、マサチューセッツ工科大学での講演で、「大型モデルの時代はピークに達しており、新たな思考と方法を用いて AIGC を進展させる必要がある」と述べています。

AIGC の業界動向を共有すると同時に、新たに参入したテクノロジー企業に対して「あなたたちはすでに遅れている」と示唆しました。

これは AIGC の第一波を逃した Apple にとってもチャンスであり、自身の言語モデルを訓練するためのリソースを使うよりも、生成型 AI を自身のエコシステムに組み込む方法を考慮すべきです。

車輪を再作成するよりも、車を作ることを考えるべきです。

「長年放置されていた」 Siri は、大型言語モデルを Siri に接続して、それを Smart Siri に変え、Apple ID の下で Apple の全エコシステムを制御するスマートハウスキーパー(アイアンマンの Javis のような)にすることができるでしょうか?これにより、全く新しい形の人間と機械の対話が生まれるかもしれません。

しかし、Siri を再生させることは、大型言語モデルを Siri の元々のアルゴリズムに統合することが予想されるほど簡単ではないかもしれません。

Siri を ChatGPT のようにするためには、二つの処理方法が全く異なるため、Siri のデータベース全体を再構築する必要があり、これは事実上、一から始めることを意味します。これにはチームの再編成や、ハードウェアシステムと再び連携するための多くのリソースが必要になるでしょう。

また、以前にも報じたように、AIGC は各クエリ生成ごとに大量のクラウド計算能力を必要とします。

現在、OpenAI の ChatGPT はほぼ Microsoft Azure のクラウド計算リソースを全て使い果たしており、さらに余裕があまりありません。

Apple のクラウド計算センターは規模が大きくなく、全世界的な規模では Microsoft やOracleといった外部へクラウドサービスを提供する伝統的な大企業には遠く及びません。Apple のクラウドサービスは主に自己完結型で、自社の iCloud、App Store などのサービスをサポートしています。

もし、AIGC を一度にiPhone、iPad、Mac に導入すると、Apple が必要とする計算能力は天文学的な数値になるでしょう。

仮に Apple が計算能力を持っていたとしても、以前の推算によれば、GPT-4 の 1,000 のプロンプトあたりのコストは 12 セント(約 13 円)に達し、Apple の全世界のiPhoneユーザーだけでも 10 億を超えるため、運用コストは非常に高くなります。

客観的な条件や Apple の主観的な意向から見ても、Apple が直接 ChatGPT のような技術を Siri に導入し、生態系に直接展開することは難しいと言えます。

Apple は適切なタイミングと切り口を見つける必要があります。そのタイミングは、生成型 AI のコストが大幅に下がる時、あるいは小さな機能から始めて、AIGC を利用してユーザー体験を向上させる時かもしれません。

そして、Apple がこれまで AI に対して持ってきた態度から見て、後者の方が Apple の最終的な選択となる可能性が高いです。

AI に関して、アップルは「効率」と「プライバシー」を重視しています

タイミング以外にも、企業戦略と戦術の二つの違いが、アップルが生成型 AI と冷静に向き合う理由です。

Apple Siri AI

2020 年、アップルのマシンラーニングおよび人工知能戦略シニア副社長 John Giannandrea と製品マーケティング副社長 Bob Borchers は、 Arstechnica のアップル AI サービスに関するインタビューで、アップルの AI 戦略の二つのポイントを強調しました。

一つは効率、もう一つはプライバシーです。

効率は、ローカルで実行されるマシンラーニングのアルゴリズムとモデルを指し、これによりレスポンスが速く、パフォーマンスが向上します。

プライバシーは、その名の通りプライバシー保護を意味します。

Apple Siri AI

このほぼ一万語のインタビューで、これら二つの重要な戦略は John Giannandrea によって何度も繰り返されていました。これは、アップルが AI 技術に対してほとんど偏執的で厳格な追求を持っていることを示しています。

今振り返ってみると、アップルのこれら二つの信念は、チップ製造事業において、 A シリーズ、 M シリーズの Apple Neural Engine を CPU 、 GPU よりも優先して、それが各世代のチップで重点的にアップグレードされる核心となりました。

Apple Siri AI

興味深いことに、各世代のアップル A シリーズ、 M シリーズチップが発表されるとき、アップルは CPU 、 GPU 、メモリなどの一連の関連スペックとアーキテクチャ情報を公表します。

しかし、 Neural Engine については、ひとつのあいまいなデータしかなく、それはむしろ黒い箱のようで、まるで神経エンジンがすべてのチップの中で最大の秘密であるかのようです。

また、これら二人の高級幹部は、 iPhone X からチップに含まれている神経エンジンが、ローカルで AI アルゴリズムを処理するための先決条件であると考えています。

Apple Siri AI

そのため、アップルは多くのマシンラーニングのアルゴリズムを可能な限り小さくするよう努めて、ローカルマシンにデプロイできるようにしています。さらに、アルゴリズムモデルを小さくすることが真の能力であると強調しています。

ローカルマシンにデプロイした後、モデルアルゴリズムをローカルマシンで迅速に使用し、応答はほとんど遅延がありません。もう一つの利点は、使用データをアップロードする必要がないため、「プライバシー」問題を避けることができることです。

Apple Pencil のトラッキングや画像認識など、 AI が関与する機能において、アルゴリズムモデルの訓練が十分に良いため、クラウドで補助計算を行うためにアップロードする必要はなく、ローカルマシンで完全に処理することができます。

Apple Siri AI

それに対して、ChatGPT のような生成型 AI は完全にインターネットに依存しており、何ヶ月もリリースされたにもかかわらず、サービスはまだ安定しておらず、時折エラーが発生します。

これは、ユーザー体験を追求するアップルのような会社にとっては許されない状況です。

プライバシー保護は近年のアップルの一貫した戦略であり、批判に直面し、関連収益が減少するにもかかわらず、アップルは iOS 14.5 で App 追跡透明性フレームワーク(App Tracking Transparency、略称 ATT)をリリースし、ユーザー側に立ちました。

Apple Siri AI

アップルの一部の AI モデルアルゴリズムはインターネット接続を必要とせず、一部は一部のデータを収集して訓練を行う必要があります(Siri など)。そのため、アップルは事前にこれを発表し、データ収集プロセス中に敏感な情報(Apple ID など)を削除します。

しかし、現在人気のある生成型 AI はアップルの慎重な態度とは異なり、インターネット上の多くのコンテンツを抓取してアルゴリズムパラメーターの訓練を行い、それを基にコンテンツを生成します。

彼らが関連製品をリリースするとき、例えば Microsoft Copilot、Midjourney、Stability AI など、多くのウェブサイトや機関から著作権侵害の法的訴訟を受けて、これらの会社が違法や著作権があるコンテンツを作成していると主張しています。

Apple Siri AI

著作権に関する議論はまだ結論が出ていませんが、このような訓練プロセスは、アップルがデータプライバシー保護に対して持っている大きな追求に反しています。

AIGC は現在、ローカルマシンにデプロイすることができず、インターネット接続下では完璧なサービスを提供できる保証がなく、またデータプライバシーの問題もあります。

AIGC の主流技術は、アップルが AI で追求していることとほとんど正反対であり、それがアップルがタイミングを逸して生成型 AI に関する製品や声明を発表しない理由を説明しています。

Apple Siri AI

AI について私たちが認識しているのは Siri かもしれませんが、アップル自体にとっては、実際には Neural Engine が A シリーズチップの独立したモジュールとなったところから、アップルはローカライズされた AI に力を注いでいます。その目的は非常に純粋で、AI を使って世界を変えることを考えていない、それはユーザー体験を向上させるためだけです。

アップルは純粋な AI 会社ではなく、そのクラウドデータセンターは自社のソフトウェアやシステムサービスのためにあり、チップの製造もハードウェアのためにあります。アップルの技術業界での拡大はすべて製品サービスのためであり、彼らは基本的には製品駆動型の会社です。

その戦略、政策、技術配置などはすべて核心製品サービスを中心に展開されています。例えば、次にリリースされる XR デバイスについては、アップルは視覚認識の AI チームを拡大していますが、シリコンバレーのトレンドを追求するつもりはありません。

Apple Siri AI

アップルは自社の強みと弱みがどこにあるのかを非常に明確に理解しており、他人に鼻を引かれて歩くことはありません。代わりに、非常に安定した開発戦略を用いて配置しています。

さらに、新しい技術や新しいトレンドの下で、アップルはしばらくの間観察を続け、独自の視点で取り組みます。生成型 AI については、アップルは我々が予想していないような方向で進化し、我々の視野を広げるかもしれません。

画像、文章/ifanr.com の許可を得て転載、翻訳されました