ブログ

マルチクラウドのスケーラビリティと柔軟性が AI ファクトリーをサポート

ブウ・ラムサムネイル
ブウ・ラム
2024年11月11日公開
オーブリー・キング サムネイル
オーブリー・キング
2024年11月11日公開

F5 の AI ファクトリー シリーズ全体を通じて、AI ファクトリーの紹介と定義、その要素、およびapplication配信とセキュリティの選択がパフォーマンスに与える影響について検討しました。 シリーズの 5 回目となるこの記事では、 AI ファクトリーの推論の提供とデータ移動のサポートにおいてマルチクラウド ネットワーキングが果たす重要な役割について説明します。F5 では、AI ファクトリーを、大容量で高性能なトレーニングと推論の要件に対応する大規模なストレージ、ネットワーキング、コンピューティングへの投資と定義しています。

F5 の AI リファレンス アーキテクチャ図

分散アーキテクチャのナビゲート: 場所がワークロードのパフォーマンスに影響します

分散型相互接続ポイントは AI ファクトリーの中核であり、ストレージ、ネットワーク、コンピューティング インフラストラクチャの運用を推進します。 企業が AI ファクトリーを設計する際、多くのサービスが同じデータセンター内またはその近くに物理的に配置される可能性が高くなります。 ただし、地理的に分散されるサービスもあります。 フロントエンドapplications、推論サービス、必要なモデルなどのサービスは、消費する必要がある場所の近くに配置されるように設計すると、最高のパフォーマンスが得られます。 さらに、設計で RAG が必要な場合は、検索拡張生成 (RAG)知識コーパス データが関係する可能性がありますが、現時点では、フロントエンド、推論サービス、およびモデルの展開に焦点を当てます。

f5 ai リファレンス アーキテクチャ内の ai ファクトリー

推論サービスとフロントエンドapplications

Google が世界有数の組織から収集した実際の生成 AI ユースケース 185 件によると、これらの企業の多くは、世界中の顧客に AI ワークロードを提供するために戦略的な拠点に依存していることがわかりました。 エンドユーザー エクスペリエンスを考える際は、AI ファクトリーの分散アーキテクチャに焦点を当て、キュレーションする必要があります。 F5 の2024 年application戦略の現状レポートでは、88% の組織がハイブリッド クラウドモデルで運用していることがわかりました。 また、回答者の 94% がマルチクラウドの課題を経験していることも報告されました。

多層セキュリティ: ソフトウェア定義ネットワーク (SDN) から学ぶこと

では、AI ファクトリーと推論が使用されるインスタンス間の安全で最適化された通信を可能にする最善の方法は何でしょうか? 答えはネットワークに関係します。 その理由を理解するために、サービス プロバイダーの世界以外ではほとんど見過ごされてきた業界の流行語、ソフトウェア定義ネットワーク (SDN) について見てみましょう。SDN は、4G や 5G などの 3GPP アーキテクチャのセキュリティにとって極めて重要です。 3GPP アーキテクチャのセキュリティの成功は、厳格なapplication分離の遵守によるものです。

SDN は、レイヤー 2 および 3 のゼロ トラスト原則を実装することで強力なソリューションを提供します。これにより、トラフィックは、ソフトウェア定義の決定論的ルーティング インフラストラクチャによって検証および処理されない限り、applicationにルーティングできなくなります。 これにより、applicationの各コンポーネントをローカルでもグローバルでも個別に拡張して、最適なパフォーマンスとセキュリティを実現できます。 さらに、SDN はapplicationトラフィックを IP アドレスではなく名前でルーティングするため、IP アドレスの重複などの問題が軽減され、さまざまな地域や環境にわたってapplicationsやセキュリティ ソリューションをシームレスに拡張できます。 SDN 内の明示的なルーティングとトンネリングは、不正アクセスには SDN 内のリソース所有権と厳格な通信プロトコルへの準拠が必要であるため、潜在的な攻撃に対する強力な防御も提供します。

大手の Tier 1 通信会社は、これらの原則の有効性を大規模に実証しており、AI ファクトリーのマルチクラウド ネットワーキング (MCN) のさらに大規模なワークロードにこれらを適用することは理にかなっています。

AI スケールで接続を保護する方法

簡単そうですよね? あなたがこの記事を読んでいるスマートフォンには、おそらく GPU、5G 接続、パスコードが搭載されているでしょう。 民間警備会社に依頼しても大丈夫ですよね? まあ、そうでもないですね。 今回は3つのポイントを見ていきます。 ただし、これらはほんの始まりに過ぎず、AI ファクトリーの脅威環境を設計およびモデル化すると、さらに多くのことが明らかになることに注意してください。

まず、速度についてお話しましょう。 2022 年後半に ChatGPT で生成 AI が初めて注目を集めたとき、私たちはテキスト データに重点を置いていました。 ただし、2024 年には、画像、ビデオ、テキスト、データなどの他のモダリティが、専門分野に基づいてフローおよびapplication層モデルに混合されるユースケースが増えます。 分散型 AI ファクトリー アーキテクチャでは、すべてのモデルをあらゆる場所に展開することは望ましくなかったり、実現可能ではなかったりする場合があります。 それは、データ重力、電力重力、コンピューティング要件などの要因に帰着する可能性があります。 ここで、高速ネットワーク相互接続を選択してギャップを埋め、依存するサービスを相互に移動するときに発生するパフォーマンスの問題を軽減できます。

大規模言語モデル (LLM) と生成 AI アプリの OWASP トップ 10 リスクの 1 つであるモデル盗難についても見てみましょう。 競争上の優位性を獲得するために生成 AI を活用したいと考えている企業は、自社の知的財産をシステムに組み込むことになります。 これは、企業データを使用して独自のモデルをトレーニングしたり、モデルを微調整したりすることによって実現される可能性があります。 これらのシナリオでは、他のビジネス システムと同様に、AI ファクトリーは保護する必要があるモデルを通じて価値を生み出しています。 分散アーキテクチャでのモデルの盗難を防ぐには、このモデル、モデルの更新、およびapplicationがアクセスする必要があるデータ ソースが暗号化され、アクセス制御が適用されていることを確認する必要があります。

最後に、LLM および生成 AI アプリの OWASP Top 10 にも掲載されているモデル サービス拒否について考えてみましょう。 AIapplicationsへの信頼が高まるにつれて、重要なシステムでの AI アプリケーションの使用が増加します。これは、ビジネスにとって大きな収益をもたらすシステムを意味する場合もあれば、医療シナリオなどの生命維持に不可欠なシステムを意味する場合もあります。 フロントエンドと推論にアクセスする機能は、あらゆる侵入経路が回復力があり、制御され、安全であるように設計する必要があります。 これらのアクセス シナリオは、エンド ユーザー アクセスだけでなく、推論サービスからコア AI ファクトリーへのアクセスにも適用される可能性があります。

組み込みの可視性、オーケストレーション、暗号化

安全なマルチクラウド ネットワーキング ソリューションにより、AI ファクトリー アーキテクチャの分散側面を設計するために必要な接続性、セキュリティ、可視性が実現します。 F5 Distributed Cloud Network Connect は、上記のすべてとそれ以上の課題に対応します。 Distributed Cloud Network Connect は、パブリック クラウド、自社または共同データ センター、あるいは選択したハードウェアのエッジで推論を実行する場合でも、ユニバーサルな接続を可能にする独自の顧客エッジ ソリューションも提供します。 簡単かつ迅速に展開でき、顧客エッジが自動的に接続を確立します。

  • 高速接続: F5 分散クラウド サービスは、世界最高レベルのピアリング ネットワークの 1 つであるグローバル高速相互接続ネットワーク上に構築されています。 企業は、自社の AI ファクトリーが分散サービスに可能な限り最速の接続性を組み込んでいることに自信を持つことができます。 Distributed Cloud Network Connect により、サイトの迅速なプロビジョニングが可能になり、企業は AI サービスを即座に提供できるようになります。
  • セキュリティで接続: Distributed Cloud Network Connect はデフォルトで安全です。 接続は暗号化されており、AI ファクトリーや分散サービスに接続できるものと接続できないものを完全に制御できます。 さらに、顧客エッジを使用すると、Webapplicationおよび API 保護 (WAAP) など、これまで説明したサービス以外のサービスも有効にできます。
  • 可視性との接続: 分散クラウド サービスでは、ネットワークのあらゆる部分におけるapplication接続の健全性に関する洞察を共有する、豊富なデータを備えたダッシュボードを提供する SaaS ベースのコンソールも提供されます。 これにより、チームは問題が発生する可能性のある場所を積極的に特定し、問題が深刻化する前に対処することができます。

AI ファクトリーの設計は決して簡単なことではなく、企業は最大限のセキュリティを確保しながら、できるだけ早く AI のメリットを享受したいと考えています。 AI ファクトリーの複数の安全な機能を確実に導入できれば、イノベーションを加速できると同時に、真のビジネス差別化と競争上の優位性をもたらす AI ファクトリーの側面に集中する時間を確保できます。 マルチクラウド ネットワーキングについて詳しく知りたい場合は、 Brightboard レッスンを視聴するか、 F5 Distributed Cloud Network Connect を調べてください。

F5 の AI への注力はこれで終わりではありません。F5が AI アプリをあらゆる場所で保護し、配信する方法をご覧ください。