ChatGPTをはじめとする大規模AI(LLM:大規模言語モデル)の学習には、何千・何万台ものGPUを相互接続した「AIクラスター」が必要です。

このAIクラスターを支えるのがネットワーク技術であり、シスコはSilicon OneとAcaciaの光半導体を武器にAI時代のネットワーク市場に挑んでいます。

AI学習クラスターにおけるネットワークの役割

GPT-4・Gemini・LLaMAのような大規模AIモデルの学習は、単一のGPUではなく数千〜数万のGPUで分散並列処理を行います。

この分散処理では、GPUどうしが常に大量のデータ(勾配情報・モデルパラメーター)をやり取りする必要があります。ネットワークの帯域幅と遅延(レイテンシ)が、AIクラスター全体の学習速度を左右します。

AI学習クラスターで必要なネットワーク帯域

現在のGPU(例:NVIDIA H100)は1台あたり3.2Tbpsの通信帯域を必要とします。

これを数万台束ねたデータセンター全体では、内部ネットワークに数百Pbpsから数ExaBpsの総帯域が必要になります。

InfiniBand vs イーサネット:AI向けネットワーク規格の競争

AI学習クラスターのネットワーク方式には、大きく2つの選択肢があります。

InfiniBand(NVIDIAが推進)

NVIDIAはAI学習クラスターの標準ネットワークとしてInfiniBandを推進しています。NVIDIAのConnectX NICおよびQuantumシリーズスイッチを組み合わせたNVIDIAネットワーク(旧Mellanox)が、大規模AIクラスターで広く採用されています。

  • 低レイテンシ・高帯域に優れる
  • ベンダーがNVIDA一社に限定される(ロックイン)
  • 既存のデータセンターイーサネットとの親和性が低い

イーサネット(シスコ・Broadcomが推進)

シスコはIEEE標準のイーサネット技術をベースに、AIクラスター向けネットワークを構築するアプローチを推進しています。

  • 業界標準規格で、複数ベンダーから選択できる(ベンダーロックイン回避)
  • 既存データセンターのイーサネットインフラと親和性が高い
  • Ultra Ethernet Consortium(UEC)でAI向けイーサネットの標準化が進行中

シスコはMeta・GoogleなどのハイパースケーラーがイーサネットベースのAIクラスターを採用していることを強調し、オープンなエコシステムを訴求しています。

シスコのAIネットワーキング製品

Silicon One Q800:AI向け超高速スイッチング

28.8Tbpsの転送性能を持つSilicon One Q800は、AIクラスター内部のスイッチとして採用されています。

800G(800Gbps)対応のポートを多数持つスパインスイッチとして使われ、数千台のGPUを超低レイテンシで接続します。

Cisco Nexus HyperFabric

2024年に発表した「Nexus HyperFabric」は、AI学習クラスター向けに最適化されたファブリックネットワークソリューションです。

Silicon Oneを搭載したスイッチと、AIによる自動設定・運用管理を組み合わせ、AI学習に特化したネットワーク環境を提供します。

Acacia 400G/800G ZR光トランシーバー

AIデータセンター間(DCI)の通信には、Acacia製の400G・800G対応コヒーレント光トランシーバーが使われています。

AI学習の拡大でデータセンター間のトラフィックも急増しており、Acacia製品の需要が伸びています。

Ultra Ethernet Consortium(UEC)とシスコ

2023年、シスコ・AMD・インテル・Meta・Microsoftなどが参加してUltra Ethernet Consortium(UEC)が設立されました。

UECはAI学習クラスターに最適化したイーサネット仕様(低レイテンシ・輻輳制御など)を標準化することを目的としており、シスコはその主要メンバーとして規格策定を主導しています。

シスコのAIネットワーキング市場での機会と課題

機会

  • AI学習クラスター向けスイッチ需要の急増
  • イーサネットがAIネットワークの主流になれば、Silicon Oneの大きな需要
  • Acacia光トランシーバーのDCI向け需要増

課題

  • NVIDIAのInfiniBandエコシステムが先行して大きなシェアを持っている
  • BroadcomのTomahawkシリーズも高性能イーサネットスイッチ向けチップで競合
  • ハイパースケーラー(Meta・Google・Microsoft)は自社チップ設計も進めており、外部調達が減るリスク

まとめ

AIデータセンターの急拡大は、シスコのSilicon One(スイッチング半導体)とAcacia(光半導体)の両方にとって大きなビジネスチャンスです。

イーサネットベースのオープンなAIネットワーキングを標準化しようとするシスコの戦略が成功すれば、NVIDIAのInfiniBandに対抗する大きな市場を取り込むことができます。

ABOUT ME
semi-connect編集室
半導体業界の技術・企業・市場動向を発信するブログ「semi-connect.net」の管理人。半導体プロセス・前工程・後工程からエレクトロニクス企業の財務分析まで、業界の基礎から最新情報をわかりやすく解説します。