ChatGPTを稼働させるという特権のためにNvidiaに75%の売上総利益率(マージン)を支払い続けることは、Sam Altmanにとって持続可能な企業戦略ではなくなった。2026年6月24日、OpenAIとBroadcomは、LLMの推論ワークロード専用に最適化されたカスタム設計のASICチップ「Jalapeño」を発表し、憶測に終止符を打った。Nvidiaの独占に対するこのピンポイントの狙い撃ちは、わずか9ヶ月という記録的なスピードで設計、テスト、そしてテープアウト(設計完了)まで行われた。
- What Is OpenAI’s Custom Chip Jalapeño?
- Who Manufactured the OpenAI Jalapeño Chip?
- Can OpenAI’s Custom Chip Replace Nvidia GPUs?
- How Much Does the Jalapeño Chip Reduce OpenAI’s Server Costs?
What Is OpenAI’s Custom Chip Jalapeño?
OpenAIのJalapeñoチップは、大規模言語モデル(LLM)の推論処理を専用に処理するために設計されたカスタムの特定用途向け集積回路(ASIC)である。Broadcomと共同開発されたこのチップは、メモリ帯域幅とテンソル演算を最適化し、標準的な市販シリコン(汎用チップ)の2倍の速度でChatGPTなどのモデルを実行する。
過去3年間、テック業界はシンプルな前提に基づいて動いてきた。すなわち、フロンティアモデルを実行したいのであれば、NvidiaのH100またはBlackwellのGPUを購入しなければならない、というものだ。このハードウェア依存は大きなボトルネックとなっている。汎用グラフィックス・プロセッシング・ユニット(GPU)は、その生の並列処理能力により、機械学習のトレーニング(学習)フェーズにおいては極めて優れている。しかし、トレーニング済みのモデルを実行する上では非常に非効率的である。推論は計算バウンド(計算能力が制限要因)の問題ではなく、メモリバウンド(メモリ帯域幅が制限要因)の問題だからだ。ユーザーが質問を入力した際、サーバーはエネルギーの大部分を、メモリチップから処理コアへと重みを転送することに消費している。
Jalapeñoは、標準的なGPUに搭載されているグラフィックス描画コンポーネントやディスプレイパイプライン、一般的なコンピューティングオーバーヘッドを排除している。その代わりに、行列乗算用に設計された特化型ロジックダイのすぐ隣に、大容量の高帯域幅メモリ(HBM)パッケージを配置している。サンフランシスコでは、すでに研究室内のサンプルがアクティブなワークロードを実行しており、具体的にはOpenAIのGPT-5.3-Codex-Sparkモデルでテストが行われている。
Who Manufactured the OpenAI Jalapeño Chip?
BroadcomはJalapeñoチップのロジックダイと高速入出力システムを共同設計し、このチップはTSMCの3nmプロセスノードで製造されている。物理的なサーバーボード、液冷式の電力供給システム、およびデータセンターラックは、電子機器受託製造企業のCelesticaによって組み立てられている。
ゼロからチップを開発する場合、通常は2〜3年を要する。OpenAIはBroadcomと提携し、同チップ大手のXPUカスタム設計プラットフォームを利用することで、このスケジュールを回避した。Broadcomはカスタムシリコンの潮流における影の立役者であり、これまでにGoogleのTPUシリーズやMetaのMTIA v2チップの共同設計を手がけてきた。高速ネットワーキングおよびメモリインターフェースに関するBroadcomの確立された知的財産(IP)をライセンス利用することで、OpenAIはわずか9ヶ月で設計からテープアウト(設計完了)までのパイプラインを完了させた。
しかし、シリコンはそれを収容するシステムがなければ役に立たない。ここでCelesticaがサプライチェーンに加わる。このプロジェクトの主要システムインテグレーターとして、CelesticaはJalapeñoを大規模に稼働させるために必要なカスタムサーバーブレード、マルチラックの液冷ループ、および高電圧電源シェルフの設計と組み立てを行う。これらのサーバーシステムは、Microsoftが所有するクラウドクラスターを含む、既存のデータセンターインフラに直接スロットインできるように構築されている。
Can OpenAI’s Custom Chip Replace Nvidia GPUs?
Jalapeñoチップは、LLMの推論処理に特化して構築されているため、巨大なAIモデルのトレーニングにおいてNvidiaのGPUを置き換えることはできない。OpenAIは、フロンティアモデルのトレーニングにはNvidiaのBlackwellアーキテクチャを引き続き使用しつつ、一般ユーザーのライブチャットトラフィックをJalapeñoのハードウェアに移行することで、運用の効率化を図る。
カスタムシリコンがNvidiaの直接的な代替品になると考えるのは、よくある誤解である。実際には、ハードウェアスタックは2つに分かれている。GPT-5のようなモデルをトレーニングするには、相互に接続された数千台のプロセッサを数ヶ月にわたって稼働させ、膨大な量の勾配データを交換する必要がある。このトレーニング領域において、Nvidia独自のNVLinkインターコネクト技術とCUDAソフトウェアエコシステムは、依然として追随を許していない。
しかし、一度モデルのトレーニングが完了すると、ユーザー向けに1日に何百万回も実行されなければならない。ここで、フロンティアモデルへの巨額の資本投資は厳しい現実に直面する。汎用GPUでの推論実行はコストを激しく浪費するからだ。推論にカスタムASICを使用することで、OpenAIは日々の消費者トラフィックを高価なNvidiaプロセッサから逃がし、それらのGPUをトレーニングループの実行に振り向けることができる。
Jalapeñoと市販のシリコンオプションのハードウェア仕様比較を見てみよう。
| 仕様 | OpenAI Jalapeño ASIC (2026) | Nvidia Blackwell B200 (市販品) | Google TPU v5p (カスタム) |
|---|---|---|---|
| 主なワークロード | LLM推論専用 | 汎用トレーニング&推論 | 汎用トレーニング&推論 |
| アーキテクチャ | カスタムASIC (Broadcom XPU) | 汎用GPU | カスタムASIC |
| 製造プロセスノード | TSMC 3nm | TSMC 4N | TSMC 4nm |
| メモリ構成 | 192GB HBM4 | 192GB HBM3e | 96GB HBM2e |
| 目標導入先 | Microsoft Azure / 2026年後半 | パブリッククラウド / 2025年 | Google Cloud |
| ソフトウェアスタック | カスタムOpenAIランタイム | Nvidia CUDA | Google JAX / XLA |
How Much Does the Jalapeño Chip Reduce OpenAI’s Server Costs?
OpenAIは、Jalapeño ASICチップを大規模に導入することで、推論コストを約50%削減できると予測している。メモリからコアへの転送速度を最適化し、熱放散を抑制することにより、このチップはChatGPTを実行する際のクエリあたりの電力コストおよびハードウェア減価償却コストを大幅に引き下げる。
コンピューティングコストは、ハードウェアインフラ競争の行方を阻む最大の障壁(ゲートキーパー)である。2024年の業界の推定では、ChatGPTの1クエリあたりの実行コストは約0.003ドルであり、その大半をハードウェアの減価償却費と消費電力が占めていた。1日のアクティブユーザー数が数億人規模に達すると、OpenAIのインフラ支出は容易に年間数十億ドルを突破する。
Jalapeñoはこの利益率(マージン)の危機に直接対処する。トランスフォーマー・アーキテクチャで使用される特定の行列演算のみを実行するように設計されているため、汎用GPUよりも大幅に消費電力が少ない。また、Broadcomの高速イーサネットパッケージング技術により、OpenAIは大規模なデータセンターで課題となるネットワーク遅延のボトルネックを回避しながら、これらのチップを高密度ラックにクラスタ化することができる。これらのシステムの導入は2026年後半に開始される予定であり、まずはMicrosoft Azureデータセンター内のギガワット規模のクラスターから順次配備される。
Key Takeaways
- OpenAIとBroadcomは、設計レイアウトを迅速化するためにOpenAIの内部モデルを活用し、Jalapeñoチップを9ヶ月で共同設計した。
- JalapeñoはLLMの推論処理専用に設計されたカスタムASICチップであり、フロンティアモデルのトレーニングには使用できない。
- Celesticaが主要システムインテグレーターを務め、サーバーボード、電源システム、および液冷ラックの構築を担当する。
- このチップはTSMCの3nmプロセスノードで製造され、192GBのHBM4メモリを搭載している。
- OpenAIのサーバー運用コストを50%削減するため、2026年後半からMicrosoft Azureデータセンターでの導入が開始される予定である。
FAQ
What is OpenAI’s custom chip Jalapeño?
OpenAIのJalapeñoチップは、大規模言語モデル(LLM)の推論処理を最適化するために設計されたカスタムの特定用途向け集積回路(ASIC)である。Broadcomと共同開発されたこのハードウェアは、標準的なGPUのグラフィックス描画用オーバーヘッドを排除し、メモリ帯域幅と行列乗算に完全に特化することで、より高速で安価なChatGPTクエリを実現する。
Who manufactured the OpenAI Jalapeño chip?
JalapeñoチップのロジックおよびメモリインターフェースはOpenAIとBroadcomが共同設計し、製造はTSMCの3nm半導体ファウンドリに委託されている。物理的なサーバーボード、液冷ループ、およびサーバーラックの組み立ては、Celesticaが製造と統合を担当している。
Can OpenAI’s custom chip replace Nvidia GPUs?
いいえ、Jalapeñoチップはトレーニング(学習)用のプロセッサではなく、フロンティアAIモデルのトレーニングにおいてNvidiaのGPUを置き換えることはできない。OpenAIは、モデルのトレーニングにNvidiaのBlackwell GPUアーキテクチャを引き続き使用し、アクティブなチャットトラフィックをJalapeñoに移行して、本番環境の推論コストを削減する。
How much does the Jalapeño chip reduce OpenAI’s server costs?
OpenAIは、Jalapeño ASICがモデル運用のコストを約50%削減できると期待している。このチップは、優れたエネルギー効率、消費電力を抑える最適化されたメモリレイアウト、および高密度のサーバークラスタリングを可能にする高速ネットワーキングによってこれを実現する。
When will OpenAI deploy the Jalapeño chip?
Jalapeñoチップの最初のギガワット規模の配備は、2026年後半に開始される予定である。このハードウェアはMicrosoft Azureデータセンター施設に直接統合され、OpenAIの一般向けサービスおよび企業向けAPIサービスをサポートする。
How does the Jalapeño design process differ from traditional chip manufacturing?
OpenAIとBroadcomの共同設計プロセスは、通常の半導体開発サイクルである2年という期間のほんの一部にあたる、わずか9ヶ月で完了した。この設計の迅速化は、製造前にOpenAI独自のAIモデルを使用してロジックレイアウトを最適化し、信号経路を検証することで達成された。
Sources
- Broadcom Official Product Briefs: https://www.broadcom.com
- OpenAI Compute Infrastructure Team: https://www.openai.com
- Celestica Server Assembly Documentation: https://www.celestica.com
- TSMC 3nm Foundry Technical Specifications: https://www.tsmc.com