Pagar a Nvidia un margen bruto del 75% por el privilegio de ejecutar ChatGPT ya no es una estrategia corporativa viable para Sam Altman. El 24 de junio de 2026, OpenAI y Broadcom pusieron fin a las especulaciones al presentar Jalapeño, un chip ASIC personalizado y optimizado exclusivamente para cargas de trabajo de inferencia de modelos de lenguaje grande (LLM). Este ataque directo al monopolio de Nvidia fue diseñado y verificado en un tiempo récord de nueve meses.
- What Is OpenAI’s Custom Chip Jalapeño?
- Who Manufactured the OpenAI Jalapeño Chip?
- Can OpenAI’s Custom Chip Replace Nvidia GPUs?
- How Much Does the Jalapeño Chip Reduce OpenAI’s Server Costs?
What Is OpenAI’s Custom Chip Jalapeño?
El chip Jalapeño de OpenAI es un circuito integrado de aplicación específica (ASIC) personalizado, diseñado específicamente para gestionar la inferencia de modelos de lenguaje grande (LLM). Co-desarrollado con Broadcom, el chip optimiza el ancho de banda de memoria y la matemática tensorial para ejecutar modelos como ChatGPT al doble de velocidad que el silicio comercial estándar.
Durante los últimos tres años, la industria tecnológica ha operado bajo una premisa simple: para ejecutar modelos de frontera, es obligatorio comprar GPU Nvidia H100 o Blackwell. Esta dependencia de hardware representa un cuello de botella masivo. Aunque las unidades de procesamiento gráfico (GPU) de propósito general destacan en la fase de entrenamiento del aprendizaje automático gracias a su capacidad de procesamiento paralelo, resultan ineficientes para ejecutar modelos ya entrenados. La inferencia es un problema limitado por la memoria, no por el cómputo. Cuando un usuario realiza una consulta, el servidor consume la mayor parte de su energía transfiriendo pesos desde los chips de memoria hacia los núcleos de procesamiento.
Jalapeño prescinde de los componentes de renderizado gráfico, los canales de visualización y la sobrecarga de cómputo general de las GPU estándar. En su lugar, coloca módulos masivos de memoria de alto ancho de banda (HBM) directamente adyacentes a una matriz lógica especializada diseñada para la multiplicación de matrices. Las muestras de laboratorio ya ejecutan cargas de trabajo activas en San Francisco, concretamente realizando pruebas en el modelo GPT-5.3-Codex-Spark de OpenAI.
Who Manufactured the OpenAI Jalapeño Chip?
Broadcom co-diseñó la matriz lógica y los sistemas de entrada/salida de alta velocidad para el chip Jalapeño, fabricado en el nodo de proceso de 3 nm de TSMC. Las placas físicas de los servidores, los sistemas de alimentación refrigerados por líquido y los racks de los centros de datos son ensamblados por el fabricante de electrónica Celestica.
Construir un chip desde cero suele requerir de dos a tres años. OpenAI aceleró este plazo al asociarse con Broadcom, utilizando la plataforma de diseño personalizado XPU de esta compañía. Broadcom es el arquitecto detrás de la tendencia del silicio personalizado, habiendo co-diseñado previamente la serie TPU de Google y los chips MTIA v2 de Meta. Al licenciar la propiedad intelectual consolidada de Broadcom para redes de alta velocidad e interfaces de memoria, OpenAI completó el flujo de trabajo desde el diseño hasta el tape-out en solo nueve meses.
Sin embargo, el silicio no sirve de nada sin un sistema que lo albergue. Aquí es donde Celestica se incorpora a la cadena de suministro. Como integrador de sistemas principal del proyecto, Celestica diseña y ensambla los servidores en formato blade personalizados, además de los bucles de refrigeración líquida y los bastidores de alimentación de alto voltaje necesarios para ejecutar Jalapeño a gran escala. Estos sistemas de servidores están construidos para integrar directamente en las infraestructuras de centros de datos existentes, incluidos los clústeres en la nube propiedad de Microsoft.
Can OpenAI’s Custom Chip Replace Nvidia GPUs?
El chip Jalapeño no puede reemplazar a las GPU de Nvidia para entrenar modelos masivos de IA, ya que está construido exclusivamente para la inferencia de LLM. OpenAI continuará utilizando la arquitectura Blackwell de Nvidia para entrenar sus modelos de frontera, al tiempo que migrará el tráfico de chat en vivo de sus usuarios al hardware Jalapeño para optimizar la eficiencia operativa.
Existe la idea errónea de que el silicio personalizado representa un reemplazo inmediato para Nvidia. En realidad, la infraestructura de hardware está dividida en dos. Entrenar un modelo como GPT-5 requiere miles de procesadores interconectados funcionando durante meses, intercambiando volúmenes masivos de datos de gradiente. La tecnología de interconexión patentada NVLink de Nvidia y el ecosistema de software CUDA siguen sin tener rival en este ámbito de entrenamiento.
Sin embargo, una vez entrenado el modelo, este debe ejecutarse millones de veces al día para los usuarios. Aquí es donde las inversiones masivas de capital en modelos de frontera se enfrentan a una cruda realidad: ejecutar la inferencia en GPU de propósito general consume recursos de forma masiva. Al utilizar chips ASIC personalizados para la inferencia, OpenAI puede desviar su tráfico diario de usuarios de los costosos procesadores de Nvidia, liberando esas GPU para ejecutar bucles de entrenamiento.
Comparemos las especificaciones de hardware entre Jalapeño y las opciones de silicio comercial:
| Especificación | OpenAI Jalapeño ASIC (2026) | Nvidia Blackwell B200 (Comercial) | Google TPU v5p (Personalizado) |
|---|---|---|---|
| Carga de trabajo principal | Inferencia dedicada de LLM | Entrenamiento e inferencia general | Entrenamiento e inferencia general |
| Arquitectura | ASIC personalizado (Broadcom XPU) | GPU de propósito general | ASIC personalizado |
| Nodo de fabricación | TSMC 3nm | TSMC 4N | TSMC 4nm |
| Configuración de memoria | 192GB HBM4 | 192GB HBM3e | 96GB HBM2e |
| Despliegue objetivo | Microsoft Azure / Finales de 2026 | Nube pública / 2025 | Google Cloud |
| Pila de software | Entorno de ejecución personalizado de OpenAI | Nvidia CUDA | Google JAX / XLA |
How Much Does the Jalapeño Chip Reduce OpenAI’s Server Costs?
OpenAI proyecta que el despliegue a gran escala del chip ASIC Jalapeño reducirá los costes de inferencia en aproximadamente un 50%. Al optimizar las velocidades de transferencia de la memoria al núcleo y reducir la disipación térmica, el chip disminuye de forma significativa los costes de electricidad por consulta y la depreciación del hardware al ejecutar ChatGPT.
El coste de computación es el factor limitante definitivo en la carrera por la infraestructura de hardware. En 2024, las estimaciones del sector situaban el coste de ejecutar una única consulta de ChatGPT en aproximadamente 0,003 dólares, siendo la depreciación del hardware y el consumo de energía la mayor parte de esa cifra. Al escalar esto a cientos de millones de usuarios activos diarios, la factura de infraestructura de OpenAI supera fácilmente los miles de millones de dólares anuales.
Jalapeño aborda esta crisis de margen directamente. Debido a que el chip está diseñado para ejecutar únicamente las operaciones matriciales específicas utilizadas en las arquitecturas de transformadores, consume sustancialmente menos energía que una GPU de propósito general. El empaquetado Ethernet de alta velocidad de Broadcom también permite a OpenAI agrupar estos chips en racks de alta densidad sin los cuellos de botella de latencia de red habituales que afectan a los centros de datos de mayor tamaño. El despliegue de estos sistemas está programado para comenzar a finales de 2026, iniciándose con clústeres a escala de gigavatios en los centros de datos de Microsoft Azure.
Key Takeaways
- OpenAI y Broadcom co-diseñaron el chip Jalapeño en nueve meses, utilizando modelos internos de OpenAI para acelerar el diseño de su trazado.
- Jalapeño es un chip ASIC personalizado diseñado exclusivamente para la inferencia de LLM, lo que significa que no puede utilizarse para el entrenamiento de modelos de frontera.
- Celestica actúa como el principal integrador de sistemas, encargándose de la fabricación de placas de servidor, sistemas de alimentación y bastidores refrigerados por líquido.
- El chip se fabrica en el nodo de proceso de 3 nm de TSMC y cuenta con 192GB de memoria HBM4.
- Los despliegues están programados para comenzar a finales de 2026 en los centros de datos de Microsoft Azure, con el objetivo de reducir los costes operativos de los servidores de OpenAI en un 50%.
FAQ
What is OpenAI’s custom chip Jalapeño?
El chip Jalapeño de OpenAI es un circuito integrado de aplicación específica (ASIC) diseñado a medida para optimizar la inferencia de modelos de lenguaje grande (LLM). Co-desarrollado con Broadcom, este hardware elimina los componentes gráficos innecesarios de las GPU estándar para centrarse completamente en el ancho de banda de memoria y la multiplicación de matrices, lo que permite ofrecer consultas de ChatGPT más rápidas y económicas.
Who manufactured the OpenAI Jalapeño chip?
La matriz lógica y las interfaces de memoria del chip Jalapeño fueron co-diseñadas por OpenAI y Broadcom, delegando la fabricación a la fundición de semiconductores de 3 nm de TSMC. Por otro lado, la producción e integración de las placas físicas del servidor, los sistemas de refrigeración líquida y el ensamblaje de los racks corren a cargo de Celestica.
Can OpenAI’s custom chip replace Nvidia GPUs?
No, el chip Jalapeño no es un procesador de entrenamiento y no puede sustituir a las GPU de Nvidia en la preparación de modelos de IA de frontera. OpenAI seguirá utilizando la arquitectura Blackwell de Nvidia para el entrenamiento de sus modelos principales, mientras traslada el tráfico de chat activo a Jalapeño para reducir los costes de inferencia en vivo.
How much does the Jalapeño chip reduce OpenAI’s server costs?
OpenAI estima que el ASIC Jalapeño reducirá el coste operativo de ejecutar sus modelos en aproximadamente un 50%. El chip lo consigue mediante una gran eficiencia energética, trazados de memoria optimizados que disminuyen el consumo eléctrico y redes de alta velocidad que permiten agrupar los servidores en clústeres de alta densidad.
When will OpenAI deploy the Jalapeño chip?
Los primeros despliegues a escala de gigavatios del chip Jalapeño están programados para comenzar a finales de 2026. El hardware se integrará directamente en las instalaciones de los centros de datos de Microsoft Azure para dar soporte a los servicios de API empresariales y de consumo de OpenAI.
How does the Jalapeño design process differ from traditional chip manufacturing?
El proceso de co-diseño entre OpenAI y Broadcom se completó en nueve meses, una fracción del ciclo típico de desarrollo de semiconductores que suele durar dos años. Esta aceleración en el diseño se logró mediante el uso de los propios modelos de IA de OpenAI para optimizar la disposición lógica y verificar las rutas de señal antes de la fabricación.
Sources
- Fichas técnicas oficiales de productos de Broadcom: https://www.broadcom.com
- Equipo de infraestructura de cómputo de OpenAI: https://www.openai.com
- Documentación de ensamblaje de servidores de Celestica: https://www.celestica.com
- Especificaciones técnicas de la fundición de 3 nm de TSMC: https://www.tsmc.com