| Deep Learning | Modelos de Lenguaje |

NVIDIA GB200 NVL72 acelera 10 veces los modelos de IA más inteligentes

NVIDIA Blog

Mixture of Experts Powers the Most Intelligent Frontier AI Models, Runs 10x Faster on NVIDIA Blackwell NVL72
Shruti Koparkar
NVIDIA Blog
inglés
Estados Unidos
en-us
Fecha de consulta: 2025-12-04T11:01:14.965000Z
Fecha de consulta: 1764846074965
Fecha de publicación fuente: 2025-12-03T16:00:32Z
Fecha de publicación fuente: 1764777632000
Fecha de actualización fuente: 2025-12-03T22:02:34Z
https://blogs.nvidia.com/blog/mixture-of-experts-frontier-models

La arquitectura Mixture of Experts (MoE) es el estándar en los modelos de IA más avanzados, permitiendo mayor inteligencia y eficiencia. Sistemas como el NVIDIA GB200 NVL72 ejecutan modelos como Kimi K2 Thinking con un rendimiento 10 veces superior.

Los modelos de inteligencia artificial más avanzados usan arquitectura Mixture of Experts

Los 10 modelos de código abierto más inteligentes utilizan Mixture of Experts (MoE). Esta arquitectura, que imita la eficiencia del cerebro humano, permite generar respuestas más rápidas y eficientes. Los sistemas NVIDIA GB200 NVL72 ejecutan estos modelos, como Kimi K2 Thinking, 10 veces más rápido que la generación anterior.

La arquitectura que domina la inteligencia artificial frontera

La arquitectura Mixture of Experts (MoE) se ha convertido en el estándar para los modelos frontera. En lugar de activar todos los parámetros del modelo para cada tarea, un enrutador selecciona y activa solo a los «expertos» especializados más relevantes. Esto permite mayor inteligencia y adaptabilidad sin un aumento proporcional del coste computacional y energético. Más del 60% de los lanzamientos de modelos de IA de código abierto este año usan MoE.

Superando los cuellos de botella con diseño integral

Ejecutar grandes modelos MoE en producción presenta dificultades, como limitaciones de memoria y latencia en la comunicación entre expertos distribuidos en múltiples GPUs. La solución de NVIDIA es el diseño integral extremo del sistema GB200 NVL72. Sus 72 GPUs Blackwell conectadas con NVLink funcionan como una sola, con 30TB de memoria compartida rápida. Esto permite distribuir expertos entre hasta 72 GPUs, aliviando la presión en la memoria y acelerando la comunicación.

Un salto de rendimiento que transforma la economía de la IA

El sistema GB200 NVL72 ofrece un rendimiento 10 veces mayor por vatio para modelos MoE complejos en comparación con la plataforma Hopper anterior. Este avance no es solo técnico; posibilita multiplicar por 10 los ingresos por token, transformando la economía de la IA a gran escala. Proveedores de nube como AWS, Google Cloud y Microsoft Azure, junto con partners como CoreWeave, ya despliegan este sistema.

Casos de éxito en modelos líderes

El modelo Kimi K2 Thinking, clasificado como el más inteligente en el ranking de Artificial Analysis, experimenta un salto de rendimiento 10 veces mayor en GB200 NVL72. DeepSeek-R1 y Mistral Large 3 también logran una ganancia de rendimiento 10 veces superior respecto a la generación H200. Empresas como DeepL utilizan el hardware GB200 para entrenar sus próximos modelos MoE.

El patrón MoE define el futuro de la IA eficiente

El principio de enrutar tareas a expertos especializados se extiende más allá de los modelos de lenguaje. Los nuevos modelos multimodales y los sistemas agentivos siguen este mismo patrón. Esto apunta a un futuro con grupos compartidos de expertos accesibles para múltiples aplicaciones, maximizando la eficiencia. La hoja de ruta de NVIDIA, incluida la arquitectura Vera Rubin, continuará expandiendo los horizontes de los modelos frontera.

Post Views: 209

| Ética y Sociedad |

enero 3, 2026

Estados Unidos invade Venezuela y captura al presidente Nicolás Maduro

Los principales asistentes de IA ofrecieron respuestas contradictorias sobre la noticia de la invasión estadounidense

| Ética y Sociedad |

enero 1, 2026

Los chatbots eróticos definen la narrativa de la IA en 2025 frente a expectativas incumplidas

Mientras la promesa de productividad laboral con IA se desinfla, el nicho de los chatbots

| Compañías |

enero 1, 2026

El ‘abandonar los estudios’ se convierte en credencial clave para fundadores de startups

Ser un ‘college dropout’ se ha convertido en una credencial destacada en el ecosistema emprendedor,

| Ética y Sociedad |

diciembre 31, 2025

Inversores predicen que la IA impactará significativamente en el empleo en 2026

Capitalistas de riesgo anticipan que la IA impactará significativamente en la fuerza laboral en 2026,

| Aplicaciones |

diciembre 31, 2025

La industria de las citas apuesta por la conexión presencial frente al agotamiento de las aplicaciones

La industria de las citas online combina herramientas de IA con un fuerte impulso hacia

| Compañías |

diciembre 31, 2025

Jon Callaghan predice el fin del teléfono inteligente en una década

Jon Callaghan, cofundador de True Ventures, afirma que en diez años no usaremos iPhones. La

| Aplicaciones |

diciembre 30, 2025

Las mejores aplicaciones de dictado por IA de 2025 ofrecen precisión y privacidad

Las aplicaciones de dictado por IA en 2025 han mejorado significativamente gracias a modelos de

| Compañías |

diciembre 30, 2025

Empresas concentrarán su gasto en IA en 2026, según inversores

El 94% de capitalistas de riesgo prevé un aumento del presupuesto empresarial en IA para

| Compañías |

diciembre 30, 2025

Meta adquiere la startup de IA Manus por 2.000 millones de dólares

Meta Platforms ha adquirido la startup singapurense de inteligencia artificial Manus por 2.000 millones de

| Compañías |

diciembre 29, 2025

La industria de la IA recibe un ‘vibe check’ en 2025 tras inversiones billonarias

Tras inversiones récord que superaron el billón de dólares, la industria de la inteligencia artificial

| Compañías |

diciembre 29, 2025

Plaud Note Pro, el grabador de IA del tamaño de una tarjeta, supera el millón de unidades

Plaud ha enviado más de un millón de unidades de su grabador de IA, el

| Aplicaciones |

diciembre 29, 2025

OpenAI lanza integraciones de aplicaciones en ChatGPT para EE.UU. y Canadá

OpenAI permite conectar cuentas de servicios como Spotify, Uber o Booking.com directamente en ChatGPT. Los

| Deep Learning | Modelos de Lenguaje |

NVIDIA GB200 NVL72 acelera 10 veces los modelos de IA más inteligentes

Los modelos de inteligencia artificial más avanzados usan arquitectura Mixture of Experts

La arquitectura que domina la inteligencia artificial frontera

Superando los cuellos de botella con diseño integral

Un salto de rendimiento que transforma la economía de la IA

Casos de éxito en modelos líderes

El patrón MoE define el futuro de la IA eficiente

Estados Unidos invade Venezuela y captura al presidente Nicolás Maduro

Los chatbots eróticos definen la narrativa de la IA en 2025 frente a expectativas incumplidas

El ‘abandonar los estudios’ se convierte en credencial clave para fundadores de startups

Inversores predicen que la IA impactará significativamente en el empleo en 2026

La industria de las citas apuesta por la conexión presencial frente al agotamiento de las aplicaciones

Jon Callaghan predice el fin del teléfono inteligente en una década

Las mejores aplicaciones de dictado por IA de 2025 ofrecen precisión y privacidad

Empresas concentrarán su gasto en IA en 2026, según inversores

Meta adquiere la startup de IA Manus por 2.000 millones de dólares

La industria de la IA recibe un ‘vibe check’ en 2025 tras inversiones billonarias

Plaud Note Pro, el grabador de IA del tamaño de una tarjeta, supera el millón de unidades

OpenAI lanza integraciones de aplicaciones en ChatGPT para EE.UU. y Canadá

Inicio

Aplicaciones

Compañías

Otros

Noticias

Sociedad

Seguridad

Entretenimiento y Retail

Industrias

Energía

Healthcare

Videojuegos

Investigación

Robótica

Privacidad

Language models