NVIDIA GB200 NVL72 acelera 10 veces los modelos de IA más inteligentes

La arquitectura Mixture of Experts (MoE) es el estándar en los modelos de IA más avanzados, permitiendo mayor inteligencia y eficiencia. Sistemas como el NVIDIA GB200 NVL72 ejecutan modelos como Kimi K2 Thinking con un rendimiento 10 veces superior.
NVIDIA Blog
Imagen sin título
Imagen sin título / Autor no disponible / NVIDIA Blog

Los modelos de inteligencia artificial más avanzados usan arquitectura Mixture of Experts

Los 10 modelos de código abierto más inteligentes utilizan Mixture of Experts (MoE). Esta arquitectura, que imita la eficiencia del cerebro humano, permite generar respuestas más rápidas y eficientes. Los sistemas NVIDIA GB200 NVL72 ejecutan estos modelos, como Kimi K2 Thinking, 10 veces más rápido que la generación anterior.

La arquitectura que domina la inteligencia artificial frontera

La arquitectura Mixture of Experts (MoE) se ha convertido en el estándar para los modelos frontera. En lugar de activar todos los parámetros del modelo para cada tarea, un enrutador selecciona y activa solo a los «expertos» especializados más relevantes. Esto permite mayor inteligencia y adaptabilidad sin un aumento proporcional del coste computacional y energético. Más del 60% de los lanzamientos de modelos de IA de código abierto este año usan MoE.

Superando los cuellos de botella con diseño integral

Ejecutar grandes modelos MoE en producción presenta dificultades, como limitaciones de memoria y latencia en la comunicación entre expertos distribuidos en múltiples GPUs. La solución de NVIDIA es el diseño integral extremo del sistema GB200 NVL72. Sus 72 GPUs Blackwell conectadas con NVLink funcionan como una sola, con 30TB de memoria compartida rápida. Esto permite distribuir expertos entre hasta 72 GPUs, aliviando la presión en la memoria y acelerando la comunicación.

Un salto de rendimiento que transforma la economía de la IA

El sistema GB200 NVL72 ofrece un rendimiento 10 veces mayor por vatio para modelos MoE complejos en comparación con la plataforma Hopper anterior. Este avance no es solo técnico; posibilita multiplicar por 10 los ingresos por token, transformando la economía de la IA a gran escala. Proveedores de nube como AWS, Google Cloud y Microsoft Azure, junto con partners como CoreWeave, ya despliegan este sistema.

Casos de éxito en modelos líderes

El modelo Kimi K2 Thinking, clasificado como el más inteligente en el ranking de Artificial Analysis, experimenta un salto de rendimiento 10 veces mayor en GB200 NVL72. DeepSeek-R1 y Mistral Large 3 también logran una ganancia de rendimiento 10 veces superior respecto a la generación H200. Empresas como DeepL utilizan el hardware GB200 para entrenar sus próximos modelos MoE.

El patrón MoE define el futuro de la IA eficiente

El principio de enrutar tareas a expertos especializados se extiende más allá de los modelos de lenguaje. Los nuevos modelos multimodales y los sistemas agentivos siguen este mismo patrón. Esto apunta a un futuro con grupos compartidos de expertos accesibles para múltiples aplicaciones, maximizando la eficiencia. La hoja de ruta de NVIDIA, incluida la arquitectura Vera Rubin, continuará expandiendo los horizontes de los modelos frontera.

Usuarias denuncian sesgo de género en el algoritmo de LinkedIn tras un experimento

Un experimento muestra que usuarias que cambiaron su género a masculino en LinkedIn registraron aumentos
Imagen sin título

SpaceX prepara su salida a bolsa para 2026 con una valoración récord

SpaceX planea salir a bolsa en 2025 con una valoración de 1,5 billones de dólares.
Fotografía de archivo de Elon Musk, fundador de SpaceX.

Google lanza traducción en tiempo real para auriculares con IA

Google ha lanzado una función beta en su aplicación Translate que permite escuchar traducciones en
Ilustración de una persona usando auriculares con un icono de traducción.

Trump firma orden ejecutiva para impugnar leyes estatales de inteligencia artificial

El presidente Trump firma una orden ejecutiva para impugnar normativas estatales sobre IA, alegando que
Imagen sin título

Robot bartender ADAM sirve bebidas en el T-Mobile Arena de Las Vegas

ADAM, un robot barman desarrollado con librerías NVIDIA Isaac, atiende a aficionados en el T-Mobile
Robot ADAM sirviendo una bebida en el T-Mobile Arena.

Trump firma una orden ejecutiva para imponer un marco federal de IA y desafiar leyes estatales

El presidente Trump firma una orden ejecutiva que busca imponer un marco regulatorio nacional de
Fotografía de archivo del presidente Donald Trump

Google lanza su agente de investigación profunda Gemini basado en Gemini 3 Pro

Google presenta Gemini Deep Research, un agente de IA basado en Gemini 3 Pro diseñado
Imagen sin título

Do Kwon, fundador de Terraform Labs, condenado a 15 años de prisión por fraude

Do Kwon, fundador de Terraform Labs, ha sido sentenciado a 15 años de cárcel por
Do Kwon en la corte federal del Distrito Sur de Nueva York.

1X enviará hasta 10.000 robots humanoides Neo a empresas industriales de EQT

La empresa de robótica 1X enviará hasta 10.000 unidades de su robot humanoide Neo a
Imagen sin título

OpenAI lanza GPT-5.2, su modelo más capaz para trabajo profesional

OpenAI ha presentado GPT-5.2, su modelo más capaz para trabajo profesional, entrenado y desplegado en
Imagen sin título

Taiwán impulsa pagos sin contacto con coleccionables y figuras decorativas

Taiwán desarrolla un sistema de pagos sin contacto basado en llaveros con chips NFC con
Llaveros con chip de pago con diseños de productos y personajes en Taiwán.

Disney acusa a Google de infracción masiva de copyright por uso de IA

Disney envió una carta de cese y desistimiento a Google por utilizar sus modelos de
Imagen sin título