NVIDIA GB200 NVL72 acelera 10 veces los modelos de IA más inteligentes

La arquitectura Mixture of Experts (MoE) es el estándar en los modelos de IA más avanzados, permitiendo mayor inteligencia y eficiencia. Sistemas como el NVIDIA GB200 NVL72 ejecutan modelos como Kimi K2 Thinking con un rendimiento 10 veces superior.
NVIDIA Blog
Imagen sin título
Imagen sin título / Autor no disponible / NVIDIA Blog

Los modelos de inteligencia artificial más avanzados usan arquitectura Mixture of Experts

Los 10 modelos de código abierto más inteligentes utilizan Mixture of Experts (MoE). Esta arquitectura, que imita la eficiencia del cerebro humano, permite generar respuestas más rápidas y eficientes. Los sistemas NVIDIA GB200 NVL72 ejecutan estos modelos, como Kimi K2 Thinking, 10 veces más rápido que la generación anterior.

La arquitectura que domina la inteligencia artificial frontera

La arquitectura Mixture of Experts (MoE) se ha convertido en el estándar para los modelos frontera. En lugar de activar todos los parámetros del modelo para cada tarea, un enrutador selecciona y activa solo a los «expertos» especializados más relevantes. Esto permite mayor inteligencia y adaptabilidad sin un aumento proporcional del coste computacional y energético. Más del 60% de los lanzamientos de modelos de IA de código abierto este año usan MoE.

Superando los cuellos de botella con diseño integral

Ejecutar grandes modelos MoE en producción presenta dificultades, como limitaciones de memoria y latencia en la comunicación entre expertos distribuidos en múltiples GPUs. La solución de NVIDIA es el diseño integral extremo del sistema GB200 NVL72. Sus 72 GPUs Blackwell conectadas con NVLink funcionan como una sola, con 30TB de memoria compartida rápida. Esto permite distribuir expertos entre hasta 72 GPUs, aliviando la presión en la memoria y acelerando la comunicación.

Un salto de rendimiento que transforma la economía de la IA

El sistema GB200 NVL72 ofrece un rendimiento 10 veces mayor por vatio para modelos MoE complejos en comparación con la plataforma Hopper anterior. Este avance no es solo técnico; posibilita multiplicar por 10 los ingresos por token, transformando la economía de la IA a gran escala. Proveedores de nube como AWS, Google Cloud y Microsoft Azure, junto con partners como CoreWeave, ya despliegan este sistema.

Casos de éxito en modelos líderes

El modelo Kimi K2 Thinking, clasificado como el más inteligente en el ranking de Artificial Analysis, experimenta un salto de rendimiento 10 veces mayor en GB200 NVL72. DeepSeek-R1 y Mistral Large 3 también logran una ganancia de rendimiento 10 veces superior respecto a la generación H200. Empresas como DeepL utilizan el hardware GB200 para entrenar sus próximos modelos MoE.

El patrón MoE define el futuro de la IA eficiente

El principio de enrutar tareas a expertos especializados se extiende más allá de los modelos de lenguaje. Los nuevos modelos multimodales y los sistemas agentivos siguen este mismo patrón. Esto apunta a un futuro con grupos compartidos de expertos accesibles para múltiples aplicaciones, maximizando la eficiencia. La hoja de ruta de NVIDIA, incluida la arquitectura Vera Rubin, continuará expandiendo los horizontes de los modelos frontera.

Grok de xAI difunde datos falsos sobre el tirador de Bondi Beach

El chatbot Grok de xAI, empresa de Elon Musk, proporcionó información errónea sobre el ataque
Imagen sin título

Una repartidora de DoorDash se enfrenta a cargos por rociar comida con un aerosol

Una repartidora de DoorDash en Indiana, EE.UU., enfrenta cargos por delito grave tras rociar con
Imagen sin título

El auge de los centros de datos compite por recursos con infraestructuras públicas

La inversión privada en construcción de centros de datos para IA, que supera los 41.000
Imagen sin título

Rivian apuesta por la IA para lograr la conducción autónoma total

Rivian activará su función «Universal Hands-Free» a finales de diciembre, permitiendo a los conductores quitar
Imagen sin título

Apple permite ajustar la opacidad del Liquid Glass en la pantalla de bloqueo

Apple lanza iOS 26.2 con una nueva opción para ajustar la transparencia del reloj en
Captura de pantalla de un iPhone mostrando ajustes

Google y Apple lanzan parches de emergencia tras ataques con vulnerabilidades zero-day

Google y Apple han publicado actualizaciones de seguridad de emergencia para corregir vulnerabilidades de día
Logotipos de Google y Apple en una pantalla que representa seguridad digital.

Usuarias denuncian sesgo de género en el algoritmo de LinkedIn tras un experimento

Un experimento muestra que usuarias que cambiaron su género a masculino en LinkedIn registraron aumentos
Imagen sin título

SpaceX prepara su salida a bolsa para 2026 con una valoración récord

SpaceX planea salir a bolsa en 2025 con una valoración de 1,5 billones de dólares.
Fotografía de archivo de Elon Musk, fundador de SpaceX.

Google lanza traducción en tiempo real para auriculares con IA

Google ha lanzado una función beta en su aplicación Translate que permite escuchar traducciones en
Ilustración de una persona usando auriculares con un icono de traducción.

Trump firma orden ejecutiva para impugnar leyes estatales de inteligencia artificial

El presidente Trump firma una orden ejecutiva para impugnar normativas estatales sobre IA, alegando que
Imagen sin título

Robot bartender ADAM sirve bebidas en el T-Mobile Arena de Las Vegas

ADAM, un robot barman desarrollado con librerías NVIDIA Isaac, atiende a aficionados en el T-Mobile
Robot ADAM sirviendo una bebida en el T-Mobile Arena.

Trump firma una orden ejecutiva para imponer un marco federal de IA y desafiar leyes estatales

El presidente Trump firma una orden ejecutiva que busca imponer un marco regulatorio nacional de
Fotografía de archivo del presidente Donald Trump