UC San Diego recibe supercomputador NVIDIA para avanzar en investigación de IA generativa

El laboratorio Hao AI de UC San Diego ha recibido un sistema NVIDIA DGX B200 para acelerar proyectos de inferencia de LLM, como FastVideo y Lmgame-bench, y explorar servicios de baja latencia. El equipo estará disponible para la comunidad académica.
NVIDIA Blog
Miembros del Hao AI Lab junto al sistema NVIDIA DGX B200.
Miembros del Hao AI Lab junto al sistema NVIDIA DGX B200. / Autor no disponible / blogs.nvidia.com

Laboratorio de UC San Diego recibe sistema NVIDIA DGX B200 para investigación en IA

El laboratorio Hao AI de la Universidad de California en San Diego (UC San Diego) ha recibido un sistema NVIDIA DGX B200. Este equipo se utilizará para avanzar en la investigación de inferencia de modelos de lenguaje grande (LLM) y otros proyectos. El centro estará disponible para la comunidad de la Escuela de Computación, Información y Ciencias de Datos.

Aceleración de proyectos punteros

El sistema permitirá prototipar y experimentar más rápido que con hardware de generaciones anteriores. Dos de los proyectos que se acelerarán son FastVideo y Lmgame-bench. FastVideo se centra en generar un vídeo de cinco segundos a partir de un texto en el mismo tiempo. Lmgame-bench es un banco de pruebas que evalúa LLMs usando videojuegos como Tetris.

Búsqueda de baja latencia en LLMs

Otros trabajos del laboratorio exploran nuevas formas de lograr un servicio de LLM de baja latencia. Los investigadores usan el DGX B200 para explorar la próxima frontera del servicio de LLM de baja latencia. El objetivo es acercar los modelos de lenguaje grande a una capacidad de respuesta en tiempo real.

El origen de DistServe y la métrica «goodput»

Varias plataformas de inferencia de LLM en producción, como NVIDIA Dynamo, usan conceptos de investigación originados en el Hao AI Lab, incluido DistServe. DistServe propuso una nueva métrica llamada «goodput». Esta mide el rendimiento (throughput) mientras se cumplen los objetivos de latencia especificados por el usuario. Representa la salud general de un sistema satisfaciendo la experiencia del usuario.

Desagregación de prefiltrado y decodificación

Los investigadores detrás de DistServe descubrieron que separar las fases de prefiltrado (prefill) y decodificación (decode) en diferentes GPUs maximiza el «goodput». Este proceso elimina la interferencia entre las dos tareas, haciendo que ambas se ejecuten más rápido. NVIDIA Dynamo permite escalar la inferencia desagregada.

Colaboraciones y futuro de la investigación

El DGX B200 también apoyará colaboraciones interdepartamentales en UC San Diego, por ejemplo en sanidad y biología. El objetivo es optimizar una variedad de proyectos de investigación mientras se explora cómo las plataformas de IA pueden acelerar la innovación.

NVIDIA presenta Halos, un marco de seguridad para IA física en robots y vehículos autónomos

NVIDIA presenta la especificación OpenUSD Core 1.0 y el marco de seguridad Halos. Estos estándares
Imagen sin título

UC San Diego recibe supercomputador NVIDIA para avanzar en investigación de IA generativa

El laboratorio Hao AI de UC San Diego ha recibido un sistema NVIDIA DGX B200
Miembros del Hao AI Lab junto al sistema NVIDIA DGX B200.

Amazon nombra a Peter DeSantis para liderar una nueva organización de IA

Amazon nombra a Peter DeSantis, veterano ejecutivo de AWS, para dirigir una nueva organización estratégica
Imagen sin título

Bluesky lanza función para encontrar amigos con enfoque en privacidad

Bluesky activa una herramienta para localizar contactos que solo funciona con consentimiento mutuo. El sistema
Imagen sin título

Coursera y Udemy anuncian una fusión valorada en 2.500 millones de dólares

Coursera y Udemy anuncian su fusión en una operación valorada en 2.500 millones de dólares.
Imagen sin título

Google lanza Gemini 3 Flash y lo convierte en el modelo por defecto en su app

Google establece a Gemini 3 Flash como el modelo predeterminado en su aplicación y búsqueda.
Imagen sin título

Warner Bros. Discovery rechaza la oferta hostil de 108.000 millones de Paramount

El consejo de Warner Bros. Discovery ha rechazado formalmente la oferta de compra hostil de
Logotipos de Warner Bros. Discovery y Paramount

Google integra su herramienta de ‘vibe-coding’ Opal en la aplicación web de Gemini

Google ha integrado su herramienta Opal, de ‘vibe-coding’, en la aplicación web de Gemini. Permite
Interfaz de la herramienta Opal dentro de Gemini.

Mozilla nombra a Anthony Enzor-DeMeo nuevo CEO en plena guerra de navegadores con IA

Mozilla nombra a Anthony Enzor-DeMeo como nuevo consejero delegado. La compañía anunció que integrará funciones
Anthony Enzor-DeMeo, nuevo CEO de Mozilla.

Skana Robotics desarrolla un sistema de IA para comunicar robots submarinos

La startup israelí Skana Robotics ha desarrollado un sistema de IA que permite a flotas
Imagen sin título

Mercado online vende códigos para «drogar» a chatbots como ChatGPT

Un mercado en línea llamado Pharmaicy vende módulos de código que simulan los efectos de
Ilustración conceptual de un chatbot bajo los efectos de un código que simula drogas.

Amazon negocia una inversión de 10.000 millones de dólares en OpenAI

Amazon está en conversaciones para invertir hasta 10.000 millones de dólares en OpenAI. El acuerdo,
Imagen sin título