Startups entrenan IA avanzada sin centros de datos

WIRED
Flower AI y Vana desarrollan Collective-1, un modelo de IA de 7.000 millones de parámetros usando GPUs distribuidas y datos de redes sociales, democratizando el desarrollo de inteligencia artificial.
Facebook
Twitter
LinkedIn

Startups entrenan modelo de IA avanzado sin centros de datos

Flower AI y Vana desarrollan Collective-1, un modelo de 7.000 millones de parámetros. Utilizan GPUs distribuidas globalmente y datos privados de redes sociales. La técnica podría democratizar el desarrollo de IA al reducir dependencia de infraestructuras centralizadas.

«Un nuevo paradigma en entrenamiento de IA»

Las startups Flower AI y Vana crearon Collective-1 combinando tecnología de aprendizaje distribuido con datos de mensajes privados de plataformas como X, Reddit y Telegram. «Es la primera vez que datos aportados directamente por usuarios entrenan un modelo base», afirma Anna Kazlauskas, cofundadora de Vana.

Escalando el modelo

Nic Lane, de Flower AI, revela que ya trabajan en un modelo de 30.000 millones de parámetros y planean otro de 100.000 millones para fin de año. La herramienta Photon, desarrollada con universidades chinas, optimiza el entrenamiento distribuido bajo licencia open source.

Cambiando las reglas del juego

El método desafía el enfoque tradicional que requiere centros de datos masivos y chips avanzados. Helen Toner, experta en gobernanza de IA, lo califica como «un enfoque interesante para competencia y regulación», aunque advierte que aún debe demostrar su capacidad frente a modelos líderes.

Datos descentralizados

El sistema permite incorporar información sensible (sanitaria o financiera) sin centralizarla, según Mirco Musolesi de University College London. Vana ofrece a los usuarios control sobre cómo se usa su información e incluso compensación económica.

De la teoría a la práctica

Google ya explora técnicas similares con DiPaCo, pero Flower AI afirma que Photon es más eficiente. El proceso es más lento que el convencional, pero permite añadir hardware progresivamente y escalar sin depender de un único centro.

IA sin fronteras

El enfoque podría permitir a países con menos recursos desarrollar IA avanzada interconectando varios centros pequeños. También abre la puerta a modelos especializados en sectores con datos sensibles, como salud o banca.