| Compañías | Ética y Sociedad |

Empresas de IA recopilan sus propios datos para entrenar modelos

TechCrunch

Why AI startups are taking data into their own hands | TechCrunch
Russell Brandom
TechCrunch
inglés
Estados Unidos
en-us
Fecha de consulta: 2025-10-16T20:00:40.823000Z
Fecha de consulta: 1760644840823
Fecha de publicación fuente: 2025-10-16T19:08:00Z
Fecha de publicación fuente: 1760641680000
Fecha de actualización fuente: 2025-10-16T19:08:06Z
https://techcrunch.com/2025/10/16/why-ai-startups-are-taking-data-into-their-own-hands

Compañías de IA como Turing Labs y Fyxer abandonan el scraping web por la recolección manual de datos especializados. Contratan expertos para generar conjuntos de alta calidad que se convierten en su principal ventaja competitiva frente a modelos genéricos.

Empresas de IA recolectan sus propios datos para entrenar modelos

La calidad de los datos, no la cantidad, define el rendimiento de la IA. Compañías como Turing Labs y Fyxer están cambiando su estrategia de datos, pasando del scraping web a la recolección manual y especializada para obtener una ventaja competitiva.

Recolección manual para modelos de visión

Turing Labs contrata a artistas, chefs y trabajadores manuales para grabar sus tareas. Los trabajadores usan cámaras GoPro en la cabeza para generar conjuntos de datos diversos que enseñen al modelo a resolver problemas de forma secuencial. La empresa estima que entre el 75% y el 80% de sus datos finales son sintéticos, generados a partir de estos vídeos originales.

El coste humano de los datos

Una trabajadora, Taylor, describió la tarea como físicamente exigente. Cinco horas de filmación sincronizada requerían siete horas de trabajo diario, causando dolores de cabeza y marcas en la piel. Este método de recolección directa es la forma que tiene Turing de asegurar la variedad en la fase de preentrenamiento.

Datos especializados para el correo electrónico

La empresa Fyxer, que desarrolla un asistente para correo electrónico, descubrió que necesitaba conjuntos de datos pequeños y muy cuidados. En sus inicios, los ingenieros eran superados en número cuatro a uno por asistentes ejecutivos expertos, que eran los encargados de entrenar al modelo en los fundamentos de la gestión de correos.

La nueva estrategia de los datos

Las compañías están internalizando la recolección de datos. Donde antes se raspaba la web o se usaban anotadores mal pagados, ahora se paga bien por datos curados meticulosamente. Esta información de alta calidad se ha convertido en la principal ventaja competitiva y en una barrera de entrada para la competencia.

Antecedentes del cambio

El cambio responde a que el poder bruto de la IA ya está establecido. Las empresas ya no compiten solo por el modelo, sino por la calidad de los datos de entrenamiento propietarios. Fyxer considera que este arduo trabajo de recolección es uno de los mejores muros de contención contra sus competidores.

Implicaciones del nuevo enfoque

Este enfoque prioriza la calidad sobre la cantidad, especialmente cuando se usa datos sintéticos. Cualquier fallo en el conjunto de datos original se magnifica en la fase de generación sintética. La recolección interna y especializada se consolida como la estrategia clave para el desarrollo de productos de IA funcionales y diferenciados.

Post Views: 156

| Ética y Sociedad |

enero 3, 2026

Estados Unidos invade Venezuela y captura al presidente Nicolás Maduro

Los principales asistentes de IA ofrecieron respuestas contradictorias sobre la noticia de la invasión estadounidense

| Ética y Sociedad |

enero 1, 2026

Los chatbots eróticos definen la narrativa de la IA en 2025 frente a expectativas incumplidas

Mientras la promesa de productividad laboral con IA se desinfla, el nicho de los chatbots

| Compañías |

enero 1, 2026

El ‘abandonar los estudios’ se convierte en credencial clave para fundadores de startups

Ser un ‘college dropout’ se ha convertido en una credencial destacada en el ecosistema emprendedor,

| Ética y Sociedad |

diciembre 31, 2025

Inversores predicen que la IA impactará significativamente en el empleo en 2026

Capitalistas de riesgo anticipan que la IA impactará significativamente en la fuerza laboral en 2026,

| Aplicaciones |

diciembre 31, 2025

La industria de las citas apuesta por la conexión presencial frente al agotamiento de las aplicaciones

La industria de las citas online combina herramientas de IA con un fuerte impulso hacia

| Compañías |

diciembre 31, 2025

Jon Callaghan predice el fin del teléfono inteligente en una década

Jon Callaghan, cofundador de True Ventures, afirma que en diez años no usaremos iPhones. La

| Aplicaciones |

diciembre 30, 2025

Las mejores aplicaciones de dictado por IA de 2025 ofrecen precisión y privacidad

Las aplicaciones de dictado por IA en 2025 han mejorado significativamente gracias a modelos de

| Compañías |

diciembre 30, 2025

Empresas concentrarán su gasto en IA en 2026, según inversores

El 94% de capitalistas de riesgo prevé un aumento del presupuesto empresarial en IA para

| Compañías |

diciembre 30, 2025

Meta adquiere la startup de IA Manus por 2.000 millones de dólares

Meta Platforms ha adquirido la startup singapurense de inteligencia artificial Manus por 2.000 millones de

| Compañías |

diciembre 29, 2025

La industria de la IA recibe un ‘vibe check’ en 2025 tras inversiones billonarias

Tras inversiones récord que superaron el billón de dólares, la industria de la inteligencia artificial

| Compañías |

diciembre 29, 2025

Plaud Note Pro, el grabador de IA del tamaño de una tarjeta, supera el millón de unidades

Plaud ha enviado más de un millón de unidades de su grabador de IA, el

| Aplicaciones |

diciembre 29, 2025

OpenAI lanza integraciones de aplicaciones en ChatGPT para EE.UU. y Canadá

OpenAI permite conectar cuentas de servicios como Spotify, Uber o Booking.com directamente en ChatGPT. Los

| Compañías | Ética y Sociedad |

Empresas de IA recopilan sus propios datos para entrenar modelos

Empresas de IA recolectan sus propios datos para entrenar modelos

Recolección manual para modelos de visión

El coste humano de los datos

Datos especializados para el correo electrónico

La nueva estrategia de los datos

Antecedentes del cambio

Implicaciones del nuevo enfoque

Estados Unidos invade Venezuela y captura al presidente Nicolás Maduro

Los chatbots eróticos definen la narrativa de la IA en 2025 frente a expectativas incumplidas

El ‘abandonar los estudios’ se convierte en credencial clave para fundadores de startups

Inversores predicen que la IA impactará significativamente en el empleo en 2026

La industria de las citas apuesta por la conexión presencial frente al agotamiento de las aplicaciones

Jon Callaghan predice el fin del teléfono inteligente en una década

Las mejores aplicaciones de dictado por IA de 2025 ofrecen precisión y privacidad

Empresas concentrarán su gasto en IA en 2026, según inversores

Meta adquiere la startup de IA Manus por 2.000 millones de dólares

La industria de la IA recibe un ‘vibe check’ en 2025 tras inversiones billonarias

Plaud Note Pro, el grabador de IA del tamaño de una tarjeta, supera el millón de unidades

OpenAI lanza integraciones de aplicaciones en ChatGPT para EE.UU. y Canadá

Inicio

Aplicaciones

Compañías

Otros

Noticias

Sociedad

Seguridad

Entretenimiento y Retail

Industrias

Energía

Healthcare

Videojuegos

Investigación

Robótica

Privacidad

Language models