CEO de People acusa a Google de robar contenido para sus productos de IA
Neil Vogel denuncia que Google utiliza un único rastreador para búsquedas y para entrenar sus modelos de IA. El directivo hizo estas declaraciones en la conferencia Fortune Brainstorm Tech, celebrada esta semana, alegando que esta práctica lesiona a los editores.
Un rastreador para dos fines
El CEO de People, Inc., Neil Vogel, acusó a Google de ser un «mal actor» por emplear el mismo bot, Googlebot, para indexar sitios web en su motor de búsqueda y para extraer contenido con el que alimentar sus productos de Inteligencia Artificial. «Utilizan el mismo rastreador para su búsqueda, que aún nos envía tráfico, como para sus productos de IA, donde roban nuestro contenido», declaró Vogel. Señaló que el tráfico procedente de Google Search para su empresa ha caído de representar alrededor del 65% hace tres años a «alrededor del 20% y pico» en la actualidad.
La estrategia de bloqueo y la búsqueda de acuerdos
People, Inc. está utilizando una solución de la infraestructura web Cloudflare para bloquear los rastreadores de IA que no pagan por el contenido, una medida que, según Vogel, ha obligado a «grandes proveedores de LLM» a acercarse a la editorial para negociar acuerdos de contenido. Mencionó que tienen un acuerdo con OpenAI, a quien describió como un «buen actor».
Un problema sin solución fácil para los editores
Vogel subrayó el dilema al que se enfrentan los editores: bloquear el crawler de Google también impediría que sus sitios web se indexaran en la Búsqueda, lo que cortaría ese tráfico residual que aún reciben. «Ellos lo saben, y no están dividiendo su rastreador. Así que son un mal actor intencional aquí», afirmó. Esta postura fue respaldada por Janice Min, de Ankler Media, quien calificó a las grandes tecnológicas de «cleptómanas del contenido».
El ecosistema digital y el valor del contenido
Históricamente, los editores digitales dependían en gran medida del tráfico referido desde motores de búsqueda como Google, que en el pasado llegó a suponer hasta el 90% del tráfico web abierto para algunas empresas. La irrupción de la IA generativa ha creado un nuevo paradigma en el que este contenido se utiliza para entrenar modelos que, potencialmente, compiten con las propias fuentes de origen.
Un futuro de negociaciones y posibles regulaciones
Matthew Prince, CEO de Cloudflare, sugirió que la situación podría evolucionar con nuevas regulaciones y predijo que Google podría estar pagando a los creadores de contenido por rastrear y usar su material en modelos de IA para el próximo año. También cuestionó la eficacia de recurrir únicamente a leyes de copyright de la era pre-IA para resolver este conflicto, argumentando que lo que hacen las compañías de IA es crear obras derivativas.