Perplexity ignora bloqueos y rasca webs contra su voluntad
Cloudflare acusa a la startup de IA de eludir restricciones con técnicas encubiertas. La empresa detectó millones de solicitudes diarias a dominios que prohibieron explícitamente el scraping. El conflicto refleja la tensión entre el desarrollo de IA y los derechos de los propietarios de contenidos.
«Intentos sistemáticos de burlar preferencias»
Según Cloudflare, Perplexity modificó su identificación digital y redes para evitar detección, usando incluso un agente de usuario falso que imitaba Google Chrome. «Observamos este comportamiento en decenas de miles de dominios», detalló la empresa, que eliminó los bots de Perplexity de su lista verificada.
La defensa de Perplexity
El portavoz Jesse Dwyer tachó el informe de «argumento comercial» y negó que accedieran a contenidos. Sobre el bot identificado, afirmó: «Ni siquiera es nuestro». Sin embargo, Cloudflare sostiene que verificó la actividad tras quejas de clientes con reglas anti-scraping activas.
La batalla por el contenido en la era IA
Desde 2024, medios como Wired acusan a Perplexity de plagio. Su CEO, Aravind Srinivas, evitó definir el término en una entrevista. Cloudflare, por su parte, lanzó herramientas gratuitas contra el scraping ilegal y un mercado para monetizar accesos de bots, alertando que «la IA rompe el modelo de negocio de internet».
Cuando la tecnología choca con la ética
El estándar Robots.txt permite a webs rechazar indexación, pero su cumplimiento es voluntario. Startups como Perplexity dependen de datos masivos para entrenar sus modelos, generando conflictos con creadores. Cloudflare lidera la resistencia con soluciones técnicas, aunque su eficacia total sigue en prueba.
Un conflicto que no desaparecerá
El caso evidencia los vacíos legales y técnicos alrededor del scraping para IA. Mientras empresas como Perplexity priorizan el desarrollo, propietarios de contenidos exigen control sobre su uso. La solución, según expertos, requerirá ajustes normativos y tecnológicos simultáneos.