Perplexity ignora bloqueos y rasca webs contra su voluntad

Cloudflare acusa a la startup de IA de eludir restricciones con técnicas encubiertas para acceder a contenidos prohibidos, generando tensión en la industria.
TechCrunch
Kimberly White/Getty Images para TechCrunch Kimberly White / TechCrunch

Perplexity ignora bloqueos y rasca webs contra su voluntad

Cloudflare acusa a la startup de IA de eludir restricciones con técnicas encubiertas. La empresa detectó millones de solicitudes diarias a dominios que prohibieron explícitamente el scraping. El conflicto refleja la tensión entre el desarrollo de IA y los derechos de los propietarios de contenidos.

«Intentos sistemáticos de burlar preferencias»

Según Cloudflare, Perplexity modificó su identificación digital y redes para evitar detección, usando incluso un agente de usuario falso que imitaba Google Chrome. «Observamos este comportamiento en decenas de miles de dominios», detalló la empresa, que eliminó los bots de Perplexity de su lista verificada.

La defensa de Perplexity

El portavoz Jesse Dwyer tachó el informe de «argumento comercial» y negó que accedieran a contenidos. Sobre el bot identificado, afirmó: «Ni siquiera es nuestro». Sin embargo, Cloudflare sostiene que verificó la actividad tras quejas de clientes con reglas anti-scraping activas.

La batalla por el contenido en la era IA

Desde 2024, medios como Wired acusan a Perplexity de plagio. Su CEO, Aravind Srinivas, evitó definir el término en una entrevista. Cloudflare, por su parte, lanzó herramientas gratuitas contra el scraping ilegal y un mercado para monetizar accesos de bots, alertando que «la IA rompe el modelo de negocio de internet».

Cuando la tecnología choca con la ética

El estándar Robots.txt permite a webs rechazar indexación, pero su cumplimiento es voluntario. Startups como Perplexity dependen de datos masivos para entrenar sus modelos, generando conflictos con creadores. Cloudflare lidera la resistencia con soluciones técnicas, aunque su eficacia total sigue en prueba.

Un conflicto que no desaparecerá

El caso evidencia los vacíos legales y técnicos alrededor del scraping para IA. Mientras empresas como Perplexity priorizan el desarrollo, propietarios de contenidos exigen control sobre su uso. La solución, según expertos, requerirá ajustes normativos y tecnológicos simultáneos.

Fintech Alaan recauda 48 millones en ronda Serie A en MENA

La plataforma de gestión de gastos corporativos Alaan recaudó 48 millones de dólares en una ronda Serie A, liderando
Imagen sin título Información de autor no disponible / TechCrunch

Uzbeca Uzum alcanza valoración de 1.500 millones

La startup uzbeca Uzum suma 65,5 millones de dólares en inversión, con Tencent y VR Capital como principales respaldos,
Punto de recogida de Uzum Uzum / TechCrunch

Jeh Aerospace recauda 11M para cadena de suministro aeronáutica

La startup india Jeh Aerospace recaudó 11 millones de dólares para optimizar la producción de componentes aeronáuticos con tecnología
Fundadores de Jeh Aerospace, Venkatesh Mudragalla (izquierda) y Vishal Sanghavi (derecha) Jeh Aerospace / TechCrunch

Dribbble expulsa a diseñador estrella por incumplir normas

Gleb Kuznetsov, con 210 millones de seguidores, fue expulsado de Dribbble por compartir su contacto con clientes. La plataforma
Imagen sin título Información de autor no disponible / TechCrunch

Google usa IA para detectar 20 vulnerabilidades en software

La herramienta Big Sleep de Google, desarrollada con DeepMind, identificó fallos en software de código abierto como FFmpeg e
Imagen sin título Información de autor no disponible / TechCrunch

Amazon desmiente cierre de Wondery y anuncia reestructuración

Amazon negó rumores sobre el cierre de Wondery, pero integrará su equipo de podcasts narrativos en Audible, afectando a
Imagen sin título Matthias Balk/picture alliance / Getty Images / TechCrunch

Foxconn vende fábrica de GM tras fracaso en producción de EVs

Foxconn vendió su planta en Ohio por 375 millones de dólares tras incumplir promesas de producción masiva de vehículos
Imagen sin título Información de autor no disponible / Bloomberg

Rivian demanda a Ohio por vender vehículos eléctricos

Rivian presenta una demanda federal contra Ohio por prohibir la venta directa de vehículos eléctricos, alegando perjuicio a los
Imagen sin título Información de autor no disponible / TechCrunch

Tesla lanza servicio de transporte con conductor en California

Tesla inicia un servicio de transporte en California con empleados al volante, lejos de su promesa de robotaxis autónomos.
Imagen de un vehículo Tesla utilizado en el servicio de transporte Justin Sullivan / Getty Images / TechCrunch

Elon Musk anuncia la recuperación del archivo de Vine

El dueño de X confirmó el hallazgo del archivo histórico de Vine y planea restaurar el acceso a los
Imagen sin título Información de autor no disponible / TechCrunch

Elon Musk lanza Grok Imagine, generador de contenido NSFW

xAI lanza Grok Imagine, una herramienta de IA para crear vídeos e imágenes con desnudos parciales, disponible para suscriptores
Imagen generada por Grok Imagine Klaudia Radecka / NurPhoto / Getty Images / TechCrunch

ChatGPT alcanza 700 millones de usuarios semanales

OpenAI confirma que ChatGPT superará los 700 millones de usuarios semanales, cuadruplicando su base en un año gracias a
Imagen sin título Jakub Porzycki / NurPhoto / Getty Images / TechCrunch