Perplexity ignora bloqueos y rasca webs contra su voluntad

Cloudflare acusa a la startup de IA de eludir restricciones con técnicas encubiertas para acceder a contenidos prohibidos, generando tensión en la industria.
TechCrunch
Kimberly White/Getty Images para TechCrunch Kimberly White / TechCrunch
Kimberly White/Getty Images para TechCrunch Kimberly White / TechCrunch

Perplexity ignora bloqueos y rasca webs contra su voluntad

Cloudflare acusa a la startup de IA de eludir restricciones con técnicas encubiertas. La empresa detectó millones de solicitudes diarias a dominios que prohibieron explícitamente el scraping. El conflicto refleja la tensión entre el desarrollo de IA y los derechos de los propietarios de contenidos.

«Intentos sistemáticos de burlar preferencias»

Según Cloudflare, Perplexity modificó su identificación digital y redes para evitar detección, usando incluso un agente de usuario falso que imitaba Google Chrome. «Observamos este comportamiento en decenas de miles de dominios», detalló la empresa, que eliminó los bots de Perplexity de su lista verificada.

La defensa de Perplexity

El portavoz Jesse Dwyer tachó el informe de «argumento comercial» y negó que accedieran a contenidos. Sobre el bot identificado, afirmó: «Ni siquiera es nuestro». Sin embargo, Cloudflare sostiene que verificó la actividad tras quejas de clientes con reglas anti-scraping activas.

La batalla por el contenido en la era IA

Desde 2024, medios como Wired acusan a Perplexity de plagio. Su CEO, Aravind Srinivas, evitó definir el término en una entrevista. Cloudflare, por su parte, lanzó herramientas gratuitas contra el scraping ilegal y un mercado para monetizar accesos de bots, alertando que «la IA rompe el modelo de negocio de internet».

Cuando la tecnología choca con la ética

El estándar Robots.txt permite a webs rechazar indexación, pero su cumplimiento es voluntario. Startups como Perplexity dependen de datos masivos para entrenar sus modelos, generando conflictos con creadores. Cloudflare lidera la resistencia con soluciones técnicas, aunque su eficacia total sigue en prueba.

Un conflicto que no desaparecerá

El caso evidencia los vacíos legales y técnicos alrededor del scraping para IA. Mientras empresas como Perplexity priorizan el desarrollo, propietarios de contenidos exigen control sobre su uso. La solución, según expertos, requerirá ajustes normativos y tecnológicos simultáneos.

Cadenas de bebidas chinas se expanden en EE.UU. desafiando a Starbucks

Las cadenas chinas Luckin Coffee, Chagee y HeyTea se expanden en Nueva York y California.
Una tienda de Luckin Coffee en Manhattan, donde los clientes realizan pedidos online.

Bradley Tusk lanza protocolo para impulsar el voto por móvil en EE.UU.

El consultor Bradley Tusk presenta VoteSecure, un protocolo criptográfico de código abierto para votar desde
Foto-Ilustración del personal de WIRED

OpenAI soluciona el problema del guion largo en ChatGPT tras criticas

OpenAI ha corregido la incidencia que asociaba el guion largo con textos de IA. Los
Imagen sin título

Spotify introduce nuevos planes Premium en cinco mercados

Spotify introduce nuevos planes de suscripción en cinco mercados, incluido un nivel Platinum con audio
Imagen sin título

Las grandes tecnológicas negocian el futuro de la compra automatizada con IA

Las compras navideñas realizadas por agentes de IA experimentan retrasos debido a complejas negociaciones entre
Ilustración conceptual de un agente de IA realizando compras online.

Inversores de capital riesgo cambian sus reglas para financiar startups de IA

Los fondos de capital riesgo modifican sus estrategias de inversión en inteligencia artificial ante startups
Imagen sin título

OpenAI prueba chats grupales en ChatGPT en Asia y Oceanía

OpenAI inicia una prueba piloto de chats grupales para ChatGPT en cuatro países asiáticos. La
Imagen sin título

Harvey, la startup legal de IA, alcanza una valoración de 8000 millones de dólares

La startup legal Harvey ha alcanzado una valoración de 8000 millones de dólares en octubre
Imagen sin título

Apple exige transparencia en apps que comparten datos con IA de terceros

Apple actualiza sus normas exigiendo que las aplicaciones revelen y obtengan consentimiento explícito antes de
Imagen sin título

Jack Dorsey financia diVine, una nueva app que recupera el archivo de Vine

Jack Dorsey respalda diVine, una nueva aplicación que recupera más de 100.000 vídeos del archivo
Captura de pantalla de la aplicación diVine

Teradar recauda 150 millones de dólares para un sensor que supera al lidar

La startup Teradar ha recaudado 150 millones de dólares en una ronda Serie B para
Matt Carey, cofundador y CEO de Teradar, demostrando el sensor.

Cursor recauda 2.300 millones de dólares en una nueva ronda de financiación

Cursor, la herramienta de IA para desarrolladores, ha recaudado 2300 millones de dólares, duplicando su
Imagen sin título