El web scraping es una técnica que permite extraer datos de una página web para utilizarlos en otra, generalmente con fines como la comparación de precios u ofertas. Sin embargo, su legalidad es un tema complejo que depende de varios factores, como si la base de datos extraída está protegida por derechos de autor o si su creador ha realizado una inversión sustancial en su desarrollo.
Protección legal de las bases de datos
En España, la Ley de Propiedad Intelectual (LPI) protege las bases de datos de dos formas:
- Si son originales, pueden estar amparadas por derechos de autor, pero solo en lo que respecta a su estructura y organización, no a los datos en sí.
- Si no son originales, pero han requerido una inversión considerable, pueden protegerse mediante el derecho sui generis, que reconoce el esfuerzo financiero o técnico realizado para recopilarlas, verificarlas y presentarlas.
El fabricante de una base de datos protegida por el derecho sui generis puede prohibir la extracción o reutilización de una parte sustancial de su contenido, salvo en casos específicos como investigación, enseñanza o seguridad pública.
¿Es legal el web scraping?
El Tribunal Supremo ha analizado esta cuestión en varias sentencias, especialmente en los casos de Ryanair contra agencias de viajes online como Atrápalo o Lastminute. En estos casos, se concluyó que Ryanair no podía reclamar una infracción de derechos de propiedad intelectual porque su base de datos no cumplía los requisitos de originalidad ni de inversión sustancial.
Además, el Tribunal consideró que la actividad de las agencias de viajes no implicaba una extracción sistemática ni un aprovechamiento indebido del esfuerzo de Ryanair. También rechazó que la simple navegación en la web supusiera la aceptación de unas condiciones que prohibieran el scraping.
Más allá de la propiedad intelectual, algunas empresas han intentado frenar el scraping alegando incumplimiento de contratos (por violar los términos de uso de su web) o competencia desleal (por beneficiarse del esfuerzo ajeno). Sin embargo, en muchos casos los tribunales han rechazado estos argumentos, salvo que se demuestre un daño real o una imitación que genere confusión entre los consumidores.
¿Qué dice el Reglamento de la UE sobre IA?
El nuevo Reglamento de Inteligencia Artificial de la UE no prohíbe el web scraping en general, pero sí veta su uso cuando se emplea para crear bases de datos de reconocimiento facial sin autorización. Es decir, la extracción masiva de imágenes de Internet para entrenar sistemas de reconocimiento facial está expresamente prohibida, pero otras formas de scraping pueden seguir siendo legales, dependiendo del caso.Así pues, el scraping en general:
- no está prohibido siempre que no se enfoque en individuos o grupos específicos.
- Sí está prohibido si el scraping está dirigido para reconocimiento facial.
Debemos tener en cuenta que esta regulación del Reglamento IA se centra en la identificación biométrica a gran escala, no en la extracción de datos de bases protegidas por la propiedad intelectual.
Conclusión
El web scraping no está prohibido de forma general, pero puede ser ilegal si se extraen datos de bases protegidas, si se incumplen contratos o si se incurre en competencia desleal. Cada caso debe analizarse según la legislación aplicable y los derechos involucrados.