Hoy en día la información es crucial, más cuando se encuentra organizada de tal manera que es fácil entenderla. Un buen ejemplo de lo que menciono es Google, que se encarga de organizar la información para poder ser utilizada con facilidad; en otras palabras, indexar.
La manera de indexar la información del mundo digital es recolectando información a través de ir creando pequeños robots (Bots), lo que permite una recolecta automática. En la web existe un sinnúmero de páginas web que pueden ser indexadas por estos Bots con el fin de que los usuarios puedan identificar las páginas web de una manera fácil. El proceso de recolectar información de las páginas web de manera automatizada con el fin de almacenar la información en una base de datos es lo que llamamos webscraping.
Destaca el incidente de LinkedIn en el que un ciberdelincuente realizó webscraping de la información pública de los usuarios en la plataforma para luego almacenarla en una base de datos con el fin de venderla. Esta persona se convirtió en delincuente en el momento en que hizo pública una información privada a través de recolectar la data para almacenarla con el fin de lucrarse de ella. Esta base de datos que este ciberdelincuente creó al extraer datos de más de quinientos millones de usuarios fue posible gracias al webscraping.
Debemos entender que webscraping no es una actividad ilegal por sí sola sino que, dependiendo de cómo manejes la información, será catalogada de actividad legal o no. Es aquí donde decimos que la información debe estar al acceso de todos, pero no para ser comercializada de esta manera. Debemos entender que se incurre en una actividad ilegal al momento de lucrarse con información y no al momento de extraerla. Al final, debemos de encontrar un punto de equilibrio en la actividad webscraping en lugar de sencillamente considerarla ilegal.