Skip to content

Big Data y Data Mining ¿Oportunidad o distopía? (I)

Rodrigo del Olmo – El PERISCOPI

El concepto Big Data hace referencia a los grandes volúmenes de datos almacenados y procesados a gran escala que no pueden trabajarse a un nivel inferior para extraer conocimientos, crear valor, descubrir tendencias, las formas en la que cambian los mercados, las organizaciones, las relaciones sociales, las de los ciudadanos con los políticos, etc. Pero esto es sólo el principio. La era del Big Data marca el inicio de una gran transformación, desafía la forma en que vivimos y nos relacionamos con el mundo. Una de las cosas más llamativas es que, seguramente, la sociedad acabará desprendiéndose de su obsesión por la causalidad a cambio de correlaciones simples: no saber por qué sino solo el qué. Esto da un vuelco a siglos de prácticas establecidas y desafía nuestras comprensiones más básicas sobre la forma de tomar decisiones y comprender la realidad. En esencia, el Big Data versa sobre predicciones. La verdadera revolución no se encuentra tanto en las computadoras y sistemas que calculan en base a los datos sino en los datos en sí mismos y en la forma en la que los usamos. Sirva como ejemplo la imagen de un caballo, si en lugar de capturar una simple foto tomamos una serie de imágenes y las proyectamos por encima de los 24 frames por segundo, el cambio cuantitativo nos ha llevado a un cambio cualitativo: de la fotografía hemos pasado al cine. Ocurre de forma similar con el Big Data: modificando la cantidad, modificamos la esencia. Los resultados de la sociedad de la información son fáciles de observar: un móvil en cada bolsillo, un ordenador en cada mochila y grandes sistemas informáticos en la trastienda de un sinfín de actividades sociales, comerciales, sanitarias o lúdicas. Pero menos notoria resulta la información en sí. Sin embargo, tras medio siglo después de la introducción de los ordenadores, los datos han comenzado a acumularse hasta el punto en el que se produce un nuevo fenómeno. No solo se trata de que el mundo esté inundado con más datos que nunca, sino que la información acumulada crece cada vez más rápidamente. El cambio de escala ha dado lugar a un cambio de estado, el cambio cuantitativo ha dado lugar a un cambio cuantitativo (Mayer-Schönberger y Cukier, 2013).

El Data Mining (Minería de Datos) es el estudio de la recogida, depuración, procesamiento, análisis y obtención de información útil a partir de datos. Existe una amplia variedad en cuanto a los problemas, dominios, aplicaciones, representaciones y formulaciones de datos susceptibles de encontrar aplicación. Por tanto, el término Data Mining es un amplio paraguas que se utiliza para describir diferentes aspectos del procesamiento de datos. Puede ser considerado uno de los componentes fundamentales de las técnicas y sistemas de Big Data. Básicamente, las técnicas de Data Mining se articulan en torno a tres fases: recolección de datos; extracción de características y depuración de los datos, y el procesamiento analítico junto con la elaboración de algoritmos (Aggarwal 2015).

El volumen y variedad de datos que están siendo continuamente generados sobre todos los aspectos de la vida cotidiana y el mundo en que vivimos crece exponencialmente y estos datos se generan, almacenan y gestionan, cada vez más, en tiempo real, de forma exhaustiva y relacional. Lo que antes era privado o desconocido está siendo revelado a un conjunto diverso de individuos, corporaciones, gobiernos, e instituciones que los emplean, o pueden emplearlos, en la toma de decisiones de acuerdo con sus propios intereses, siendo así, las decisiones políticas y empresariales están cada vez más basadas en los datos empíricos masivamente recogidos y gestionados por tecnócratas. Las consideraciones éticas, políticas y legales que la revolución del Big Data plantea están principalmente en relación a temas como la seguridad basada en la monitorización de datos personales y rastros digitales dejados, directa o indirectamente, por los individuos, privacidad, creación de perfiles, clasificación socio económica, así como en el establecimiento de líneas rojas en relación a gobierno anticipatorio, gobernanza tecnocrática corporativa, bloqueos tecnológicos, pertenencia y propiedad intelectual. Es cada vez más difícil participar en la vida diaria sin dejar algún rastro debido al papel mediador de las tecnologías digitales, el software y el uso de identificadores indexables. Todo ello almacenado en distintas bases de datos que no solo incluyen las huellas digitales de los individuos (los datos que ellos mismos dejan), sino también la sombra de sus datos (información sobre ellos generada por otros), cada vez más capaces de proporcionar información sobre ubicación, rutas, interacciones y transacciones a lo largo del espacio y el tiempo. Estos datos pueden ser almacenados indefinidamente creando un universo que lo recuerda todo y nada olvida. Las huellas y sombras digitales proporcionan un ampliamente detallado registro de la vida diaria de cada individuo: patrones de consumo, trabajo, viaje, comunicación, juego, interacciones con organizaciones, así como pensamientos e intereses. No solamente los sujetos, sino también los objetos como instituciones, transacciones y territorios pueden estar sometidos a este profundo escrutinio. Las huellas y sombras digitales están fragmentadas y dispersas, repartidas entre servidores de decenas de organizaciones diversas, estando sujetos tanto a la integración como a la división según los casos. Por el momento, a lo sumo, constituyen “oligopticones”, visiones limitadas de puntos de vista que no abarcan toda la información disponible en Internet, que solo por parte de algunas agencias de inteligencia gubernamentales podrían ser integrados en aras de acercarse a configurar un “panopticón” digital (el ojo divino que todo lo ve). La tendencia, sin embargo, dada la relacionalidad de los datos y el valor de su amplificación, es hacia la combinación de visiones oligoópticas que permitan mayor potencia escrutadora, analítica y predictiva (Kitchin, 2014).

Continuará.

Llicenciat en Ciències Polítiques i de l’Administració. Llicenciat en Sociologia