Data mining, el poder para comprender los datos

Dataminig

En el año 2017, más de medio mundo se ha conectado a Internet. Es decir, alrededor de 3.800.000 personas han tenido acceso al, posiblemente, invento más importante del siglo XX (y uno de los mayores de la historia). En un día se envían 280 mil millones de correos, en un minuto se suben más de 300 horas de vídeo a Youtube y en un segundo se generan casi 50.000 GB de tráfico. Internet, según algunas estimaciones, pesaría más de un zettabyte (10 elevado a 9 terabytes), una auténtica locura, algo abrumador, y se espera que aumente exponencialmente. Por ello, los datos, con un gran poder económico, se han convertido por derecho propio en el oro del siglo XXI. Y, como todos saben, el oro necesita de la minería para ser extraído. Como los datos.

Data mining –minería de datos, en español–, son “aquellos procedimientos algorítmicos para evaluar datos aplicados a bloques con un tamaño y complejidad determinados”. Su objetivo final es el de extraer la información de cualquier conjunto de datos mediante alguno de los programas informáticos que nos muestran aquí y, como por arte de magia, transformarlos para su mejor comprensión posterior. Asimismo, a pesar de utilizar la estadística para algunas de sus funciones, no es una herramienta analítica. Es más: se nutre de la inteligencia artificial, el machine learning o de los sistemas de bases de datos para sus procesos. Por otro lado, nunca hay que confundir el Big Data con el data mining. Mientras que el primero representa el almacenamiento de grandes cantidades de datos –la tecnología que los capta, los gestiona y los procesa–, el segundo se encarga de identificarlos y extraerlos.

El caso es, ¿para qué? Pues, por ejemplo, el data mining puede encontrar aquellos clientes bancarios que siempre contesten a sus correos, en vez de que la entidad bancaria tenga que buscar, mandar y esperar de manera aleatoria e ininterrumpida; de esta manera, se optimiza el tiempo. Del mismo modo, esta tecnología también se puede utilizar en el mundo del comercio: gracias al data mining un supermercado puede incrementar sus ventas de forma exponencial detectando qué clase de clientes visitan sus instalaciones a cierta hora y a cierto día. Lógicamente, por la cantidad de datos que manejan, se podría “colocar” la tienda de modo que los productos que más le interesen a la mayoría de clientes, que van en ese mismo momento, estén a mano.

El data mining, una tecnología que puede parecer lejana, también se encuentra dentro de nuestras fronteras. Y con aplicaciones interesantes. GMV, compañía española, tiene una plataforma que contribuye a la mejora de la vigilancia epidemiológica, la asistencia clínica, la gestión y la investigación médica. Explotando la ingente cantidad de información del que dispone cualquier sistema de salud se puede extraer información y obtener resultados de los pacientes de una manera óptima. De hecho, por medio de técnicas de data mining se establecen correlaciones de causa y efecto en diferentes enfermedades, ayudando a predecir y detectar posibles contagios. Además, en nuestro país se encuentra también la compañía Innova-tsn, , de la que hablamos aquí anteriormente, y que el año pasado participó en la KDD 2017, la “copa mundial” de data mining consiguiendo el primer puesto de EMEA y el séptimo del mundo.

Esto solo quiere decir que, mientras alrededor del mundo miles y millones de personas clican al mismo tiempo en cualquier página de registro de una red social, poniendo sus datos al servicio del Big Data, los mineros, los que extraen ese “oro”, ya sean españoles o no, clasificarán y analizarán esa información para dotar a la economía actual de un nuevo sentido. Predicciones, regresiones, correlaciones… Todas las tareas posibles del data mining van dirigidas a ello: a ordenar (para bien o para mal) ese poco más de 1 zettabyte en el que se encuentran todos los datos de la humanidad. Y creciendo.

Congreso IA

Dejar una respuesta

Please enter your comment!
Please enter your name here