Skip to main content

En la actualidad, las tecnologías de la información y la comunicación tienen, entre sus actividades más rutilantes, los sistemas de minería de datos o data mining. Simplificando al extremo, podemos decir se trata de la posibilidad de leer entre líneas las bases de datos, de manera continua y automatizada. De esa silenciosa y efectiva lectura se logra acceder a información que puede ser relevante con distintos fines y que hasta hace poco tiempo resultaba inaccesible.

Los sistemas de data mining operan como intrépidos buzos en las profundidades de las bases de datos. Encuentran información oculta y a menudo muy valiosa, por medio de herramientas de estadísticas y de inteligencia artificial. Y lo hacen detectando supuestas anomalías, repeticiones u otros factores que llaman la atención a programas informáticos, especialmente dotados para ver datos llamativos donde aparentemente no los hay.

Todo empezó con Bayes

Se trata de un avance tecnológico propio del siglo XXI que, sin embargo, está basado en postulados conocidos desde hace casi tres siglos. Quien construyó las bases de ese conocimiento fue un ministro presbiteriano llamado Thomas Bayes de quién, paradójicamente, existen pocas certezas. Se sabe que murió el 7 de abril de 1761, a la edad de 59 años. O por lo menos, eso lo que dice su lápida en el cementerio londinense de Bunhill Fields. También, se conoce que fue un escritor polifacético que abordó temas variados, desde lo religioso hasta lo matemático. Más allá de eso, poco se conoce sobre Bayes, de quién ni siquiera los historiadores se ponen de acuerdo sobre su fecha de nacimiento.

De lo que no hay dudas es que en su obra postuló el conocido Teorema de Bayes: un hallazgo de inalterable vigencia que permite explorar la probabilidad de que una causa sea responsable de un fenómeno efectivamente observado y analizar probabilidades previamente calculadas cuando se posee nueva información. Algo parecido –salvando las indudables distancias– se analiza durante el posible desarrollo de un evento deportivo antes de jugarse y se revisa el análisis después, con el resultado definido.

Los aportes de Bayes sobre la probabilidad inversa, sumados a los avances en el campo de la inteligencia artificial y la gigantesca capacidad de procesamiento que adquirieron las computadoras en las últimas décadas, son los ingredientes que nutren el desarrollo de sistemas de data mining. Es que la minería de datos es una herramienta muy versátil que permite encontrar información valiosa para una amplísima galería de actividades.

Cervezas, pañales y marketing

Los primeros trabajos realizados en términos de minería de datos no fueron orientados a aportes científicos o tecnológicos, sino que se hicieron con una mirada comercial. Una cita clásica de la literatura vinculada al marketing trae el caso de la utilización de herramientas de data mining para resolver el enigma de por qué un grupo de clientes compraba en algunas tiendas cerveza y pañales en forma simultánea  los viernes a la tarde.

¿Se trata de un tema relevante? Sin dudas lo es para los que diseñan la disposición de productos en las tiendas. Las técnicas de data mining permitieron detectar que los clientes en cuestión eran padres jóvenes que dedicaban los fines de semana a cuidar a sus hijos y a consumir su bebida predilecta. La mera observación podía hacer a los especialistas sospechar respecto de este comportamiento, pero la comprobación llegó a partir de la tecnología y el procesamiento de datos. Esa información aplicada metódicamente a las prácticas comerciales significó un incremento de ventas acercando la sección de “cervezas” a la de “pañales”, simplificando el asunto a los sacrificados portadores de los paquetes de pañales, casi siempre voluminosos y no tan gratificantes como los de su cerveza preferida. Pero, además, redundó en un aumento de la eficiencia en el servicio de las tiendas.

Con la mejora de los sistemas, la automatización y la capacidad de procesamiento, la minería de datos comenzó a ser frecuentemente aplicada para entender en qué circunstancias los clientes cambian sus preferencias, abandonando a un proveedor de productos o servicios, apuntando a explicar tanto las fugas de clientes más imperceptibles como las más masivas y visibles.

En la transición a la Cuarta Revolución Industrial, la “cultura del dato” está en plena vigencia. En ese sentido, la minería de datos es un elemento que se abre paso entre las herramientas disponibles para hacer más eficientes las cadenas de suministro.

El data mining permite el diseño óptimo de las cadenas de suministro, al acceder al conocimiento los patrones de consumo, el seguimiento de los productos y adaptar las prácticas comerciales a las necesidades de los productores y sus clientes. Como en la tienda en la que compraban los padres jóvenes los viernes a la tarde, pero a escala global, la mejor ubicación para el almacenamiento y la distribución y seguimiento eficiente de los productos son objetivos para los que cada día contamos con más y mejores herramientas.

es_ESEspañol