Modelo de Machine Learning para la prevención de fuga de clientes enfocado al sector de gases industriales

Abstract

El trabajo aborda el problema de retención de clientes en la empresa Air Products Colombia, utilizando herramientas de machine learning para identificar el comportamiento de compra de los clientes y segmentarlos en grupos con comportamientos similares (clusterización); se destaca la importancia de construir un modelo de machine learning que permita evitar la fuga de clientes, anticipar decisiones para retenerlos, mantener o incrementar ingresos, optimizar el costo de adquisición de nuevos clientes y ofrecer precios competitivos sin afectar la rentabilidad. Se realiza una descripción de la base de datos utilizada, que contiene más de 1.000 registros de ventas mensuales desde 2019 hasta la fecha y variables como tipo de cliente, productos comprados, fechas y valores de las compras, entre otros. Para la ejecución del modelo se trabajó con el lenguaje Python, utilizando diferentes técnicas de machine learning, como el método K-vecinos, método jerárquico y se evaluaron por medio del método del codo (KMeans) y el modelo silhouette; se realizó la comparación del mejor algoritmo, teniendo como ganador el de silhouette con valor de 0.69 para la asignación de 4 clústeres; teniendo en cuenta que el puntaje de silhouette se encuentra -1 y 1, siendo 1 el mejor valor, por lo tanto, entre más cercano sea el valor de la evaluación a 1, significa que los clusters están mejor segmentados. En conclusión, este trabajo proporciona un análisis detallado de la aplicación de machine learning para la retención de clientes, con el objetivo de ofrecer recomendaciones específicas que generen valor para la empresa Air Products Colombia.

Description

Keywords

Cluster, Machine Learning, Silhouette, K-means, Modelo supervisado

Citation

responsive footer design codepen