Aprende a predecir la fuga de clientes con Data Mining y Machine Learning

 

 

Uno de los principales activos para las compañías aseguradoras son sus clientes, es por eso que la mayoría de sus esfuerzos repercuten sobre ellos, siendo las principales actividades la captación y la retención de los mismos. Mientras que la captación se relaciona con nuevos cliente,  la retención incide en la fidelización y la identificación de posibles fugas.

La fuga de clientes en las compañías aseguradoras es un fenómeno que actualmente se intenta paliar, apostando en muchos casos por técnicas de Data Mining y de Machine Learning que ayudan a reducir los esfuerzos comerciales de las compañías aseguradoras y a mejorar la relación con sus clientes, detectando de forma anticipada los problemas reportados sobre sus servicios.

¿Y de qué hablamos cuando nos referimos a Data Mining y Machine Learning?

Aunque es difícil establecer la barrera que nos permita diferenciar claramente entre los conceptos de Machine Learning y Data Mining, podemos comenzar con que cada una de ellas tiene objetivos diferentes. Por un lado el Data Mining tiene como finalidad descubrir patrones desconocidos con una función sumamente exploratoria, mientras que el Machine Learning se centra en la predicción de patrones conocidos previamente. De un modo más formal, podemos definir ambos conceptos como:

Machine Learning (ML) o aprendizaje automático es una disciplina de la inteligencia artificial (IA) que crea sistemas que aprenden de forma automática. ¿Y qué aprende? Aprende a identificar patrones, predecir comportamientos, clasificar datos y mejorar de forma autónoma.

Data Mining o minería de datos se refiere al conjunto de técnicas automatizadas que permiten explorar y extraer conocimiento oculto en grandes volúmenes de datos, lo que hace posible descubrir patrones de comportamientos y relaciones en dichos datos. Con este fin hace uso de prácticas estadísticas y en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.

Dentro de la gestión de las relaciones con clientes, una de las tareas más importantes es la segmentación de consumidores que se define como el proceso de identificar y agrupar a los clientes con características o requisitos similares con el propósito de mejorar el servicio e identificar a los distintos tipos de usuarios.

Para realizar esta segmentación existe una gran variedad de métodos, entre los que destacan los métodos de clustering basados en técnicas de aprendizaje no supervisado con capacidad para identificar patrones con características similares a partir de datos ”crudos”, es decir con datos no tipificados o clasificados previamente.

Otro de los grandes grupos de métodos aplicados a la segmentación de clientes son aquellos basados en técnicas de aprendizaje supervisada, y entre los modelos de predicción más populares se encuentran:

  • Los Árboles de Decisión, que representan una serie de opciones creadas a partir de reglas que clasifican el conjunto de datos.

  • Redes Neuronales Supervisadas, se trata de modelos matemáticos basados en el funcionamiento de las redes neuronales biológicas que procesan la información.

Muchos estudios relacionados con la identificación de patrones de fuga realizan comparativas de rendimiento que ofrecen estas técnicas supervisadas en la consecución de esta tarea y algunos trabajos interesantes profundizan en los siguientes tópicos:

  • Evaluación del uso de técnicas como los árboles de decisión y redes neuronales.

  • Comparación el rendimiento predictivo del modelo generado con Support Vector Machine (SVM) con la eficiencia de las técnicas de regresión logística y Random Forest.

  • Combinación de técnicas de minería de datos para obtener una clasificación de clientes, y la utilización de métodos estadísticos, clustering, árboles de decisión y redes neuronales para demostrar los beneficios de la minería de datos en la industria de los seguros.

Si bien todas estas técnicas se caracterizan por su gran capacidad para extraer conocimiento a partir de grandes volúmenes de datos, al tratarse de métodos supervisados tienen como requisito que los datos de partida posean entre las características de los clientes: el conocimiento previo del segmento al que pertenece dicho cliente o del valor que se desea estimar, y es aquí donde entran en juego las técnicas no supervisadas, dado que estas técnicas no poseen dicha restricción.

Cuando abordamos la problemática del análisis de la fuga de clientes en el sector asegurador debemos determinar las técnicas más adecuadas para resolver la predicción de fuga, para ello tenemos que tener en cuenta algunos aspectos desde el enfoque analítico de la minería de datos, como son: la naturaleza de los datos, el conocimiento previo de los tipos de clientes, la cantidad de variables o características de los clientes que se poseen para realizar el estudio.

Tenemos entonces que dada la variedad de métodos que pueden aplicarse en el proceso de minería de datos (tanto del ámbito de la inteligencia artificial como de la estadística) y teniendo en cuenta la naturaleza de los datos de clientes a utilizar en el proceso de análisis (con un número de variables medio-alto y sin conocimiento previo de las tipologías de clientes existentes), las técnicas a utilizar van desde: la minería de datos visuales, las redes no supervisadas, los árboles de decisión, las técnicas de regresión o las redes neuronales supervisadas.

Utilizando alguna de las técnicas anteriores y siempre teniendo en cuenta la que más se adecue al caso que se pretende abordar, y con los datos que las aseguradoras poseen sobre el históricos de sus clientes se construye el modelo de predicción de fuga. Dicho modelo es una herramienta que nos permitirá clasificar a los clientes con mayor tendencia de fuga, una vez clasificados se facilitará la realización de tareas como:

  • Mantener clientes con pretensión de fuga.

  • Focalizar los recursos en los clientes que necesitan mayores esfuerzos de retención.

  • Mejorar y fortalecer las relaciones con sus clientes.

Como punto final, una analogía entre instituciones financieras y compañías aseguradoras, desde el punto de vista de su preocupación y los esfuerzos que realizan para retener a sus clientes y aumentar su cartera, el BCE (Banco Central Europeo) realizó un estudio en el que se muestra los beneficios generados con el uso de estos modelos de predicción de fuga, ya que disminuye la tasa de clientes que salen de la compañía, lo que demuestra los beneficios y claro aporte de valor de los modelos de predicción de fuga para las compañías aseguradoras.

Ingeniera en Informática de Sistemas y entusiasta de las tecnologías asociadas al campo de Machine Learning y Deep Learning. Mi vida laboral esta ligada al área de ingeniería de proyectos, con una amplia experiencia en el sector seguros, aunque he trabajado con otros sectores como sanidad, defensa y marketing, entre otros. Actualmente, trabajo como Project Leader en Future Space