Este trabajo, presenta un script del algoritmo utilizado para la segmentación de clientes con el algoritmo RFM bajo la modalidad de programación paralelizada Spark. Este trabajo fue realizado cómo trabajo final para la la materia de Mineria de datos para grandes volúmenes de información.
En el presente repositorio encontraran:
- Algoritmo_proyecto_final.ipynb: Notebook python utilizando Spark con el algoritmo para la segmentación de los clientes RFM.
- PROYECTO_FINAL.pdf: Informe escrito donde se describe el procedimiento que se llevo acabo en la elaboración de la segmentación
- Anexo 1: Proyecto_Script_Cluster.pdf: Explicación del paso a paso en los métodos de clusterización que aporta al estudio inicial
- Anexo 2: Gantt.xlsx: Matriz de Gantt, planificador del proyecto.
- Anexo 3: Proyecto_Script_Cluster.Rmd: Script en Rmarkdown en donde se realiza los métodos de Clúster.
Realizado por Julian Castelblanco Benitez, Cristian Muñoz Mora