Charla preparada para Big Data Week Santiago 2019.
Cristian Farías e Ignacio Soto Zamorano
El objetivo de este workshop es implementar métodos de filtro colaborativo para generar recomendaciones. En específico, se hablará del método Alternating Least Squares como una solución al problema de matrices de rating dispersas, así como su implementación en PySpark.
La instalación de PySpark dependerá del tipo de sistema operativo que utilicen. En el documento Formas de Instalación de PySpark encontrarán un paso a paso. Dentro de este documento también encontrarán un link a un Google Colaboratory notebook en caso de fallar con la instalación local. Este notebook tendrá todas las instalaciones escritas, listas para ejecutar y configurar el ambiente de trabajo.
- Acceso rápido al notebook en Google Colab: https://colab.research.google.com/drive/1pfg1y1o32LRFFKBmsgcWYcYd8eC69IFM
La presentación se encuentra en formato printer friendly en el siguiente link: Presentación.
El notebook con el taller desarrollado se encuentra Aquí
- September, 12th. Init repo. Add README
- October, 2th. Add Install Guides for Windows and MacOSX. Add helpers file. Add
jsonandcsvfiles. Modify README to reflect latest changes. Add slides.