Recomentation-Movies-Model

Introducción

Este proyecto se enfoca en la creación de un modelo de recomendación de películas usando un dataset ya procesado y limpio. 😄

Es importante mencionar que la implementación del modelo se hace a través de una tecnología de código abierto, que permite que otras personas puedan reproducir y mejorar el modelo en el futuro. Además, el modelo puede ser extendido a otros problemas de recomendación, como el de música o libros, ya que la metodología es muy generalizable. 😃

Este proyecto de machine learning se encuentra en la intersección de las áreas de big data, aprendizaje automático y análisis de datos. En particular, usa técnicas de preprocesado de datos, modelado, evaluación y visualización de resultados, que son temas clave en estas áreas.

A continuación una breve explicación paso a paso de lo que se hizo para llegar al producto final (Modelo de recomendación ML):

ETL

En primera instancia extraemos los dataset para trabajar en ellos, hacemos transformaciones como desanidado de diccionarios y listas, unas columnas con valores nulos se reemplazaron por 0 o fueron eliminadas, eliminamos columnas innecesarias y creamos algunas columnas según lo requerido.

API

Para el desarrollo de la API: Se propone disponibilizar los datos usando el framework FastAPI.

Se hicieron las siguientes consultas:

---->idioma de la película (Idioma): Se ingresa un idioma, ejemplo: 'en' y te devuelve la cantidad de películas producidas en ese idioma.

---->duración de la película (Pelicula): Se ingresa una pelicula ejemplo: 'Toy Story'. Debe devolver la duracion y el año.

---->franquicia (Franquicia): Se ingresa la franquicia, por ejemplo: 'Toy Story Collection' retornando la cantidad de peliculas, ganancia total y promedio

---->pais( Pais): Se ingresa un país por ejemplo: 'United States of America', retornando la cantidad de peliculas producidas en el mismo.

---->productoras(Productora): Se ingresa la productora, por ejemplo: 'Pixar Animation Studios' entregandote el revunue total y la cantidad de peliculas que realizo.

---->director de la película (nombre_director): Se ingresa el nombre de un director que se encuentre dentro de un dataset, por ejemplo: 'John Lasseter' debiendo devolver el éxito del mismo medido a través del retorno. Además, deberá devolver el nombre de cada película con la fecha de lanzamiento, retorno individual, costo y ganancia de la misma, en formato lista.

DEPLOY

EDA

En el analisis explotario pudimos obtener algunos datos bastante interesantes y pudimos observar relaciones entre columnas

Name		Name	Last commit message	Last commit date
Latest commit History 68 Commits
EDA.ipynb		EDA.ipynb
PI1_ETL.ipynb		PI1_ETL.ipynb
README.md		README.md
df_f.csv		df_f.csv
df_top.csv		df_top.csv
main.py		main.py
matriz.csv		matriz.csv
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Recomentation-Movies-Model

Introducción

ETL

API

DEPLOY

EDA

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Recomentation-Movies-Model

Introducción

ETL

API

DEPLOY

EDA

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages