Antigua bandera del Condado de King y ubicación dentro del estado de Washington.
Este proyecto se enmarca dentro del Bootcamp de Análisis de Datos impartido por la escuela IRONHACK. En esta ocasión, el Dataframe nos hablará sobre el mercado inmobiliario en el condado de King en EEUU entre mediados del 2014 y 2015 y las características de las viviendas que fueron vendida.
Es interesante saber que el condado de King se encuentra en el estado estadounidense de Washington, es decir la costa Oeste. Su población según el censo del año 2020 era de 2,269,675 y curiosamente se ha visto un leve descenso de la población. Por población el condado de King es el mayor del estado de Washington, y hace el número 14 de los más poblados de todos los Estados Unidos. Es uno de los más avanzados condados en el ámbito educativo de toda la nación y aproximadamente la mitad de su población posee un título universitario.
La sede de condado es la ciudad de Seattle, que también es la mayor ciudad del estado de Washington. Cerca de dos terceras partes de la población habita en los alrededores de la ciudad. El condado de King se encuentra también en el ranking de los 100 condados con mayores ingresos de los Estados Unidos de América.
Aunque se vio afectada por la Gran Recesión, Seattle ha conservado una economía comparativamente fuerte y se caracteriza por la creación de empresas, especialmente en construcción sustentable y tecnologías limpias. Lo cual se puede traducir en puestos de trabajo de gran cualificación que supone a la vez una subida considerable de los precios de la vivienda.
- Presentación de los objetivos:
- Comprender qué características impactan más significativamente el precio de la vivienda
- Explorar propiedades valoradas en $650 mil y más para obtener información más detallada
- Pre-work. El presente Dataframe está en bastantes buenas condiciones, no presentó ningún null o elementos parecidos. Se modificó solamente la columnas de año de renovación para simplicar un poco la presentación de los datos.
- Realización del EDA, donde se comprobó la distribución, los OUTLIERS, las correlaciones y la multicolinealidad de algunos elementos.
- Procesamiento de los datos.
- X-y Split
- Creación de modelos de MACHINE LEARNING: se aplicaron los modelos de Regresión Lineal, Ridge, Lasso, Knn, XGBoots y Decision Tree.
- Conclusiones:
- Objetivo 1: con los datos obtenidos, llegamos a la conclusión que el tamaño de la vivienda y la tenencia de baños, son los elementos que más influyen en el precio de la vivienda.
- Objetivo 2:
- El precio de la vivienda está estrechamente vinculado a la ubicación por lo que si encontramos una vivienda en una zona concreta con outlier inferior podría ser una buena inversión. Y lo mismo pasaría para saber si una vivienda es cara en una zona concreta (a rasgos generales).
- Las dimensiones de la vivienda estan relacionadas con el Zip.code y sobre todo con el coste del mismo.
- Los años de renovación. Como norma general veremos que las casas renovadas hace poco tendrán un coste por encima de las que no tengan una renovación.
- JupyterLab
- Pandas: manipulación y análisis de datos
- Numpy: Matrices y funciones matemáticas.
- Matplotlib: Data visualization.
- Seaborn: Runs on top of matplotlib, HD data visualization.
- Sklearn: para procesos de Machine Learning
- Seattle: https://es.wikipedia.org/wiki/Seattle
- Condado de King: https://es.wikipedia.org/wiki/Condado_de_King_(Washington)
- Información inmobiliaria:
Soporte técnico
Librerías

