El Sistema de Análisis de Datos Académicos es una aplicación Python desarrollada para la Universidad Tecnológica de Panamá que permite realizar análisis integral de datos de rendimiento estudiantil. El sistema proporciona capacidades avanzadas de procesamiento de datos, análisis estadístico, visualización y generación de reportes en formato APA.
- ✅ Carga y validación de datos - Soporte para archivos CSV y Excel
- 🧹 Limpieza y preprocesamiento - Manejo automático de valores faltantes y estandarización
- 📊 Análisis estadístico avanzado - Cálculos descriptivos y inferenciales
- 📈 Visualizaciones interactivas - Gráficos con Matplotlib y Seaborn
- 📑 Reportes profesionales - Generación automática de reportes PDF estilo APA
⚠️ Análisis de riesgos - Identificación de estudiantes en riesgo académico- 🔍 Análisis demográfico - Segmentación por diferentes variables
- 🎯 Prioridades de intervención - Recomendaciones basadas en datos
programming-iii/
├── main.py # Archivo principal del sistema
├── config.py # Configuración global
├── requirements.txt # Dependencias del proyecto
├── README.md # Este archivo
├── ARCHITECTURE.md # Documentación de arquitectura
├── xAPI-Edu-Data.csv # Dataset de ejemplo
├── src/
│ ├── data/ # Módulos de datos
│ │ ├── data_loader.py # Carga de datos
│ │ └── data_cleaner.py # Limpieza de datos
│ ├── analysis/ # Módulos de análisis
│ │ ├── statistics.py # Análisis estadístico
│ │ ├── grouping.py # Análisis por grupos
│ │ └── risk_analysis.py # Análisis de riesgos
│ ├── visualization/ # Módulos de visualización
│ │ └── charts.py # Generación de gráficos
│ ├── reports/ # Módulos de reportes
│ │ └── apa_report.py # Generación de reportes APA con gráficas
│ └── utils/ # Utilidades
│ └── helpers.py # Funciones auxiliares
└── output/ # Archivos de salida
├── charts/ # Gráficos generados
└── reports/ # Reportes generados
- Python 3.12 o superior
- pip o uv (gestor de paquetes)
# Clonar el repositorio
git clone <url-del-repositorio>
cd programming-iii
# Instalar uv si no lo tienes
pip install uv
# Crear entorno virtual e instalar dependencias
uv sync# Clonar el repositorio
git clone <url-del-repositorio>
cd programming-iii
# Crear entorno virtual
python -m venv venv
source venv/bin/activate # Linux/Mac
# o
venv\Scripts\activate # Windows
# Instalar dependencias
pip install -r requirements.txtEl archivo config.py contiene todas las configuraciones importantes:
# Rutas de archivos
DATA_FILE_PATH = "1SG131 SEM P3 Analisis Reg Acad Estudiantil(P3 Proy Sem datos acad).csv"
CSV_SEPARATOR = ";" # Separador del nuevo archivo CSV
OUTPUT_DIR = "output"
# Umbrales de rendimiento
MINIMUM_PASSING_GRADE = 60
EXCELLENT_GRADE = 85
RISK_ABSENCE_THRESHOLD = 75 # Menos de 75% de asistencia = en riesgo
# Configuración de reportes
REPORT_TITLE = "Reporte de Análisis de Rendimiento Académico"
REPORT_AUTHOR = "Equipo de Programming III"
INSTITUTION = "Universidad Tecnológica de Panamá"python main.pyfrom main import run_complete_analysis
# Ejecutar análisis completo
results = run_complete_analysis(
data_file="mi_archivo.csv",
generate_charts=True,
generate_report=True,
verbose=True
)
# Verificar resultados
if results['success']:
print(f"Análisis completado exitosamente!")
print(f"Reportes generados en: {results['report_file']}")- Medidas de tendencia central (media, mediana, moda)
- Medidas de dispersión (desviación estándar, varianza)
- Distribuciones de frecuencia
- Análisis de correlación
- Rendimiento por género
- Análisis por nacionalidad
- Comparaciones por nivel académico
- Segmentación por semestre
- Métricas de engagement
- Interacciones en clase
- Uso de recursos educativos
- Participación en discusiones
- Identificación de estudiantes en riesgo
- Análisis de ausentismo
- Patrones de bajo rendimiento
- Prioridades de intervención
El sistema genera automáticamente los siguientes tipos de gráficos:
- Distribución de calificaciones - Histogramas y gráficos de barras
- Análisis de correlación - Heatmaps y matrices de correlación
- Comparaciones demográficas - Boxplots y gráficos de violin
- Tendencias temporales - Gráficos de líneas y series temporales
- Análisis de riesgos - Gráficos de dispersión y clasificación
- Análisis de regresión curvilínea - 5 modelos comparativos (lineal, cuadrática, cúbica, logarítmica, exponencial)
- Selección automática del mejor modelo basada en coeficiente R²
- Visualización comparativa de múltiples modelos de regresión
- Integración completa en reportes PDF con espacio para análisis
- Gráficas profesionales con títulos y descripciones en español
Los reportes generados incluyen:
- Resumen ejecutivo - Hallazgos principales
- Análisis estadístico detallado - Métricas y pruebas
- Visualizaciones integradas - Gráficos incrustados
- Recomendaciones - Sugerencias basadas en datos
- Formato APA - Estilo académico profesional
El sistema está configurado para trabajar con el archivo CSV de análisis académico de la UTP:
ID_Estudiante;Carrera;Semestre;Materia;Grupo;Docente;Calificacion_Final;Porcentaje_Asistencia;Cumplimiento_Actividades- ID_Estudiante: Identificador único del estudiante
- Carrera: Carrera universitaria del estudiante
- Semestre: Semestre académico actual
- Materia: Nombre de la materia
- Grupo: Grupo de clase
- Docente: Nombre del docente
- Calificacion_Final: Calificación final del estudiante
- Porcentaje_Asistencia: Porcentaje de asistencia a clases
- Cumplimiento_Actividades: Porcentaje de cumplimiento de actividades
El sistema incluye mapeo automático de columnas para compatibilidad con diferentes formatos de datos y soporte para separadores CSV personalizados.
Para contribuir al proyecto:
- Fork el repositorio
- Crea una rama para tu feature (
git checkout -b feature/nueva-funcionalidad) - Commit tus cambios (
git commit -am 'Agregar nueva funcionalidad') - Push a la rama (
git push origin feature/nueva-funcionalidad) - Crea un Pull Request
Este proyecto está bajo la Licencia MIT - ver el archivo LICENSE para más detalles.
- Programming III Team - Universidad Tecnológica de Panamá
- Institución: Universidad Tecnológica de Panamá
Para soporte técnico o preguntas:
- Email: [email protected]
- Documentación: ARCHITECTURE.md
- Issues: GitHub Issues
- 5 modelos de regresión comparativos (lineal, cuadrática, cúbica, logarítmica, exponencial)
- Selección automática del mejor modelo basado en R²
- Visualización avanzada con comparación de modelos
- Integración completa en reportes PDF
- Soporte para separador CSV ';' (nuevo archivo UTP)
- Mapeo automático de columnas para compatibilidad
- Configuración actualizada para datos académicos panameños
- Limpieza de datos mejorada con nuevas variables
- 5 gráficas integradas en cada reporte PDF
- Espacio dedicado para análisis de visualizaciones
- Formato profesional con títulos en español
- Generación automática de reportes con gráficas
- Eliminación de código redundante (677 líneas menos)
- Archivos duplicados removidos (781KB de archivos temporales)
- Código más mantenible y eficiente
- Funcionalidad preservada al 100%
- Los archivos Excel con caracteres especiales pueden causar errores de codificación
- El sistema requiere al menos 10 filas de datos para análisis significativo
- Algunos gráficos pueden tardar en generarse con datasets grandes (>10,000 filas)
- Soporte para bases de datos SQL
- Interfaz web con Flask/Django
- Análisis predictivo con machine learning
- Exportación a más formatos (Word, PowerPoint)
- Integración con APIs de sistemas educativos
- Análisis en tiempo real
Desarrollado con ❤️ por el equipo de Programming III de la Universidad Tecnológica de Panamá