Script Python para extrair informações de disciplinas da USP do sistema Júpiter Web.
pip install requests beautifulsoup4Abra scraper_disciplinas.py e edite a lista no início do arquivo:
SIGLAS_DISCIPLINAS = [
"ACH0021",
"ACH0041",
"ACH0141",
# Adicione suas disciplinas aqui
]python3 scraper_disciplinas.pyO script perguntará quais formatos você quer:
1- JSON2- Markdown3- TXT- Enter - todos os formatos
- Python 3.6+
- Bibliotecas:
requestsebeautifulsoup4
disciplinas_info.json- Dados estruturadosdisciplinas_info.md- Formato legíveldisciplinas_info.txt- Texto simples
Para cada disciplina:
- Nome e sigla
- Créditos e carga horária
- Ementa e objetivos
- Conteúdo programático
- Bibliografia
- Docentes responsáveis
$ python3 scraper_disciplinas.py
================================================================================
SCRAPER DE DISCIPLINAS - JÚPITER WEB USP
================================================================================
📋 Total de siglas a processar: 3
Siglas: ACH0021, ACH0041, ACH0141
Escolha os formatos (1-JSON, 2-MD, 3-TXT ou Enter para todos): 2
🔍 Iniciando scraping...
✅ 3 disciplinas processadas com sucesso!
📁 Arquivo gerado: disciplinas_info.mdErro de instalação:
pip3 install --user requests beautifulsoup4Python não encontrado:
- Instale de python.org
Lista vazia:
- Edite
SIGLAS_DISCIPLINASno arquivo .py
Desenvolvido para facilitar a coleta de informações acadêmicas da USP 🎓