P.U.L.S.E. - Pipeline Único de Leitura e Segmentação Epidemiológica 🩺

📋 Sobre o Projeto

O P.U.L.S.E. é uma solução de RAG (Retrieval-Augmented Generation) Local desenvolvida especificamente para o nicho de Saúde Pública. O sistema permite a ingestão, vetorização e consulta inteligente de documentos clínicos e epidemiológicos com total privacidade e segurança.

🎯 O Problema de Negócio

No setor de saúde, a precisão e a privacidade são inegociáveis. Profissionais enfrentam desafios significativos:

❌ Dificuldade em consultar diretrizes clínicas de centenas de páginas em tempo real
❌ Dependência de soluções cloud que comprometem a privacidade dos dados
❌ Falta de ferramentas que combinem IA com segurança local

O P.U.L.S.E. resolve esses problemas oferecendo uma solução de IA local, segura e eficiente.

🧠 Arquitetura da Solução

A aplicação segue uma adaptação da Medallion Architecture para fluxos de IA:

Camada	Etapa	Descrição
Bronze	Ingestão	Monitoramento automático de diretórios para novos PDFs e CSVs
Silver	Processamento	Limpeza de dados com Pandas e segmentação semântica (Chunking) com LangChain
Gold	Vetorização	Geração de embeddings via HuggingFace e persistência em banco vetorial local ChromaDB
API	Recuperação & Resposta	Pipeline RAG orquestrado pelo LangChain consultando o modelo Phi-3 (Microsoft) via Ollama

🛠️ Stack Tecnológica

Engenharia de Dados

Python 3.x
Pandas
Pathlib
PDFPlumber

Inteligência Artificial

LangChain (Chains & Retrieval)
HuggingFace Embeddings
Ollama (Llama 3 / Phi-3)

Banco de Dados

ChromaDB (Vector Store Local)

Interface & Frontend

Streamlit com CSS customizado (UI estilo Claude)

🚀 Guia de Instalação

Pré-requisitos

Python 3.8+
Git

Passo 1: Clonar o Repositório

git clone https://github.com/seu-usuario/P.U.L.S.E.git

Passo 2: Criar e Ativar Ambiente Virtual

python -m venv venv

# Windows
.\venv\Scripts\activate

# macOS/Linux
source venv/bin/activate

Passo 3: Instalar Dependências

pip install -r requirements.txt

Passo 4: Configurar o Motor de IA (Ollama)

Baixe o Ollama em ollama.com
No terminal, execute:

ollama run phi3

Passo 5: Executar o Pipeline

Coloque seus PDFs em data/raw/
Execute o pipeline principal:

python main_pipeline.py

Inicie a aplicação Streamlit:

python -m streamlit run src/app/chat.py

A aplicação estará disponível em http://localhost:8501

📁 Estrutura do Projeto

P.U.L.S.E/
├── data/
│   ├── raw/              # PDFs e CSVs para ingestão
│   ├── processed/        # Dados processados
│   └── vectors/          # Banco de vetores (ChromaDB)
├── src/
│   ├── pipeline/         # Pipeline de ETL
│   ├── rag/              # Lógica RAG
│   └── app/              # Interface Streamlit
├── main_pipeline.py      # Script principal
├── requirements.txt      # Dependências
└── README.md

💡 Como Usar

Adicionar Documentos: Coloque PDFs na pasta data/raw/
Processar: Execute python main_pipeline.py
Consultar: Use a interface Streamlit para fazer perguntas
Obter Respostas: O sistema retorna respostas baseadas nos seus documentos

🔒 Segurança & Privacidade

✅ Toda a IA roda localmente (sem envio de dados à nuvem)
✅ Dados armazenados em banco de dados vetorial local
✅ Compatível com LGPD e regulamentações de saúde

👤 Autor

Nicolas - @NicolasDev-web

🤝 Contribuições

Contribuições são bem-vindas! Sinta-se livre para abrir issues e pull requests.

Desenvolvido com ❤️ para Saúde Pública

Fontes e Créditos

O chatbot foi desenvolvido com base no documento "Protocolo Clínico e Diretrizes Terapêuticas para Atenção Integral às Pessoas com Infecções Sexualmente Transmissíveis (IST)". Este documento orienta a prática clínica e oferece diretrizes terapêuticas essenciais para o tratamento de ISTs.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
rag_saude_mvp		rag_saude_mvp
.gitignore		.gitignore
README.md		README.md
run_pipeline.py		run_pipeline.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

P.U.L.S.E. - Pipeline Único de Leitura e Segmentação Epidemiológica 🩺

📋 Sobre o Projeto

🎯 O Problema de Negócio

🧠 Arquitetura da Solução

🛠️ Stack Tecnológica

Engenharia de Dados

Inteligência Artificial

Banco de Dados

Interface & Frontend

🚀 Guia de Instalação

Pré-requisitos

Passo 1: Clonar o Repositório

Passo 2: Criar e Ativar Ambiente Virtual

Passo 3: Instalar Dependências

Passo 4: Configurar o Motor de IA (Ollama)

Passo 5: Executar o Pipeline

📁 Estrutura do Projeto

💡 Como Usar

🔒 Segurança & Privacidade

👤 Autor

🤝 Contribuições

Fontes e Créditos

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

P.U.L.S.E. - Pipeline Único de Leitura e Segmentação Epidemiológica 🩺

📋 Sobre o Projeto

🎯 O Problema de Negócio

🧠 Arquitetura da Solução

🛠️ Stack Tecnológica

Engenharia de Dados

Inteligência Artificial

Banco de Dados

Interface & Frontend

🚀 Guia de Instalação

Pré-requisitos

Passo 1: Clonar o Repositório

Passo 2: Criar e Ativar Ambiente Virtual

Passo 3: Instalar Dependências

Passo 4: Configurar o Motor de IA (Ollama)

Passo 5: Executar o Pipeline

📁 Estrutura do Projeto

💡 Como Usar

🔒 Segurança & Privacidade

👤 Autor

🤝 Contribuições

Fontes e Créditos

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages