MauroBot is a chatbot built with Streamlit and LangChain, designed to answer questions related to the Systems Engineering program at Universidad del Valle, Tuluá campus. It uses natural language processing and information retrieval based on official university documents.
- Python 3.10
- Git
- pipenv (optional) or virtualenv
- Tesseract OCR
- Modern web browser
git clone [email protected]:JuanArango30/Chatbot-RAG-TG.git
cd Chatbot-RAG-TGpip install pipenv
pipenv install
pipenv shellpython -m venv .venv
source .venv/bin/activate # On Linux/Mac
.venv\Scripts\activate # On Windows
pip install -r requirements.txt- Install the Spanish language model:
python -m spacy download es_core_news_sm- (Optional) Validate installation:
python -m spacy validate- Download from: https://github.com/tesseract-ocr/tesseract
- Install it and copy the installation path (e.g.:
C:\Program Files\Tesseract-OCR\tesseract.exe)
TESSERACT_PATH=C:\Program Files\Tesseract-OCR\tesseract.exesudo apt update && sudo apt install tesseract-ocrbrew install tesseractCreate a .env file in the root directory of the project with the following content:
API_KEY=your_openai_api_keyOnce dependencies are installed and variables are configured:
streamlit run main.pyThe app will automatically open in your browser (usually at http://localhost:8501).
- You can add new documents to the
data/pdfs/folder. They will be processed automatically. - The application can run on Windows, Linux, or macOS without code changes.
MauroBot es un chatbot construido con Streamlit y LangChain, diseñado para responder preguntas relacionadas con el programa de Ingeniería de Sistemas de la Universidad del Valle, Sede Tuluá. Utiliza procesamiento de lenguaje natural y recuperación de información basada en documentos oficiales de la universidad.
- Python 3.10
- Git
- pipenv (opcional) o virtualenv
- Tesseract OCR
- Navegador web moderno
git clone https://github.com/tu-usuario/maurobot-univalle.git
cd maurobot-univalle####pipenv
pip install pipenv
pipenv install
pipenv shell####venv
python -m venv .venv
source .venv/bin/activate # En Linux/Mac
.venv\Scripts\activate # En Windows
pip install -r requirements.txt- Instala el modelo de español:
python -m spacy download es_core_news_sm- (Opcional) Verifica que esté instalado:
python -m spacy validate- Descarga desde: https://github.com/tesseract-ocr/tesseract
- Instálalo y copia la ruta de instalación (por ejemplo:
C:\Program Files\Tesseract-OCR\tesseract.exe)
TESSERACT_PATH=C:\Program Files\Tesseract-OCR\tesseract.exesudo apt update && sudo apt install tesseract-ocrbrew install tesseractCrea un archivo .env en la raíz del proyecto con el siguiente contenido:
API_KEY=tu_api_key_de_openaiUna vez instaladas las dependencias y configuradas las variables:
streamlit run main.pyLa app se abrirá automáticamente en tu navegador (generalmente en http://localhost:8501).
- Puedes cargar nuevos documentos en la carpeta
data/pdfs/. Serán procesados automáticamente. - La aplicación puede ejecutarse en Windows, Linux o Mac sin cambios en el código.