Skip to content

JuanArango30/Chatbot-RAG-TG

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

58 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📘 MauroBot Univalle

MauroBot is a chatbot built with Streamlit and LangChain, designed to answer questions related to the Systems Engineering program at Universidad del Valle, Tuluá campus. It uses natural language processing and information retrieval based on official university documents.


🚀 Requirements

  • Python 3.10
  • Git
  • pipenv (optional) or virtualenv
  • Tesseract OCR
  • Modern web browser

📦 Installation

1. Clone this repository

git clone [email protected]:JuanArango30/Chatbot-RAG-TG.git
cd Chatbot-RAG-TG

2. Create a virtual environment using pipenv or venv

pipenv

pip install pipenv
pipenv install
pipenv shell

venv

python -m venv .venv
source .venv/bin/activate      # On Linux/Mac
.venv\Scripts\activate         # On Windows
pip install -r requirements.txt

🔤 Setup spaCy

  1. Install the Spanish language model:
python -m spacy download es_core_news_sm
  1. (Optional) Validate installation:
python -m spacy validate

📷 Install Tesseract OCR

On Windows

TESSERACT_PATH=C:\Program Files\Tesseract-OCR\tesseract.exe

On Linux

sudo apt update && sudo apt install tesseract-ocr

On macOS

brew install tesseract

🔑 Set up environment variables

Create a .env file in the root directory of the project with the following content:

API_KEY=your_openai_api_key

▶️ Run the application

Once dependencies are installed and variables are configured:

streamlit run main.py

The app will automatically open in your browser (usually at http://localhost:8501).


📌 Additional notes

  • You can add new documents to the data/pdfs/ folder. They will be processed automatically.
  • The application can run on Windows, Linux, or macOS without code changes.

📘 MauroBot Univalle

MauroBot es un chatbot construido con Streamlit y LangChain, diseñado para responder preguntas relacionadas con el programa de Ingeniería de Sistemas de la Universidad del Valle, Sede Tuluá. Utiliza procesamiento de lenguaje natural y recuperación de información basada en documentos oficiales de la universidad.


🚀 Requisitos

  • Python 3.10
  • Git
  • pipenv (opcional) o virtualenv
  • Tesseract OCR
  • Navegador web moderno

📦 Instalación

1. Clona este repositorio

git clone https://github.com/tu-usuario/maurobot-univalle.git
cd maurobot-univalle

2. Crea un entorno virtual con alguna herramienta como pipenv o venv

####pipenv

pip install pipenv
pipenv install
pipenv shell

####venv

python -m venv .venv
source .venv/bin/activate      # En Linux/Mac
.venv\Scripts\activate         # En Windows
pip install -r requirements.txt

🔤 Configurar spaCy

  1. Instala el modelo de español:
python -m spacy download es_core_news_sm
  1. (Opcional) Verifica que esté instalado:
python -m spacy validate

📷 Instalar Tesseract OCR

En Windows

TESSERACT_PATH=C:\Program Files\Tesseract-OCR\tesseract.exe

En Linux

sudo apt update && sudo apt install tesseract-ocr

En MacOS

brew install tesseract

🔑 Configurar variables de entorno

Crea un archivo .env en la raíz del proyecto con el siguiente contenido:

API_KEY=tu_api_key_de_openai

▶️ Ejecutar la aplicación

Una vez instaladas las dependencias y configuradas las variables:

streamlit run main.py

La app se abrirá automáticamente en tu navegador (generalmente en http://localhost:8501).


📌 Notas adicionales

  • Puedes cargar nuevos documentos en la carpeta data/pdfs/. Serán procesados automáticamente.
  • La aplicación puede ejecutarse en Windows, Linux o Mac sin cambios en el código.

About

Chatbot for answering questions about the Systems Engineering program at Univalle Tuluá.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages