Skip to content

Latest commit

 

History

History
32 lines (21 loc) · 1.06 KB

File metadata and controls

32 lines (21 loc) · 1.06 KB

PDF references extractor

Este proyecto está orientado a extraer referencias bilbiográficas de archivos PDF.

Funcionamiento

El archivo main.py ejecuta una búsqueda de palabras, ingresadas por el usuario, en un conjunto de PDFs ubicados en una carpeta.

Ejemplo de ejecución:

  • main.py Referencias

Donde 'Referencias' es la carpeta que tiene los PDFs donde se buscarán las palabras clave.

Interfaz gráfica

La interfaz gráfica se puede usar ejecutando el archivo mainGui.py.

  • python mainGui.py

OCR

Requisitos de funcionamiento

Lista de tareas

  • Almacenar los archivos txt del OCR, página por página, de un libro ya buscado para no tener que usar el OCR una y otra vez, ahorrando tiempo.