Skip to content

danielTeniente/pdfSearch

Repository files navigation

PDF references extractor

Este proyecto está orientado a extraer referencias bilbiográficas de archivos PDF.

Funcionamiento

El archivo main.py ejecuta una búsqueda de palabras, ingresadas por el usuario, en un conjunto de PDFs ubicados en una carpeta.

Ejemplo de ejecución:

  • main.py Referencias

Donde 'Referencias' es la carpeta que tiene los PDFs donde se buscarán las palabras clave.

Interfaz gráfica

La interfaz gráfica se puede usar ejecutando el archivo mainGui.py.

  • python mainGui.py

OCR

Requisitos de funcionamiento

Lista de tareas

  • Almacenar los archivos txt del OCR, página por página, de un libro ya buscado para no tener que usar el OCR una y otra vez, ahorrando tiempo.

About

Extract text from PDFs to look for key words.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages