Skip to content

bencso/pdf_to_html

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

PDF to HTML 📄➡️🌐

PDF to HTML converter - Tesztprojekt

🎯 Projekt célja

Ez egy tesztprojekt, amely PDF fájlokat alakít át HTML formátumba, megtartva a formázást, bekezdéseket és szövegstílusokat. A projekt pdf.js könyvtárat használ a PDF feldolgozásához és intelligens szövegfelismerést implementál.

✨ Funkciók

  • 📄 PDF szöveg kinyerés - Teljes szövegtartalom feldolgozása
  • 🎨 Formázás megőrzése - Bold, italic, underline stílusok
  • ↔️ Szöveg igazítás - Bal, jobb, középre és justify támogatás
  • 📝 Címsorok - H1, H2, H3 automatikus generálás betűméret alapján
  • 🎯 Sortávolság elemzés - Átlagos sortávolság számítás

🛠️ Technológiák

  • Node.js - JavaScript futtatókörnyezet
  • pdf.js (pdfjs-dist) - Mozilla PDF feldolgozó könyvtár
  • ES6 modules - Modern JavaScript

🚀 Használat

# Függőségek telepítése
npm install pdfjs-dist

node index.js

A sample.pdf fájl a sample.html-é alakul, megtartva a formázást és bekezdéseket.

💭 Miért készült?

Ez egy teszt/kísérleti projekt volt, hogy megismerjem a PDF szövegfeldolgozás kihívásait és a pdf.js könyvtár működését.

🎓 Tanulási célok

  • PDF dokumentumok feldolgozása Javascript segítségével
  • Bekezdés és szövegszerkezet felismerés
  • JavaScript ES6 modulok használata
  • Algoritmusok fejlesztése szövegfeldolgozáshoz

📄 Licensz

MIT License - Szabadon használható és módosítható


Státusz: ✅ Befejezett


⭐ Ha tetszik a projekt, örülök egy csillagnak!

About

PDF HTML konverter pdf.js használatával

Topics

Resources

Stars

Watchers

Forks

Contributors