PDF to HTML converter - Tesztprojekt
Ez egy tesztprojekt, amely PDF fájlokat alakít át HTML formátumba, megtartva a formázást, bekezdéseket és szövegstílusokat. A projekt pdf.js könyvtárat használ a PDF feldolgozásához és intelligens szövegfelismerést implementál.
- 📄 PDF szöveg kinyerés - Teljes szövegtartalom feldolgozása
- 🎨 Formázás megőrzése - Bold, italic, underline stílusok
↔️ Szöveg igazítás - Bal, jobb, középre és justify támogatás- 📝 Címsorok - H1, H2, H3 automatikus generálás betűméret alapján
- 🎯 Sortávolság elemzés - Átlagos sortávolság számítás
- Node.js - JavaScript futtatókörnyezet
- pdf.js (pdfjs-dist) - Mozilla PDF feldolgozó könyvtár
- ES6 modules - Modern JavaScript
# Függőségek telepítése
npm install pdfjs-dist
node index.jsA sample.pdf fájl a sample.html-é alakul, megtartva a formázást és bekezdéseket.
Ez egy teszt/kísérleti projekt volt, hogy megismerjem a PDF szövegfeldolgozás kihívásait és a pdf.js könyvtár működését.
- PDF dokumentumok feldolgozása Javascript segítségével
- Bekezdés és szövegszerkezet felismerés
- JavaScript ES6 modulok használata
- Algoritmusok fejlesztése szövegfeldolgozáshoz
MIT License - Szabadon használható és módosítható
Státusz: ✅ Befejezett
⭐ Ha tetszik a projekt, örülök egy csillagnak!