Skip to content

wysloow/librari_parser

Repository files navigation

Парсер книг с сайта tululu.org

Этот код загружвет книги с обложки по id в заданном вами промежутке страниц.

Как установить

Для установки нужно скопировать репозитории, открыть командную строку, перейти в папку с вашим репозиторием, установить зависимости командой:

pip install -r requirements.txt

Файлы

В репозитории есть 2 файла это parse_tululu_category.py.py и parse_tululu_category.py

parse_tululu.py

Аргументы

У кода есть 2 аргумента это --start_page и --end_page.

--start_page принимает страницу первой книги для загрузки (по умоллчанию 1).

--end_page принимает страницу поседней книги для загрузки (по умоллчанию 30).

Запуск

Для запуска скрипта нужно перейти в репозиторий с проектом прописать команду:

py parse_tululu.py --start_page {начальное id} --end_page {конечное id}

у вас создадутся 2 папки books(c книгами) и image (с обложками книг)

parse_tululu_category.py

Аргументы

У кода есть 2 аргумента это --start_page и --end_page.

--start_page и --end_page принимает номера первой и поседей (соответственно) страницы категории книг которые вы хотите загрузить (по у молчания от первой до последней существующей)

--skip_txt и --skip_img при наличии этих аргуменов не скачивается текс или обложка книги соответственно

--category_id принимает id категории (по умолчанию 55)

--dest_folder принимает путь до места дя загрузки (по умолчанию корневая папка проекта)

Запуск

Для запуска скрипта нужно перейти в репозиторий с проектом прописать команду:

py parse_tululu_category.py --start_page {id первой страницы} --end_page {id поседней страницы} --category_id {id котегории} --dest_folder {путь для загрузки}  [--skip_img] [--skip_txt]

у вас создадутся 2 папки books(c книгами) и image (с обложками книг) в папке указанной в аргументе --dest_folder

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages