Этот код загружвет книги с обложки по id в заданном вами промежутке страниц.
Для установки нужно скопировать репозитории, открыть командную строку, перейти в папку с вашим репозиторием, установить зависимости командой:
pip install -r requirements.txt
В репозитории есть 2 файла это parse_tululu_category.py.py и parse_tululu_category.py
У кода есть 2 аргумента это --start_page и --end_page.
--start_page принимает страницу первой книги для загрузки (по умоллчанию 1).
--end_page принимает страницу поседней книги для загрузки (по умоллчанию 30).
Для запуска скрипта нужно перейти в репозиторий с проектом прописать команду:
py parse_tululu.py --start_page {начальное id} --end_page {конечное id}
у вас создадутся 2 папки books(c книгами) и image (с обложками книг)
У кода есть 2 аргумента это --start_page и --end_page.
--start_page и --end_page принимает номера первой и поседей (соответственно) страницы категории книг
которые вы хотите загрузить (по у молчания от первой до последней существующей)
--skip_txt и --skip_img при наличии этих аргуменов не скачивается текс или обложка книги соответственно
--category_id принимает id категории (по умолчанию 55)
--dest_folder принимает путь до места дя загрузки (по умолчанию корневая папка проекта)
Для запуска скрипта нужно перейти в репозиторий с проектом прописать команду:
py parse_tululu_category.py --start_page {id первой страницы} --end_page {id поседней страницы} --category_id {id котегории} --dest_folder {путь для загрузки} [--skip_img] [--skip_txt]
у вас создадутся 2 папки books(c книгами) и image (с обложками книг) в папке указанной в аргументе --dest_folder