Skip to content

tsunonoaru/habr_parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

Парсер новостей с хабра( Пример скрипта для kwork)

Как установить

Скачайте репозиторий к себе на компьютер с файлами parser.py, requirements.txt Python c версией 3.12 должен быть уже установлен. Затем используйте pip (или pip3, есть конфликт с Python2) для установки зависимостей:

pip install -r requirements.txt

Запустите скрипт parser.py если вы делаете это в командной строке, то из папки где сохранены файлы напишите такую команду

python parser.py

Если все было сделано правильно вы увидите просьбу вписать количество страниц для парсинга

Сколько страниц спарсить? Введите число:

После этого вы увидите статус бар о том насколько процентов работа выполнена, также вы можете принудительно остановить работу парсинга нажав hot key ctrl + c после этого в файл сохраняися те данные, которые успели распарситься

Снимок

После завершения работы в вашей папке появится файл с названием habr_all_news.csv в этом файле все данные с сайта habr

Снимок

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages