News scrapper

Scrap (swedish) news pages

Expexted stdout

<news title [<link>]
this is a title [https://omni.se/page/for/title]

how to

clone repo git clone <repo>

setup environment

python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

run python news_scrapper.py

example

$ python news_scrapper.py -h
usage: news_scrapper [-h] [--debug] {omni,nwt,dn} ...

Scrap news papper

optional arguments:
  -h, --help     show this help message and exit
  --debug        Enable debug

commands:
  {omni,nwt,dn}  sub-command
    omni         https://omni.se
    nwt          https://www.nwt.se/
    dn           https://www.dn.se/

example: sub-command

$ python news_scrapper.py omni -h
usage: news_scrapper omni [-h] [--section {tech,inrikes,utrikes}]

Scrap news from https://omni.se

optional arguments:
  -h, --help            show this help message and exit
  --section {tech,inrikes,utrikes}
                        sub-section

supported news pages

omni
nwt
dn

wish list

aftonbladet
expressen
other?

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.gitignore		.gitignore
README.md		README.md
dn.py		dn.py
news_scrapper.py		news_scrapper.py
nwt.py		nwt.py
omni.py		omni.py
parser.py		parser.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

News scrapper

how to

supported news pages

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

News scrapper

how to

supported news pages

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages