Skip to content

Latest commit

 

History

History

README.md

Todo List

  • 恰当的异常处理
  • 是否正文问题
  • 防重复分析
  • 爬虫进度
  • 自测
  • 加注释
  • 解决任务不启动问题

可能实现的功能

  • 数据库连接池
  • 杀死僵死进程

example:

python run.py -u www.sina.com -d 2 -f spider.log --thread 30 --dbfile spider.db