Skip to content

Latest commit

 

History

History
抱歉....这个的使用方法可能有点麻烦~

-------------------------------------------------------------------
myQQ.txt:
这个的登录的帐号存放点~
格式: 123456789 123456789
他是以行读取帐号的~所以当第一行帐号被冻结之后就可以把这个帐号移除掉了~等解冻再用~

-----------------------------------------------------------------------

QQForSpider.txt:

这个是用来存放初始化帐号的,也就是刚开始要爬的QQ号(开发空间的QQ)
文件里必须要有几个QQ号,最少1个~最多10个~
格式:
123456789
1234556789
123456789
123456789
123456789

---------------------------------------------------------------------

cookie.txt:
用来存放登录之后的cookie~不用管这个~

------------------------------------------------------------------

token_gtk_sid.txt:
用来存放 qzonetoken gtk sid的信息,也不用管~

----------------------------------------------------------------


mysqlite.py:
临时数据库文件
用来存储爬取下来的数据(说说key~QQ号)
这个不用管~~

-----------------------------------------------------------------


QQ_login.py:

这个是登录用的~刚开始先运行这个文件~
中途可能会出现 `需要验证` 的提示~这个问题可以重新运行 QQ_login.py 文件,提示 登录成功 就可以了~
需要验证的问题可能稍微麻烦点~因为他把验证的方式改变了.....不是从前的输入字母验证~以后解决~
如果多次出现 '需要验证' 的提示,那么请检查一下帐号是否已经被冻结了.........

----------------------------------------------------------------



Firend_shuoshuo_key.py:

这个是用来爬取好友发送的说说~
运行过程是:
首先获取 `QQForSpider.txt` 里面初始化的QQ号,然后挨个进行检查是否有权限访问~
如果有权限的话会保存到临时数据库中,没有权限的话~就丢弃~
接着从临时数据库中提取10个QQ号,开始爬取~
主要爬取的内容是 发送者QQ号,appid,说说的key,然后将这些数据通过`mysqlite.py`存储到临时数据库中


-------------------------------------------------------------------

Firend_qq_number.py:

这个是用来爬取浏览量的~
运行过程:
首先获取 `Firend_shuoshuo_key.py` 爬出来的说说key,接着通过说说key爬取说说的浏览量的信息
然后获取浏览量里面的QQ号并进行检测是否有权限访问,有就存储起来,没有就pass掉~

-------------------------------------------------------------------

Firend_information.py:

这个就是用来爬取QQ号的信息,比如城市~年龄~国籍~昵称等等~
存储到MySQL数据库中~

--------------------------------------------------------------------


main.py:

额.....这个暂时用不上........不用管~

--------------------------------------------------------------------


使用方法:

第一步: 运行 QQ_login.py 登录
如果提示 登录成功 就接着第二步
没有则重新运行一次

第二步: 打开一个新的终端(命令行) 运行 Firend_shuoshuo_key.py 
如果数据开始爬取的时候就接着第三步~

第三步: 再打开一个新的终端(命令行) 运行 Firend_qq_number.py

第四步: 再打开一个新的终端(命令行) 运行 Firend_information.py:


---------------------------------
2017-11-22-22-50		|
---------------------------------