-

读Ma 的文章后进行的复现工作，并进行了部分更改 Detect Rumors Using Time Series of Social Context Information on Microblogging Websites 使用的数据集：https://www.dropbox.com/s/46r50ctrfa0ur1o/rumdect.zip?dl=0 weibo_label 中的 weibo_id_label.txt 是数据集的标签使用该标签对数据进行分类（由于6条标签和数据集中文件名不对应，故剔除）得到rumor、non_rumor文件夹

文本特征：详细代码和注释见 text_analysis.py LDA文件中的 LDA_train.pu 对数据集进行主题分类并保存训练模型提取文本特征使用到 LDA_use.py ，用训练好的模型对文本分类

用户特征：详细代码和注释见 user_analysis.py 调用了city.py 判断用户是否来自大城市。根据新浪微博提供的省份城市编码表和维基百科提供的中国大城市目录

传播特征：详细代码和注释见 propagation_analysis.py

时间序列：这里只实现了论文中的SVM_DSTS_all，其他的可以自行修改详细代码和注释见 DSTS.py

最终效果：

accuracy: 0.8027357633814762

precision: 0.9441549251954203

recall: 0.8027357633814762

F1 score: 0.8677210652998039

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
LDA		LDA
dict		dict
emotion_analysis		emotion_analysis
weibo_label		weibo_label
DSTS.py		DSTS.py
README.md		README.md
SVM_train.py		SVM_train.py
city.py		city.py
propagation_analysis.py		propagation_analysis.py
spir0728-ma.pdf		spir0728-ma.pdf
text_analysis.py		text_analysis.py
user_analysis.py		user_analysis.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

-

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

-

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages