-
Notifications
You must be signed in to change notification settings - Fork 1
Expand file tree
/
Copy pathREADME
More file actions
41 lines (31 loc) · 2.02 KB
/
README
File metadata and controls
41 lines (31 loc) · 2.02 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
综述:
本工程用于获取www.cppblog.com的相关博客信息,由于cppblog似乎基于Metablog架构的,并且提供
了相应的服务接口用于第三方程序的接入,因此可使用对应的API来完成撰写,删除,抓取博客的功能,
具体的功能见: http://www.cppblog.com/YourUserName/services/metaweblog.aspx
目前,本工程已完成抓取功能的所有子模块,包括:
1. 根据一篇文章的博客ID,抓取对应的内容,标题和发布时间等信息(其余信息可自行添加,采用类似
的办法,因本人只对这写信息感兴趣)
2. 获取所有的分类信息和Rss订阅信息
3. 获取博客信息
4. 获取指定数量的近期发布文章
4. 保存为HTML页面
基于上述功能,可以完成博客迁移和备份工作,只需要循环利用抓取文章相关的函数即可,后期可能会
更新并提供完整功能,目前只完成这些子模块。
================================== Basic introduction ==================================
This blog is used to move my cppblog articles to local files(HTML).
Apache XML-RPC + Java
This project is based on www.cppblog.com, which provide the MetaWeblog API interface,
According to the url:
http://www.cppblog.com/deercoder/services/metaweblog.aspx
we could get some useful information about Post(which is a class defines the aritcle
title , time and content, other information is optional, like categories, link,
enclosement, we currently don't deal with it)
==========================================================================================
此工程用于将我的cppblog中的博文转移到本地,保存为HTML格式,用于后续的博客迁移工作.
API接口地址:
http://www.cppblog.com/deercoder/services/metaweblog.aspx
技术:
Apache + Java
采用Apache的XMLRPC库,根据cppblog.com提供的MetaWeblog Api接口,设置相关参数,发送请求
消息,根据获得的消息,利用API定义的接口,进行解析,获取其中的时间,标题,内容等有用
信息。