最早是在优快云上写博客的,可是渐渐发现优快云写博客有诸多限制,而且优快云博客时不时会挂掉,因此后面用Hexo在github上搭了一个新博客,也就是现在这个。然而这样一来很多文章就留在优快云上,而在新博客上找不到了。因此前几天用Java写了一个爬虫,把优快云上的博客内容爬了下来,并解析成markdown格式存储在本地,这样就可以方便的迁移到新的博客了。
优快云博客迁移,把优快云博客上的内容爬取下来,存为本地的md文件,方便部署到hexo。
具体需求如下:
-
- 博文内容要转换成MarkDown源码格式存储。
-
- 支持优快云博客内容是MarkDown渲染或者非MarkDown渲染的。
-
- 除了文章正文,其他信息(如标题、发布时间、分类、标签、是否转载等)也要保存下来。
-
- 生成文章描述。
1、实现思路
- 用爬虫把需要的内容爬取下来
- 然后解析相应的内容
- 存储在本地
- 发布在新博客
2、如何使用
- 下载jar包 点击下载
- 执行命令
java -jar csdn-blog-migration-crawler.jar 博客地址 本地存储路径
如,
java -jar csdn-blog-migration-crawler.jar timberwolf_2012 /Users/chenzz/Desktop/blog/