Java备份博客文章之RSS

本文分享了一个博主因忘记多个博客账号密码而开发的博客备份工具经验。该工具通过分析博客页面来抓取内容,并使用XML存储原始数据,同时利用RSS订阅进行新数据的追加更新。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

2002开始写博客, 不知不觉已经几年过去了, 回头一看自己居然写了几百篇文章,  越想越佩服自己. 不幸的是有些博客因为太久没用忘记密码了, 网站的修改密码和help页却总是显示505错误,找不回密码了. 想想这些文章可是我一个字一个字打出来的, 就这么没了实在可惜, 一篇一篇备份实在麻烦, 唉 ... 失去了才知道珍惜 ... 痛定思痛,   为了证明我曾经也像韩寒那样能写, 我必须想个法子把把忘记密码的和没忘记密码的博客统统备份一下. 于是乎, 写个博客备份工具:

 

主要的思路是:

1.  分析网站的博客页面, 抓取博客内容;

2.  博客内容保存在xml作为原始数据;

3.  再加个rss订阅, 追加新数据

 

 

 

rss采用rome, 抓取用htmlparser

 

import java.net.URL;
import java.util.List;

import com.sun.syndication.feed.synd.SyndEntry;
import com.sun.syndication.feed.synd.SyndFeed;
import com.sun.syndication.io.SyndFeedInput;
import com.sun.syndication.io.XmlReader;

public class RomeTest {
	public static void main(String[] args) throws Exception {
		URL url=new URL("http://blog.sina.com.cn/rss/1191258123.xml");
		SyndFeedInput input=new SyndFeedInput();
		SyndFeed feed=input.build(new XmlReader(url));
		List list=feed.getEntries();
		for(int i=0;i<list.size();i++){
			SyndEntry entry=(SyndEntry)list.get(i);
			System.out.println(entry);
		}
	
	}
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值