PAIP.获取RSS全文输出.txt

本文介绍了一种通过解析RSS中的LINK并利用HTTP客户端下载HTML页面的方法实现RSS全文抓取的技术,这种方法相较于传统的5种方法(まるごとRSS、FeedEx等),成功率可达100%,并提供了具体的使用步骤及待改进之处。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


PAIP.获取RSS全文输出.txt


有些站点非RSS全文输出..可以使用以下五种方法 ...但经过我的亲自试用,效果不佳..大约只有50%的成功率..

1.まるごとRSS,
2.FeedEx ,
3.利用 fivefilters 的full-text rss
4.借助Yahoo Pipes
5.在 Google Reader


只好亲自动手,写了断源码,解析RSS中LINK,然后利用HTTPCLIENT将其下载下来...效果达到了100%成功率..很不错.呵..分享一下,将其上传至网

站..http://www.hahasfc.com

使用方法 http://www.hahasfc.com/rssfulltxt.jsp?url=http://www.msn.com/rss/mustsee.aspx (全文FEED地址)
将其url参数改为源RSS FEED地址就可以了..

http://www.msn.com/rss/mustsee.aspx是MSN的一个FEED地址,只输出了摘要..经过这么来转换,就得到了全文的FEED...

目前有待于改进的地方:
1.因为是实时抓取网络IO,所以速度有点慢.
2.未分析文章内容,直接将其HTML页面抓过来了.呵.



-----参考
5种获取RSS全文输出的方法 帕兰映像.htm

Powered by Zoundry

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值