利用 Perl 处理 RSS 提要:解析与创建指南
1. RSS 简介
RSS(Rich Site Summary 或 RDF Site Summary 的缩写)用于聚合网站内容。它有助于从网站收集标题和其他新闻相关条目,或者获取网页的最新更改。普通用户通常使用新闻聚合软件来消费 RSS 提要,像 Mozilla Firefox 这样的网页浏览器也支持将 RSS 提要用作书签。
有多种 Perl 模块可处理 RSS 提要。一些模块(如 XML::RSS)通用性强,可处理大多数 RSS 提要;而另一些则特定于某个网站的 RSS 提要。例如,XML::RSS::Headline::PerlJobs 可从 jobs.perl.org 获取标题,XML::RSS::Headline::Fark 可从热门的 Fark 网站获取标题。
目前,RSS 协议有四个版本:0.90、0.91、1.0 和 2.0。部分聚合软件仅支持特定版本的协议,可能只支持较新版本的有限子集,甚至完全不支持较新版本。同样,Perl 模块也不一定支持 RSS 协议的每个版本。有些 RSS 模块能很好地处理不同版本,会忽略未实现的部分;而有些则不能优雅地处理版本问题。确定所使用的模块是否适用于特定 RSS 版本的最佳方法是阅读该模块的文档。
若你不熟悉 RSS,可通过网页浏览器打开 RSS 提要。例如,在浏览器中输入 http://www.spc.noaa.gov/products/spcwwrss.xml ,你应该能看到类似图 8 - 1 所示的内容。
2. 使用 XML::RSS 读取 RSS
美国国家气象局的风暴预测中心(SPC)提供了中尺度讨论、对流
超级会员免费看
订阅专栏 解锁全文
6

被折叠的 条评论
为什么被折叠?



