Nokogiri 是一个流行的 Ruby 库,用于解析和操作 XML 和 HTML 文档。它提供了强大的功能,使得处理和分析结构化文档变得非常方便。
以下是一个使用 Nokogiri 的简单示例:
require 'nokogiri'
require 'open-uri'
解析 HTML 文档
doc = Nokogiri::HTML(open('jshk.com.cn'))
获取所有链接
links = doc.css('a')
links.each do |link|
puts link.content
puts link['href']
end
解析 XML 文档
xml = '<root><element>Value</element></root>'
doc = Nokogiri::XML(xml)
获取元素内容
element = doc.at_css('element')
puts element.content
上述代码中,我们首先引入 Nokogiri 和 open-uri 库。然后,我们使用 Nokogiri 解析 HTML 文档和 XML 文档。在 HTML 文档中,我们使用 CSS 选择器获取所有链接,并打印出链接的文本内容和 href 属性。在 XML 文档中,我们使用 CSS 选择器获取元素,并打印出元素的内容。
Nokogiri 还提供了许多其他功能,例如 XPath 查询、节点遍历、节点操作等等。