用scrubyt抓取酷讯最新火车票信息

本文介绍了一个使用Scrubyt库编写的简单爬虫示例,该示例抓取了从北京到广州的航班信息,并保存为XML格式。文中展示了如何使用Scrubyt进行网页元素的选择和数据提取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用scrubyt写的一个简单的小例子,scrubyt看起来真的很不错,不过现在bug也非常的多,特别是对xpath的支持。


require 'rubygems'
require 'scrubyt'

Scrubyt.logger = Scrubyt::Logger.new
kooxoo_data = Scrubyt::Extractor.define do
fetch "http://piao.kooxoo.com/"
fill_textfield 'vFrom', '北京'
fill_textfield 'to', '广州'
submit
record"//tbody/tr" do
col1 "/td[@class='col1']" do
url "href", :type => :attribute
end
col2 "/td[@class='col2']"
col3 "/td[@class='col3']"
col4 "/td[@class='col6']"
col5 "/td[@class='col7']"
end
end
kooxoo_data.to_xml.write(open('result.xml', 'w'))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值