Mechanize抓取数据【Ruby】

本文介绍如何利用Ruby的Mechanize库进行网页数据抓取,包括安装配置、基本使用方法及常见操作如获取特定标签内容、提取链接等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

创建: 2017/08/05

更新: 2018/01/08 修正: ele_inner_text -> ele.inner_text

                          补充: inner_text和text一样
 第一步  gemfile里面加上
# 2017/08/05  拉取数据  这行是注释,自己随便写点啥
gem 'mechanize'
 第二步 bundle install
在项目目录下运行,安装Mechanize
 第三步 新建文件 scraping.rb
 位置 app/models
 先自己标点注释,
 实际第一行加上 require 'mechanize'
 
 
 
 
 
 
 
 
  
  
  
  

 
 Mechanize方法
 创建 agent = Mechanize.new
 读取 page = agent.get('...')

 ''内部放网址
 获取特定标签内容
 满足条件的所有内容
 elements = page.search('..')
 获取标签内部文本  elements.each do |ele|
    puts ele.inner_text
 end
 获取特定标签内容
 满足条件的一个内容
 elements = page.at('..')
 获取内部属性 elements.each do |ele|
    link = ele.get_attribute(:href)
 end

 或者简写为ele[:href]
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  
  

 

转载于:https://www.cnblogs.com/lancgg/p/8281761.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值