CURL shell 使用

本文介绍了一个使用Bash脚本从特定网址抓取数据并解析URL的示例。脚本通过curl获取网页内容,然后使用sed进行数据清洗,提取URL,并检查其有效性。此方法适用于自动化数据抓取任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#! /bin/bash

requrl="http://www.baidu.com/xxxxxx"
while true
do

html=$(curl -s "$requrl")
url=$(echo "$html" | sed ':a;N;$!ba;s/\n//g' | sed 's/.*URL=//g' | sed 's/\].*//g')

  if [ ${#url} -gt 0 ];then
        doname=${url:0:20}
	myurl="http://www.baidu.com"
        if [ "$doname" = $myurl ]
	then
		requrl=$url
                echo "`date '+%Y-%m-%d %H:%M:%S'` - find URL:$url" 
        else
                echo "`date '+%Y-%m-%d %H:%M:%S'` - No Find URL:$url"
		break 
        fi
  fi
done

  

转载于:https://www.cnblogs.com/wanglijun/p/10283592.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值