curl 使用方法

curl是一个利用URL语法在命令行方式下工作的文件传输工具。本文介绍了它的简单用法。

curl是一个利用URL语法在命令行方式下工作的文件传输工具。它支持很多协议:FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP。curl同样支持HTTPS认证,HTTP POST方法, HTTP PUT方法, FTP上传, kerberos认证, HTTP上传, 代理服务器, cookies, 用户名/密码认证, 下载文件断点续传, 上载文件断点续传, http代理服务器管道( proxy tunneling), 甚至它还支持IPv6, socks5代理服务器, 通过http代理服务器上传文件到FTP服务器等等,功能十分强大。Windows操作系统下的网络蚂蚁,网际快车(FlashGet)的功能它都可以做到。准确的说,curl支持文件的上传和下载,所以是一个综合传输工具,但是按照传统,用户习惯称curl为下载工具。

curl是瑞典curl组织开发的,您可以访问http://curl.haxx.se/获取它的源代码和相关说明。鉴于curl在Linux上的广泛使用,IBM在AIX Linux Toolbox的光盘中包含了这个软件,并且您可以访问IBM网站http://www- 1.ibm.com/servers/aix/products/aixos/linux/altlic.html下载它。curl的最新版本是 7.10.8,IBM网站上提供的版本为7.9.3。在AIX下的安装很简单,IBM网站上下载的rpm格式的包。

在http://curl.haxx.se/docs/,您可以下载到UNIX格式的man帮助,里面有详细的curl工具的使用说明。curl的用法为:curl [options] [URL...] 其中options是下载需要的参数,大约有80多个,curl的各个功能完全是依靠这些参数完成的。具体参数的使用,用户可以参考curl的man帮助。

下面,本文就将结合具体的例子来说明怎样利用curl进行下载。

1、获得一张页面

使用命令:curl http://curl.haxx.se

这是最简单的使用方法。用这个命令获得了http://curl.haxx.se指向的页面,同样,如果这里的URL指向的是一个文件或者一幅图都可以直接下载到本地。如果下载的是HTML文档,那么缺省的将不显示文件头部,即HTML文档的header。要全部显示,请加参数 -i,要只显示头部,用参数 -I。任何时候,可以使用 -v 命令看curl是怎样工作的,它向服务器发送的所有命令都会显示出来。为了断点续传,可以使用-r参数来指定传输范围。

2、表单(Form)的获取

在WEB页面设计中,form是很重要的元素。Form通常用来收集并向网站提交信息。提交信息的方法有两种,GET方法和POST方法。先讨论GET方法,例如在页面中有这样一段:

 

那么浏览器上会出现一个文本框和一个标为“OK”的按钮。按下这个按钮,表单就用GET方法向服务器提交文本框的数据。例如原始页面是在 www.hotmail.com/when/birth.html看到的,然后您在文本框中输入1905,然后按OK按钮,那么浏览器的URL现在应该是:“www.hotmail.com/when/junk.cgi?birthyear=1905&press=OK”

对于这种网页,curl可以直接处理,例如想获取上面的网页,只要输入:

curl “www.hotmail.com/when/junk.cgi?birthyear=1905&press=OK”

就可以了。

表单用来提交信息的第二种方法叫做POST方法,POST方法和GET方法的区别在于GET方法使用的时候,浏览器中会产生目标URL,而POST不会。类似GET,这里有一个网页:

 

浏览器上也会出现一个文本框和一个标为“OK”的按钮。按下这个按钮,表单用POST方法向服务器提交数据。这时的URL是看不到的,因此需要使用特殊的方法来抓取这个页面:

curl -d “birthyear=1905&press=OK” www.hotmail.com/when/junk.cgi

这个命令就可以做到。

1995年年末,RFC 1867定义了一种新的POST方法,用来上传文件。主要用于把本地文件上传到服务器。此时页面是这样写的:

 

对于这种页面,curl的用法不同:

curl -F upload=@localfilename -F press=OK URL

这个命令的实质是将本地的文件用POST上传到服务器。有关POST还有不少用法,用户可以自己摸索。

3、使用PUT方法。

HTTP协议文件上传的标准方法是使用PUT,此时curl命令使用-T参数:

curl -T uploadfile www.uploadhttp.com/receive.cgi

4、有关认证。

curl可以处理各种情况的认证页面,例如下载用户名/密码认证方式的页面(在IE中通常是出现一个输入用户名和密码的输入框):

curl -u name:password www.secrets.com

如果网络是通过http代理服务器出去的,而代理服务器需要用户名和密码,那么输入:

curl -U proxyuser:proxypassword http://curl.haxx.se

任何需要输入用户名和密码的时候,只在参数中指定用户名而空着密码,curl可以交互式的让用户输入密码。

5、引用。

有些网络资源访问的时候必须经过另外一个网络地址跳转过去,这用术语来说是:referer,引用。对于这种地址的资源,curl也可以下载:

curl -e http://curl.haxx.se daniel.haxx.se

6、指定用户客户端。

有些网络资源首先需要判断用户使用的是什么浏览器,符合标准了才能够下载或者浏览。此时curl可以把自己“伪装”成任何其他浏览器:

curl -A “Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)” URL

这个指令表示curl伪装成了IE5.0,用户平台是Windows 2000。(对方服务器是根据这个字串来判断客户端的类型的,所以即使使用AIX也无所谓)。使用:

curl -A “Mozilla/4.73 [en] (X11; U; Linux 2.2.15 i686)” URL

此时curl变成了Netscape,运行在PIII平台的Linux上了。

7、COOKIES

Cookie是服务器经常使用的一种记忆客户信息的方法。如果cookie被记录在了文件中,那么使用命令:

curl -b stored_cookies_in_file www.cookiesite.com

curl可以根据旧的cookie写出新cookie并发送到网站:

curl -b cookies.txt -c newcookies.txt www.cookiesite.com

8、加密的HTTP——HTTPS。

如果是通过OpenSSL加密的https协议传输的网页,curl可以直接访问:

curl https://that.secure.server.com

9、http认证。

如果是采用证书认证的http地址,证书在本地,那么curl这样使用:

curl -E mycert.pem https://that.secure.server.com

参考读物和注意事项:curl非常博大,用户要想使用好这个工具,除了详细学习参数之外,还需要深刻理解http的各种协议与URL的各个语法。这里推荐几个读物:

RFC 2616 HTTP协议语法的定义。

RFC 2396 URL语法的定义。

RFC 2109 Cookie是怎样工作的。

RFC 1867 HTTP如何POST,以及POST的格式。

curl是免费软件,IBM公司对curl不提供技术支持。

### curl 使用方法、教程与示例 #### 什么是 curl? `curl` 是一个强大的命令行工具,支持多种协议(HTTP/HTTPS、FTP 等),能够用于发送和接收网络数据包。它不仅适用于文件下载,还可以作为开发中的调试工具来模拟 HTTP 请求[^2]。 --- #### 安装验证 在 Windows 上完成 `curl` 的安装后,可以通过以下方式验证其是否正常工作: ```bash curl --version ``` 如果返回版本号及相关信息,则说明安装成功[^3]。 --- #### 基本使用 以下是几个常见的 `curl` 使用场景: 1. **GET 请求** 发送简单的 GET 请求获取网页内容: ```bash curl https://www.example.com ``` 2. **带自定义头部的请求** 添加特定的 HTTP 头部字段,例如设置 Content-Type 和 Authorization: ```bash curl -H 'Content-Type: application/json' \ -H 'Authorization: Bearer YOUR_ACCESS_TOKEN' \ https://api.example.com/resource ``` 此处 `-H` 参数用来指定额外的头信息[^4]。 3. **POST 请求** 向服务器提交 JSON 数据时可采用如下形式: ```bash curl -X POST "https://example.com/api/v1/create" \ -d '{"key":"value"}' ``` 这里 `-X POST` 明确指定了请求类型为 POST,而 `-d` 表示附加的数据体。 4. **携带认证令牌访问资源** 对受保护接口发起调用需附带身份凭证: ```bash curl -H 'Authorization: Bearer JWT_TOKEN_HERE' \ https://secure-api.example.org/profiles/me ``` 5. **静默模式运行** 若要屏蔽进度条和其他冗余输出,可以加入选项 `-sS` 来实现安静执行但仍保留错误提示: ```bash curl -sS http://target-site.com/page.html > output.txt ``` 6. **保存响应至本地文件** 当需要把远程 URL 下载的内容存储成磁盘上的某个位置时可用此法: ```bash curl -O https://remote-server/file.zip ``` 或者手动命名目标路径名: ```bash curl -o custom-name.pdf https://source/document.pdf ``` 7. **批量处理多个链接** 如果有若干地址要逐一抓取的话,可通过循环结构简化操作流程: ```bash urls=("http://site-a/" "http://site-b/") for url in "${urls[@]}"; do echo Fetching $url... curl "$url" done ``` 8. **SSL 验证跳过** 在某些情况下可能遇到证书校验失败的情况,此时可以用下面的方法绕开检查(注意生产环境下应谨慎对待): ```bash curl -k https://self-signed-cert-domain/ ``` 9. **跟踪重定向链路** 默认状态下当源站点发生转移不会自动跟随新的 URI;为了确保整个过程透明化,应当启用追踪机制: ```bash curl -L http://original-url-that-redirects-to-another-one/ ``` 10. **限流控制** 控制上传或下载速率以避免占用过多带宽资源: ```bash curl --limit-rate 100K https://big-file-download-location/ ``` --- #### 实际应用场景举例 假设我们正在构建搜索引擎优化(SEO)项目,并希望通过百度提供的 API 推送新页面索引给爬虫引擎,则按照官方指导编写脚本如下所示: ```bash curl -i -H "Host: data.zz.baidu.com" \ -H "Content-Length: 83" \ -H "User-Agent: curl/7.12.1" \ -H "Content-Type: text/plain" \ --data-binary @urls.txt \ "http://data.zz.baidu.com/urls?site=yourdomain.com&token=YourTokenHere" ``` 其中 `@urls.txt` 文件包含待更新的一系列网址列表[^5]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值