学习如何使用 GNU Wget 和 cURL 将状态更新发送到 Twitter 和 FriendFeed,而不必使用 Twitter 桌面应用程序。此外,还学习如何从 Linux® 命令行跟踪来自 Twitter 和 FriendFeed 的 feed。
人们选择 Linux 这样的操作系统,是因为它在各方面的优点 — 它的总效用。它稳定、快速、便宜并且可以在所有类型的硬件上运行。它一开始就非常灵活,这主要是因为它强大的命令行接口(CLI)或 shell。
本文关注 2 个工具 — GNU Wget 和 cURL。您将学习如何使用这 2 个工具将状态更新发送到社交网络站点,而不必使用 Twitter 桌面应用程序,以及如何从命令行跟踪来自 Twitter 和 FriendFeed 的 feed。
您需要了解 API 方面的细节吗?本文不会深入探究关于 API 的使用的细节。Twitter 和 FriendFeed 都有那样的 API,这种 API 很容易通过一个 Representational State Transfer(REST)界面来访问。
GNU Wget 是一个灵活的软件,用于从服务器获取数据(例如文件、mp3 和图像)。它的非交互式、健壮和递归特性使得它非常通用,它主要用于从 Web 站点 抓取内容或脱机阅读 HTML 文件。(HTML 页面中的链接将自动调整,以支持该功能)。
例如,要获取在一个特定的 URL 发现的页面,可以使用以下命令:
wget http://wikipedia.org/ |
该命令将在那个 URL 上发现的 Wikipedia 主页下载到计算机上,且文件名为 index.html,因为那就是 GNU Wget 发现的页面。该工具没有跟踪那个页面上发现的任何链接,但是如果跟踪也很简单:
wget –r http://wikipedia.org/ |
![]() |
|
在这个命令中,-r
开关告诉 GNU Wget 递归地跟踪那个页面上的所有链接,所以该工具将抓取整个站点。不过,您可能不希望对 Wikipedia 这样的站点使用该开关,因为这会导致为方便本地访问而下载整个数据库,这需要很长的时间(取决于可用的带宽)。
![]() ![]() |
![]()
|
Client URL(cURL)是与 GNU Wget 不同的一种文件传输工具:它主要用于将货币汇率输入到 Internet Relay Chat(IRC)环境中。cURL 是用于执行 URL 操作和以 URL 语法传输文件的强大工具,这意味着可以通过 HTTP、HTTPS、FTP、FTPS 和大多数的其他协议传输大多数类型的文件。
cURL 应用程序主要用于 Web scraping 和 Web 站点交互自动化,例如表单提交(使用 GET
或 POST
命令)。例如,命令:
本文转自IBM Developerworks中国