
Perl
tingirl
这个作者很懒,什么都没留下…
展开
-
【Chapter5】一些UserAgent
<br />【UserAgent属性/方法东东】<br />第一个重要的attributes是Agent的等待时间,或者称作超时时间<br />例5-1 修改UserAgent默认时间,默认时间为180s,修改为10s<br />#!usr/bin/perl -w<br />use LWP::UserAgent;<br /><br />my $browser=LWP::UserAgent->new();<br />$oldval=$browser->timeout();<br />原创 2010-11-26 12:53:00 · 785 阅读 · 0 评论 -
perl&lwp经典用法
<br />1. 如何快速GET一个页面?<br /> use LWP::Simple; my $doc = get 'http://www.example.com/';<br /><br /><br /><br /><br />2. 标准的HTTP请求过程?<br /> use LWP::UserAgent; my $ua = LWP::UserAgent->new; my $req = HTTP::Request->new(GET => 'http://www.ex原创 2010-11-23 14:57:00 · 1194 阅读 · 1 评论 -
perl&LWP 综述
<br />Perl&LWP这本书讲的是Perl 里面用来完成HTTP方法的lib。<br /> <br />开篇有句话写的好。三件事让web服务成为可能:HTML编码、HTTP传递、URL来定位。要理解这三件事,才能透彻的用perl完成浏览器完成的工作。<br /> <br />基于此,用perl完成浏览器完成的工作必须要满足:分析URL、提取HTML、构造HTTP方法、解析HTML。<br /> <br />【开始使用Perl】<br />#!usr/bin/perl<br />#test.pl<br原创 2010-11-23 16:09:00 · 2161 阅读 · 0 评论 -
【Chapter1】perl&LWP之HTTP交互
<br /> <br />HTTP是应用层协议,在TCP之上,所以是可靠传输。分析下HTTP头<br />【HTTP请求和响应】<br /><br />HTTP请求由三部分构成:一个请求行(request line)、消息头部(headers)、body内容(body主要传递的是表单的参数等信息)。<br />请求行表示了客户度的请求方法(GET、POST…),请求的页面路径以及使用的HTTP协议(HTTP/1.0 或者 HTTP/1.1)。<br /><br />这个是被firefox格式过了,看原创 2010-11-23 17:32:00 · 696 阅读 · 0 评论 -
【Chapter3】LWP的do_GET
<br /> 用do_GET可以获取页面,专门一个chapter来说明do_GET,因为它比较重要。<br /> <br />关于do_GET的说明,它同head一样,可以在标量环境和列表环境中使用。即:<br /> <br />doc = do_GET(URL [header, value, ...]);<br /> 或者<br /> (doc, status, successful, response) = do_GET(URL [header, value, ...])原创 2010-11-24 12:36:00 · 759 阅读 · 1 评论 -
【Chapter2】LWP的Simple
<br /> <br />LWP的Simple用于实现基本的HTTP方法,Simple的接口简单,也只能实现一些基本的操作。<br /> <br />【getstore抓页面并保存】<br />例2-1 getstore抓页面并保存<br />#!usr/bin/perl<br />use LWP::Simple;<br /> <br />my $url='http://www.sina.com.cn’;<br />my $file='/web.html';<br /> <br />my $status=g原创 2010-11-24 12:08:00 · 746 阅读 · 0 评论 -
【Chapter4】还是do_GET
<br /> 一种常见的LWP的使用就是使用UserAgent模板(还是类?)。<br /><br />【抓取页面的例子】<br /><br />例4-1 抓取一个页面并判断是否有某个特定字符串<br />#!usr/bin/perl<br />use LWP::UserAgent;<br />my $browser = LWP::UserAgent->new( );<br />$browser->env_proxy( ); # 如果在防火墙后<br />$url = 'http原创 2010-11-24 17:20:00 · 534 阅读 · 0 评论 -
linux使用perldoc
1、关于perldoc我用的是linux,在apt-get install perl-doc无果后,去到http://perldoc.perl.org/下载了html版的。下载到本地后,根据说明打开index.html,发现很多页面木有。于是,纠结中发现,有这么一个方法:12原创 2011-07-19 10:30:15 · 806 阅读 · 0 评论