
爬虫
流沙-岁月
这个作者很懒,什么都没留下…
展开
-
理解HTTP消息头 (四)
服务器返回的HTTP消息也分为消息头和消息体两部分。前面连载的第二篇里已经介绍了返回消息中常见返回代码的含义。对于非正常的返回代码的处理比较简单,只要照着要求去做就好了,而对于正常的返回代码(200),其处理方式就多种多样了。 1Content-Type Content-Type是返回消息中非常重要的内容,它标识出这个返回内容的类型,其值为“主类型/子类型”的格式,例如最常见的就是text/h转载 2016-03-13 18:05:15 · 591 阅读 · 0 评论 -
理解HTTP消息头 (三)
这一次主要来观察HTTP消息头中客户端的请求,从中找到一些有意思的内容。 1HTTP_REFERER 写两个简单的网页: a.htm: to pageb b.htm: haha 内容很简单,就是网页A中有一个到B的链接。把它们放到IIS上,并访问网页A,从中再点击到B的链接,于是看到了B页的“haha”。那么这两次请求有什么不同吗?观察它们所发送的HTTP消息头,最明显的区别就是访问转载 2016-03-13 18:02:11 · 394 阅读 · 0 评论 -
理解HTTP消息头 (二)
常见的HTTP返回码 上一篇文章里我简要的说了说HTTP消息头的格式,注意到在服务器返回的HTTP消息头里有一个“HTTP/1.1200OK”,这里的200是HTTP规定的返回代码,表示请求已经被正常处理完成。浏览器通过这个返回代码就可以知道服务器对所发请求的处理情况是什么,每一种返回代码都有自己的含义。这里列举几种常见的返回码。 1403 Access Forbidden 如果我们试图请求转载 2016-03-13 17:52:48 · 2071 阅读 · 0 评论 -
初识HTTP消息头
但凡搞WEB开发的人都离不开HTTP(超文本传输协议),而要了解HTTP,除了HTML本身以外,还有一部分不可忽视的就是HTTP消息头。 做过Socket编程的人都知道,当我们设计一个通信协议时,“消息头/消息体”的分割方式是很常用的,消息头告诉对方这个消息是干什么的,消息体告诉对方怎么干。HTTP传输的消息也是这样规定的,每一个HTTP包都分为HTTP头和HTTP体两部分,后者是可选转载 2016-03-13 17:46:44 · 384 阅读 · 0 评论