
Javascript
kelvinLLL
这个作者很懒,什么都没留下…
展开
-
解读URL的组成部分
以下面这个URL为例,介绍下普通URL的各部分组成http://www.aspxfans.com:8080/news/index.asp?boardID=5&ID=24618&page=1#name从上面的URL可以看出,一个完整的URL包括以下几部分:1.协议部分:该URL的协议部分为“http:”,这代表网页使用的是HTTP协议。在Internet中可以使用转载 2017-02-23 22:49:44 · 1425 阅读 · 1 评论 -
爬虫奇遇记——爬不到想要的内容
这一系列将分享在写网络爬虫时遇到的奇葩事我们在写爬虫时,总是先F12看一下网页的源代码,看到内容后再想策略去抓取想要的内容,这种思路对于文本内容是静态的话是行得通的,但是如果遇到动态加载的内容,就很麻烦了,你会发现你爬下的html文件里根本找不到你想要的内容,这也是网络商应对爬虫的一种策略。下面举例说明,用站长之家的SEO查询来讲比如想抓这个中文网站排名的数据,看一下源码:原创 2017-02-24 09:39:30 · 2459 阅读 · 0 评论 -
爬虫奇遇记——标签去哪儿
这一系列分享我在写爬虫过程中遇到的奇葩事这次遇到的是在爬html文件时,发现爬下来的标签内容变了,举个例子有可能变成:再看实际的,比如站长之家的whois查询爬下来,却是这样的后面的clearfix没有了!这可能是网络商的策略,以后遇到clearfix的标签要小心了原创 2017-02-24 10:15:57 · 674 阅读 · 0 评论