- 博客(2)
- 收藏
- 关注
原创 通用爬虫实现的原理及过程
获取初始的URL。初始的URL地址可以人为地指定,也可以由用户指定的某个或某几个初始爬取网页决定。 根据初始的URL爬取页面并获得新的URL。获得初始的URL地址之后,先爬取当前URL地址中的网页信息,然后解析网页信息内容,将网页存储到原始数据库中,并且在当前获得的网页信息里发现新的URL地址,存放到一个URL队列里面。 从URL队列中读取新的URL,从而获得新的网页信息,同时在新网页中获取新...
2019-04-15 21:01:32
4995
原创 程序员新手上路之安装java-jdk环境
在学习大数据之前,首先要掌握的是汇编语言java,而学习java语言前必定要先安装环境,jdk的安装在我们上课期间有提到过,可是当时没有上心听讲,也就不知道如何安装jdk,在这次的学习中,老师指引我们如何进行jdk的安装,在一步步地按照老师所教的步骤操作的时候,发现有些问题,自己没能将中英文符号:分号没有注意到,以及在配置环境变量的时候,path里面的地址复制我没有把复制好的地址放在最前面,而且是...
2018-04-22 18:56:24
296
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人