- 博客(3)
- 收藏
- 关注
原创 python爬虫学习(循环爬取网页链接)
循环爬取网页链接基本原理:爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。基本过程图:重点:从访问的页面中抽取新的url链接可以用正则表达式匹配链接<a href 标签代码演示:# coding=utf-8import requestsimport redef spid...
2019-04-10 17:34:49
17074
1
原创 java复习--String的内存分配
关于String的特性介绍前言:写这篇博客是因为本人已经大三了,不想考研,要忙着找实习工作了。在做一些相关的java复习题时,发现自己对一些java里面的特性不是很清楚,通过博客记录题目的同时深挖一些相关的特性。话不多说,进入正题。上题:class TestString { public static void main(String[] args) { St...
2019-03-29 23:28:33
2273
1
原创 关于eclipse安装hadoop-eclipse插件后出现错误解决
关于eclipse安装hadoop-eclipse插件后出现错误解决问题背景:原因与解决方案:问题背景:最近由于在学习大数据课程,用到mapreduce编程,必不可免的使用到hadoop,同时也遇到了诸多的问题。这次的问题就是在为eclipse安装hadoop插件后遇到了一些问题,提示信息如下:erro:server ipc version 9 cannot communicate with...
2019-03-23 00:15:16
5278
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人