- 博客(3)
- 收藏
- 关注
原创 python爬虫学习(循环爬取网页链接)
循环爬取网页链接 基本原理: 爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。 基本过程图: 重点:从访问的页面中抽取新的url链接 可以用正则表达式匹配链接<a href 标签 代码演示: # coding=utf-8 import requests import re def spid...
2019-04-10 17:34:49
17226
1
原创 java复习--String的内存分配
关于String的特性介绍 前言: 写这篇博客是因为本人已经大三了,不想考研,要忙着找实习工作了。 在做一些相关的java复习题时,发现自己对一些java里面的特性不是很清楚,通过博客记录题目的同时深挖一些相关的特性。 话不多说,进入正题。 上题: class TestString { public static void main(String[] args) { St...
2019-03-29 23:28:33
2331
1
原创 关于eclipse安装hadoop-eclipse插件后出现错误解决
关于eclipse安装hadoop-eclipse插件后出现错误解决问题背景:原因与解决方案: 问题背景: 最近由于在学习大数据课程,用到mapreduce编程,必不可免的使用到hadoop,同时也遇到了诸多的问题。这次的问题就是在为eclipse安装hadoop插件后遇到了一些问题,提示信息如下: erro:server ipc version 9 cannot communicate with...
2019-03-23 00:15:16
5328
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅