自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Flink流计算引擎

  伴随着海量增长的数据,数字化时代的未来感扑面而至。不论是结绳记事的小数据时代,还是我们正在经历的大数据时代,计算的边界正在被无限拓宽,而数据的价值再也难以被计算。时下,谈及大数据,不得不提到热门的下一代大数据计算引擎Apache Flink(以下简称Flink)。 统一的批处理与流处理系统 在大数据处理领域,批处理任务与流处理任务一般被认为是两种不同的任务,一个大数据项目一般会被设计为只...

2019-02-20 16:02:30 2057

转载 激活Pycharm

在激活Jetbrains旗下任意产品的时候选择激活服务器 填入以下地址便可成功激活 http://idea.liyang.io 点击help→Register→License sever ,输入http://idea.liyang.io

2017-07-24 12:51:56 491

原创 用Python从百度百科爬取十个页面

从百度百科爬取十个页面:   1. 路径管理模块:url_manager.py   维护两个集合:待爬取的url 、 已爬取的url   方法:   (1)向管理器中添加一个新的url   (2)向管理器中添加批量新的url (3)判断是否有新的待爬取的url (4)获取一个待爬取的url 2.  HTML下载模块:html_downloader.py    下载页面内容

2017-07-20 10:07:48 815

原创 Python for Mysql

1.安装:     a.手动安装:         pip install PyMySQL     b.自动安装:         下载pymysql,然后解压压缩包。在命令行中进入解压后的目录,执行如下的指令:         python setup.py install 2. mysql 操作流程: 3.connection 对象: import pymysql pri

2017-07-19 11:16:36 428

原创 ubuntu16 + jdk8 + hadoop2.7 安装

1.安装JDK 2.解压hadoop 安装包至 /usr/local/hadoop 目录 3.启动ssh : ssh localhost  关闭机器的防火墙 :     ufw disable 4.配置hadoop: 进入/usr/local/hadoop/etc/hadoop/目录下,修改三个配置文件: 第一个文件core-site.xml core-sit

2016-11-29 14:39:34 814

原创 linux

Linux学习笔记1.磁盘的第一个扇区主要记录了两个重要的信息: 主引导分区(MBR): 可以安装引导加载程序的地方,446bytes 分区表:记录整块硬盘分区的状态,64bytes 2.主分区、扩展分区、逻辑分区的关系: 主分区与扩展分区最多可以有4个 扩展分区最多只能有一个 逻辑分区是由扩展分区持续切割出来的分区 能够被格式化后作为数据访问的分区为主分区与逻辑分区。扩展分区无法格式化(如果

2016-11-25 23:17:26 1249

原创 在win10的基础上安装ubuntu双系统

这两天为了学习hadoop,装双系统装到累吐血,下面总结一下。 0.给电脑预留出一块空闲区间,大约50G。 1.先去ubantu官网下载相关版本,我下的是麒麟16.10的64位版本的:http://www.ubuntukylin.com/downloads,下载后的iso文件移动到c盘根目录。 2.下载好后安装easyBCD,在easyBCD选择“添加新条目”,然后选择“NeoGrub”

2016-11-17 15:22:42 1820

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除