- 博客(3)
- 收藏
- 关注
原创 搭建hadoop+Hbase,JAVA API操作HBase
搭建hadoop+Hbase,JAVA API操作HBase 一、实验背景 了解HBase的存储形式https://blog.youkuaiyun.com/worldchinalee/article/details/82692185 HBase基于列的而不是基于行的模式。 Hbase 全称为 Hadoop Database,即 Hbase 是 Hadoop 的数据库,是一个分布式的存储系统。Hbase 利用 Hadoop 的 HDFS 作为其文件存储系统,利用 Hadoop 的 MapRedu
2020-07-04 00:58:43
574
原创 爬取豆瓣https://movie.douban.com/top250,翻页,图片
如何爬取豆瓣https://movie.douban.com/top250 操作步骤加思考: ①所需要的模块 import requests from lxml import etree # pandas用来保存为csv的 import pandas as pd # os所需的文件夹的下载 import os # 获取其页面代码 ②获取页面代码,因为豆瓣有反爬虫,加上headers def ge...
2020-03-11 15:57:27
6919
6
原创 机器学习-决策树实现可视化
决策树代码实现的可视化 要安装库sklearn,pandas,graphviz在cmd中安装 pip install sklearn pip install pandas pip install graphviz 下载graphviz,装环境变量 下载网址:在下载的时候有点慢https://graphviz.gitlab.io/_pages/Download/Download_window...
2020-03-11 11:15:20
881
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人