- 博客(8)
- 收藏
- 关注
原创 Hive编程指南
1. 基础知识Hadoop实现了一个特殊的计算模型,即MapReduceMapReduce可以将计算任务分割成多个处理单元然后分散到一群家用的或服务器级别的硬件机器上,从而降低成本并提供水平可伸缩性MapReduce模型下,是一个成为Hadoop分布式文件系统(HDFS)的分布式文件系统Hive提供一个称为Hive查询语言(HiveQL或HQL)的SQL方言,用来查询Hadoop集群中的数据Hive的缺陷:Hive不是一个完整的数据库,它不支持记录级别的更新、插入或者删除的操作 H
2021-10-14 11:37:35
404
原创 Pandas
1. 创建数据结构方法 说明 pd.Series(data,index,name) index为指定的行索引,name为列名称 pd.DataFrame(data,columns,index) columns和index为指定的列、行索引,并按照顺序排列 2.DataFrame常见方法方法 说明 df.tail() 查询数据的前五行 df.head() 查询数据的最后五行 ...
2021-09-13 11:17:53
81
原创 Python数据分析常用
import pandas as pdimport numpy as npimport osimport warnings warnings.filterwarnings('ignore')pd.set_option('display.max_rows', 600) # 设置最大行数pd.set_option('display.max_columns', 100) # 设置最大列数
2021-09-02 10:12:28
91
原创 Python数据科学手册
1. IPython略2. Numpy入门略3. Pandas数据处理4. Matplotlib数据可视化5. 机器学习
2021-09-02 09:56:21
528
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人