- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 Hadoop功能介绍
Hadoop是大数据处理框架,工具 hdfs和mapReduce是Hadoop的两个原始核心功能,前者是负责储存的系统,类似把试卷放在几个柜子里,后者负责并行计算,类似把100份试卷分给5个人批改。 Hadoop后来逐渐加了其他工具 hive提供数据汇总查询功能 hbase是一个可扩展的、非关系型数据库,不是传统的excel表那种的数据格式 spark是比mapReduce更快的计算框架 Hadoop和mysql的关系是“Friends with benefits” Hadoop的并行处理系统
2021-03-12 23:20:06
1885
原创 pandas空值处理
a = pd.DataFrame(np.random.randn(4,4), columns=list('abcd')) a['a'] = [2,2,None,np.nan] d = a['a'] print(d[~pd.isnull(d)]) python中,空值np.nan和None可以被pandas 的 isnull() 函数检测出来。 ...
2020-01-04 16:02:31
321
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人