
读书笔记
文章平均质量分 92
Urlli
哟。改bug呢?
展开
-
清华数据挖掘:理论算法 视频笔记
课程来源:清华大学-数据挖掘:理论与算法(国家级精品课)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili 数据预处理 数据挖掘的最重要的一环:数据预处理。算法则是其次。 Data Preprocessing: Data Cleaning: Fill in missing values Correct inconsistent data Identify outliters and noisy data Data Integration: Combine data from differe原创 2021-03-29 16:14:00 · 422 阅读 · 0 评论 -
2020-10-12 《Hadoop 权威指南》学习日记之,读写的细节
近日阅读了《Hadoop权威指南第三版》,在第3.6小节数据流部分,对文件读取和文件写入进行了剖析,现在准备对这段内容做些重点描述,留下自己的疑惑,今后有所理解后再回头来解决,如果能有大佬在我这儿评论留言解答我的疑惑那就太美滋滋了嘿嘿嘿。 anyway 1.剖析文件读取 理解在这个过程中,HDFS,namenode与datanode之间的数据流是什么样的。 流程图截取自书: 客户端通过调用FileSyste对象的open()方法打开希望读取的文件 DistributedSystem通过使用R原创 2020-10-13 15:50:56 · 282 阅读 · 2 评论