
数据挖掘
文章平均质量分 83
QueenieK
这个作者很懒,什么都没留下…
展开
-
SQL生成序号的四种方式
排名函数是SQL SERVER2005新增的函数。排名函数总共有四种,分别是:row_number、rank、 dense_rank 、ntile。row_number:顺序生成序号。rank:相同的序值序号相同,但序号会跳号。dense_rank :相同的序值序号相同,序号顺序递增。ntile:装桶,把记录分成指的桶数,编序号。下面分别介绍一下这四个排名函数的功能及用法。在介绍之前假设有一个t_table表,表结构与表中的数据如图1所示:图1其中field1字段的类型是int,field2转载 2021-01-22 11:27:19 · 25783 阅读 · 0 评论 -
Map-Reduce思想
Map-Reduce是针对海量数据的分布式处理方法,将数据分块的存储在集群中。其精髓就是并行化。一个linux命令words(test.txt) | sort | uniq-cwords(test.txt)输出test.txt文件中所有的词,然后进行sort排序,再进行uniq-c统计每个单词出现的次数。 words(test.txt)的输出作为sort的输入,sort的输出作...原创 2018-04-24 23:37:56 · 251 阅读 · 0 评论