
大数据项目
文章平均质量分 54
朱智文
不求大富大贵,但求一路常青
展开
-
大数据第8天----------------------文件中统计单词出现的次数
涉及到的类:WordcountDriver.java, WordcountMapper.java WordcountReducer.java wordcount.txt文件内容: hello my name is zhuzhiwen what is your name hello my name is yy hello my name is kuaishou hello my name i原创 2017-10-11 09:14:44 · 1410 阅读 · 0 评论 -
利用reduce端的GroupingComparator来实现将一组bean看成相同的key
业务:输出相同订单编号中最大金额的记录 订单编号 金额 Order_0000001,Pdt_01,222.8 Order_0000001,Pdt_05,25.8 Order_0000002,Pdt_05,325.8 Order_0000002,Pdt_03,522.8 Order_0000002,Pdt_04,122.4 Order_000原创 2017-10-14 21:34:35 · 284 阅读 · 0 评论 -
windos 安装pandas ,numpy matplotlib
pip install matplotlib -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip install numpy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip install pandas -i http://p...原创 2018-09-11 16:44:45 · 254 阅读 · 0 评论