随着教育部公布2017年度普通高等学校本科专业备案和审批结果的通知,目前申请获批数据科学与大数据技术专业(专业代码:080910T)的高校已增至278所。在获批高校越来越多的同时,如何在专业建设过程中选择适用教材,却逐渐成为了各大高校面临的一大难题。
而早在2016年,清华大学博士、南京大数据研究院院长刘鹏教授就联合国内多所高校从事一线教学科研任务的专业师资,开始编写大数据系列教材。目前,《云计算》、《大数据》、《大数据库》、《数据挖掘》、《深度学习》、《大数据可视化》、《虚拟化与容器》、《大数据实验手册》等本科系列教材陆续出版,可为大数据教学提供系统的教材支撑。
今天为大家重点推荐介绍《大数据实验手册》,欢迎了解和关注:
《大数据实验手册》概述
本书是国内众多高校采用的知名教材《云计算》(1~3版)的姊妹篇(《云计算》名列中国计算机类图书被引用量第一名),与《大数据》在内容上实现互补,适合作为大数据实验指导用书,也可作为大数据开发人员和爱好者的学习和实训资料。
《大数据实验手册》主要内容
本书针对高校大数据相关专业实践教学以及个人提升大数据动手能力的需求,由刘鹏教授带领大数据研发团队,经过反复实践、提炼和验证而成。本书主要内容包括HDFS实验、YARN实验、MapReduce实验、Hive实验、Spark实验、ZooKeeper实验、HBase实验、Storm实验、MongoDB实验、LevelDB实验、Mahout实验和综合实战等。每个实验呈现详细的实验目的、实验内容、实验原理和实验流程。本书实验均在大数据实验平台(https://bd.cstor.cn)和BDRack大数据实验一体机上验证通过。
《大数据实验手册》实验大纲
实验一:大数据实验一体机基础操作
实验二:HDFS实验:部署HDFS
实验三:HDFS实验:读写HDFS文件
实验四:YARN实验:部署YARN集群
实验五:MapReduce实验:单词计数
实验六:MapReduce实验:二次排序
实验七:MapReduce实验:计数器
实验八:MapReduce实验:Join操作
实验九:MapReduce实验:分布式缓存
实验十:Hive实验:部署Hive
实验十一:Hive实验:新建Hive表
实验十二:Hive实验:Hive分区
实验十三:Spark实验:部署Spark集群
实验十四:Spark实验:SparkWordCount
实验十五:Spark实验:RDD综合实验
实验十六:Spark实验:Spark综例
实验十七:Spark实验:Spark SQL
实验十八:Spark实验:Spark Streaming
实验十九:Spark实验:Graphx
实验二十:部署ZooKeeper
实验二十一:ZooKeeper进程协作
实验二十二:部署HBase
实验二十三:新建HBase表
实验二十四:部署Storm
实验二十五:实时WordCountTopology
实验二十六:文件数据Flume至HDFS
实验二十七:Kafka订阅推送示例
实验二十八:Pig版WordCount
实验二十九:Redis部署与简单使用
实验三十:MapReduce与Spark读写Redis
实验三十一:MongoDB实验:读写MongoDB
实验三十二:LevelDB实验:读写LevelDB
实验三十三:Mahout实验:K-Means
实验三十四:使用Spark实现K-Means
实验三十五:使用Spark实现SVM
实验三十六:使用Spark实现FP-Growth
实验三十七:综合实战:车牌识别
实验三十八:综合实战:搜索引擎
实验三十九:综合实战:推荐系统
实验四十:综合实战:环境大数据
实验四十一:综合实战:智能硬件大数据托管
实验四十二:综合实战:贷款风险评估
✤以上实验均附有实验目的、实验要求、实验原理、实验步骤、实验结果等详细介绍,参考实验内容即可完成相应实验。
通过以下链接了解更多《大数据实验手册》详情。
https://weidian.com/?userid=256743988&wfr=wxp_wxh5&ifr=itemdetail&spider_token=5edd&spider=seller.itemdetail.head.1