- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 爬虫视频的三种爬取(sys.arge、comm下载和content的下载)
爬虫视频的三种爬取(sys.arge、comm下载和content的下载)
2022-12-05 14:34:55
362
原创 python导入数据进入sqlite数据库时出现near “%“:syntax error错误或者no such column时的解决办法
near “%“:syntax error错误
2022-06-06 22:32:20
4981
原创 RDD编程初级实践
@TO RDD编程初级实践C一、实验目的(1)熟悉Spark的RDD基本操作及键值对操作;(2)熟悉使用RDD编程解决实际具体问题的方法。二、实验平台操作系统:Ubuntu16.04Spark版本:2.4.0Python版本:3.4.3三、实验内容和要求1.pyspark交互式编程本作业提供分析数据data.txt,该数据集包含了某大学计算机系的成绩,数据格式如下所示:Tom,DataBase,80Tom,Algorithm,50Tom,DataStructure,60Jim,D
2021-06-09 13:51:00
668
2
原创 大数据统计MapReduce
##大数据统计单词1.将待分析的文件(不少于10000英文单词)上传到HDFS。2.调用MapReduce对文件中各个单词出现的次数进行统计.3.将统计结果下载本地在已经学习大数据技术原理与应用 第三章 分布式文件系统HDFS 学习指南http://dblab.xmu.edu.cn/blog/290-2/下我们需要启动Hadoop。执行如下命令1.cd /usr/local/hadoop2…/sbin/start-dfs.sh #启动hadoop将File.txt(或者是想要上传的文件)文
2020-12-05 15:12:42
541
1
开源的verydows电商web系统项目
2022-10-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人