- 博客(13)
- 收藏
- 关注
原创 hive练习1:每人计算自己的年龄(查询)
SELECT COUNT(*) AS score_count FROM 表名 WHERE score >= 70 AND score <= 85;3.查询课程号为’1‘的最高分和最低分,以及课程号为’2‘的最高分和最低分,要求显示课程号、最高分和最低分。2.查询学号为’20190101‘的总分,要求显示学号、姓名和总分。4.查询各学生的平均分,要求显示学生学号、姓名、专业名称和平均分。1.查询成绩在70~85之间的成绩数。
2023-12-12 20:22:14
449
原创 hive建内部表,导入数据
通过这种方式,您可以在Hive中对现有的数据进行查询和分析,而无需将数据移动到Hive默认的数据目录中。External Table(外部表):外部表是指与表数据的存储位置相分离的表。总结起来,内部表由Hive管理其数据,而外部表的数据则存储在外部系统中,Hive只是提供了对这些数据的元数据管理功能。LOCATION '建表的路径':LOCATION子句用于指定外部表的数据存储位置。hadoop fs -put 编写的文件 上传的文件的路径。外部表和内部表是Hive中用于管理数据的两种不同类型的表。
2023-12-12 08:22:19
557
原创 pandas高级数据处理
pd.get_dummies(分好组的数据,predix=)1.替换df.replace(to_replace="默认符号(?....)", value=np.nan)它可以统计两个或多个变量之间的频数或频率,并以表格形式展示。pd.merge(left,right,how='inner', on=[索引])2.自定义分组 pd.cut(data, bins)1.自动分组 pd.qcut(data,bins)3.替换sr.fillna(value,inplace)2.做删除处理 df.dropna()
2023-12-05 19:30:58
953
1
原创 pyecharts数据可视化
from pyecharts.charts import (Line折线图.Bar柱形图/条形图.Pie饼图.Scatter散点图......)是导入 Pyecharts 模块中的options模块并将其重命名为opts。options模块是 Pyecharts 中的一个子模块,提供了用于配置图表选项的类和方法。
2023-12-04 19:23:05
1017
原创 Matplotlib基本画图
cellText: 二维数组,表示表格中的文本内容。cellColours: 二维数组,用于设置单元格的背景颜色。cellLoc: 字符串,指定单元格中文本的对齐方式,如 'right'、'left'、'center'。colWidths: 一维数组,指定每列的宽度。rowLabels: 一维数组,表示每行的标签。rowColours: 一维数组,用于设置每行的背景颜色。rowLoc: 字符串,指定行标签的位置,如 'left'、'right'。
2023-12-04 15:37:28
1076
原创 scrapy 基础入门
return item # 必须要return东西,否则下一个管道收不到数据。解析数据的时候,需要注意,默认xpath( )返回的是Selector对象。yield 返回数据 -> 把数据交给pipeline来进行持久化存储。5. 对数据进行解析,在spider里面parse(reponse)方法中进行解析。item['你的数据的key']='数据的值'想要数据必须使用extract( )提取数据。extract_fist() 返回一个数据。'管道路径': 优先级,'管道路径': 优先级,
2023-08-11 11:13:54
70
1
原创 pyCharm创建Flask
创建static目录,存放js,css等静态文件,在创建js目录,存放jquery,echarts的js文件。render_template 返回的是templates里面的html。@app.route("") -->写的是要访问的url。创建包templates目录,存放模板文件html。下载:pip install flask。
2023-08-10 09:39:55
178
1
原创 虚拟机nat网络配置
IPDDR 前面三个跟GATWAY一样,后面一个自己配置,我的是100+自己的学号,好像不能超过250和不能为0.点击虚拟机的左上角的编辑->虚拟网络编辑器->VMnet8->NAT 设置。注意两个添加跟我不一样!空格后面的都是添加,抄就可以了。3.ping一下看看网通了吗?IPADDR和GATWAY。
2023-08-01 11:13:26
90
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人