- 博客(19)
- 资源 (9)
- 问答 (4)
- 收藏
- 关注
原创 Numpy 计算男女生各科成绩统计指标
Numpy 计算男女生各科成绩统计指标1.随机数生成六个班的考试成绩,3门考试:Python、数学、语文。每个班50人import numpy as nparr = np.random.randint(0,151,size = (6,50,3))for i in range(0,6): print(i+1,"班成绩为\n",arr[i])2.将六个班的考试成绩进行合并得到scorescore = np.concatenate(arr)score.shape>>>
2021-09-01 11:36:57
3062
原创 Python统计指定目录的大小(拉勾教育数据分析实战训练营学习笔记)
说明使用os模块操作文件以及目录路径,定义一个统计指定文件夹大小的函数,(返回文件夹大小【非占用 空间】)单位:字节(B)提示:os.path.getsize(file) #获取文件大小注意:直接获取文件夹的大小,会返回一个1024B的倍数【我们需要获取文件夹的实际大小,1字节 =1B】测试一个文件夹的大小,而不是文件...
2021-08-23 23:12:26
533
原创 在虚拟机中执行Hive命令该如何操作呢?
前段时间在学习hive,之前是通过hue进行编程的,但是由于设备问题,网络连接不顺畅,使用感很不好,又不想再安装客户端了,于是学习了一下怎么在虚拟机中执行hive命令,以下是学习笔记。启动hive#登录hadoop⽤户[hadoop@node100 ~]$ #启动集群[hadoop@node100 hadoop]$ start-all.sh #进⼊到hive安装⽬录[hadoop@node100 hadoop]$ cd /opt/module/apache-hive-3.1.1-bin .
2021-08-15 18:36:33
4369
原创 Python学习笔记——流程控制(拉勾教育数据分析实战训练营学习笔记)
流程控制1 程序结构顺序结构 按编写顺序依次执行选择结构 根据条件选择的结果,选择执行不同的语句循环结构 在一定条件下,反复执行某段程序2 选择语句2.1 if语句语法规则if 表达式: 语句块2.2 if…else语句语法规则if 表达式: 语句块 1else: 语句块 2用于二选一的场合,可用条件表达式替换。2.3 if…elif…else语句语法规则if 表达式: 语句块 1elif 表达式: 语句块 2
2021-08-14 09:50:26
235
原创 Python学习笔记——运算符与表达式(拉勾教育数据分析实战训练营学习笔记)
运算符与表达式文章目录运算符与表达式1 运算符1.1 算术运算符1.2 赋值运算符1.3 比较运算符1.4 逻辑运算符1.5 位运算符2 运算符优先级3 条件表达式1 运算符1.1 算术运算符运算符说明+加-减*乘/除%求余,即返回除法的余数//取整除,即返回商的整数部分**幂,即返回x的y次方1.2 赋值运算符运算符说明=简单赋值+=加赋值-=减赋值*=乘赋值/=除赋
2021-08-14 09:12:05
159
原创 Python学习笔记——Python语言基础(拉勾教育数据分析实战训练营学习笔记)
Python语言基础1 Python语法特点1.1 注释规则# 这是一个单行注释''' 这是一个多行注释~~~'''""" 这也是一个多行注释 ~~~"""1.2 代码缩进1.3 编码规范2 Python中的变量2.1 保留字 保留字是Python中已经被赋予特殊意义的一些单词,开发程序时,不可以把这些保留字字作为变量、函数、类、模块和其他对象的名称来使用。 那么,Python中都有哪些保留字呢?Python中的保留字可以通过以下两行代码查看:
2021-08-14 09:09:50
310
原创 手把手教你安装Python环境(Python+PyCharm)图文解说 包教包会~
基于win10的Python环境搭建教程(Python+PyCharm)文章目录基于win10的Python环境搭建教程(Python+PyCharm)说明Python简介安装环境变量配置PyCharm简介安装环境配置说明环境:基于win10软件:Python 3.9.2 + PyCharm专业版 2020(包括环境变量配置)Python简介安装右键点击.exe文件,点击【以管理员身份运行】勾选【Add Python 3.9 to PATH】,点击【Customize inst
2021-08-12 00:50:27
2805
原创 MySQL学习笔记——SQL语句操作_3(拉勾教育数据分析实战训练营学习笔记)
SQL语句操作_MySQL核心查询1文章目录SQL语句操作_MySQL核心查询11 单表查询1.1 排序1.2 聚合函数1.3 分组1.4 LIMIT关键字2 SQL约束2.1 主键约束2.2 非空约束2.3 唯一约束2.4 外键约束2.5 默认值约束1 单表查询1.1 排序通过 ORDER BY 子句,可以将查询出的结果进行排序排序只是显示效果,不会影响真实数据语法格式SELECT 字段名 FROM 表名 [WHERE 字段 = 值] ORDER BY 字段名 [ASC / DESC]
2021-08-10 21:56:28
445
原创 MySQL学习笔记——SQL语句操作_4(拉勾教育数据分析实战训练营学习笔记)
SQL语句操作_MySQL核心查询2(多表查询)文章目录SQL语句操作_MySQL核心查询2(多表查询)1 外键约束1.1 外键1.2 级联删除2 笛卡尔积3 内连接3.1 隐式内连接3.2 显式内连接4 外连接4.1 左外连接4.2 右外连接5 SQL JOINS 总结1 外键约束1.1 外键外键指的是在从表中与主表的主键对应的那个字段(就是说,数据表A中有一列,这列指向了另一张数据表B的主键,数据表A中的这列就是外键)使用外键约束可以让两张表之间产生一个对应关系,保证主从表的引用的完整性
2021-08-10 21:51:25
371
原创 MySQL学习笔记——SQL语句操作_2(拉勾教育数据分析实战训练营学习笔记)
MySQL学习笔记——SQL语句操作文章目录MySQL学习笔记——SQL语句操作DQL[^1] 查询表中数据1 简单查询2 条件查询DQL1 查询表中数据1 简单查询执行顺序FROM --> WHERE --> GROUP BY --> HAVING --> SELECT --> ORDER BY查询不会对数据库中的数据进行修改,只是一种显示数据的方式语法格式SELECT [DISTINCT] <select_list>FROM <lef
2021-08-09 20:18:21
165
原创 MySQL学习笔记——SQL语句操作_1(拉勾教育数据分析实战训练营学习笔记)
MySQL学习笔记——SQL语句操作(入门级)文章目录MySQL学习笔记——SQL语句操作(入门级)1 通用语法2 注释语法3 DDL[^1]操作数据库3.1 创建数据库3.2 选择/查看数据库3.3 修改数据库3.4 删除数据库4 DDL操作数据表4.1 创建数据表4.2 查看数据表4.3 删除数据表4.4 修改数据表5 DML [^2]操作表中数据5.1 插入数据5.2 更改数据5.3 删除数据1 通用语法SQL语句可以单行 或者 多行书写,以分号结尾 。可以使用空格和缩进来增加语句的可读性。
2021-08-09 19:35:42
1076
原创 MySQL学习笔记——MySQL数据类型(拉勾教育数据分析实战训练营学习笔记)
MySQL学习笔记——MySQL数据类型MySQL数据库中,每一条数据都有其数据类型,主要可以分为数值型,字符串型和日期时间型三大类。说明如下所示:数值类型TINYINT一个非常小的整数,占1字节。如果是有符号,范围是(-128—127);如果是无符号,范围是(0—255)。INT正常大小的整数,占4字节。如果是有符号的,范围是(-2147483648—2147483647);如果是无符号,范围是(0—4294967295)。BIGINT一个大的整数,占8字节。如
2021-08-09 18:12:35
328
原创 MySQL学习笔记——数据库基本概念(拉勾教育数据分析实战训练营学习笔记)
MySQL学习笔记——数据库基本概念文章目录MySQL学习笔记——数据库基本概念1 什么是数据库2 为什么使用数据库3 数据库与数据库管理系统4 数据库分类5 关系型数据库主要对象1 什么是数据库数据库(DataBase,DB):按照数据结构来组织、存储和管理数据的仓库。数据库是数据的集合,其本质是一个文件系统,以文件的方式,将数据库保存在电脑上。2 为什么使用数据库表1. 各数据存储方式的比较内存文件(Excel)数据库优点速度快数据可以永久保存海量数据存储,提
2021-08-09 17:06:02
378
原创 SQL刷题——查找入职员工时间排名倒数第三的员工所有信息
数据异常排查我们先看下数据异常排查的背景,一般情况下,BAT 的数据产品 DAU 都比较大,动辄几百万上千万,甚至过亿,因此业务方和管理层每天都会盯着核心数据,而在这些核心数据中肯定会有一些数据是波动比较大的。这时,分析师需要对这些波动进行排查并解释原因,如果没有一套方法论面对问题就会很头痛,你可以回想下自己是否面对过这种情况,每天早上面对波动数据无从下手,找不到原因,解决不了,进而浪费很多时间做了很多无用功,感觉永无出头之日。实际上,数据有较大波动,无非就两个原因:一是目前数据本身有问题;二是业务本身
2021-08-04 20:50:41
469
原创 SQL刷题——查找最晚入职员工的所有信息
题目牛客题霸-SQL篇 SQL1 查找最晚入职员工的所有信息思路查询入职时间最晚的员工信息,即筛选出条件为hire_date 最大的员工信息注意聚合函数不能直接用在 WHERE 后做筛选条件。因为SQL的执行顺序是WITH AS --> FROM ( JOIN ) --> WHERE --> GROUP BY --> HAVING --> SELECT --> ORDER BY。就是说,WHERE是对分组前的结果集进行条件筛选的,而聚合函数是对分组后的结果集进
2021-08-04 19:51:20
955
原创 EXCEL 统计每日订单量(拉勾教育数据分析实战训练营学习笔记)
统计每日订单量背景介绍计算每日客单价(客单价 = 总销售额 / 订单数)数据介绍具体操作
2021-08-03 17:51:40
4508
原创 学习笔记——业务流程&数据分析方法(拉勾教育数据分析实战训练营学习笔记)
业务流程&数据分析方法文章目录业务流程&数据分析方法一、业务流程1.1 大致思路1.2 具体流程二、分析方法2.1 分组分析2.2 对比分析2.3 矩阵关联分析2.4 趋势分析2.5 逻辑树拆解分析2.6 综合分析2.7 漏斗分析2.8 指标体系模型分析2.9 RFM建模分析一、业务流程1.1 大致思路1.2 具体流程二、分析方法2.1 分组分析 定义:分组分析法是根据分析对象的特征,按照一定的指标,将数据分析对象分为不同的部分和类型来进行比较研究。 目的:把总体中具
2021-08-03 13:07:01
620
原创 学习笔记——数据分析思维
数据分析思维文章目录数据分析思维一、信度与效度二、溯源思维(5why分析法)三、逻辑树思维四、公式化思维五、实验思维六、分类思维七、矩阵思维八、漏斗思维九、细分思维十、费米思维*参考资料*一、信度与效度 信度指一个数据或指标自身的可靠程度,包括准确性和稳定性。类似取数逻辑是否正确?有没有计算错误?这些都属于准确性的范畴;每次计算的算法是否稳定?口径是否一致?这些属于稳定性的范畴。 效度,即数据的有效性,指测量结果能够反映想要考察内容的程度。测量结果与所要考察的内容越吻合,则效度越高;反之,则效度
2021-08-01 16:48:52
537
原创 学习笔记——数据分析入门
数据分析入门文章目录数据分析入门一、数据分析是什么?二、”我们“是谁?三、我们主要干什么?四、我们需要具有哪些能力?*参考资料*一、数据分析是什么?简言之,数据分析就是收集数据进行分析,从而辅助我们进行决策。数据分析的核心在于分析。二、”我们“是谁?数据分析师横向上:数据分析师主要分为业务型和技术型。纵向上:即数据分析师进阶之路,一般分为初级数据分析师、高级数据分析师、数据分析专家、数据科学家。三、我们主要干什么?宏观上描述现状——>寻找、总结规律——>推动改进微观上
2021-08-01 16:42:11
111
MySQL导入数据后,日期数据发生变化,与原始数据不符,该如何解决?
2022-05-12
mysql 查询结果分段整合 有什么更好的方法嘛?
2022-05-11
如何统计每日流失用户数
2021-08-16
TA创建的收藏夹 TA关注的收藏夹
TA关注的人