
大数据
文章平均质量分 94
一燊芊芊
这个作者很懒,什么都没留下…
展开
-
数据统计分析:数据常用特征定义、意义与应用
文章目录一、指标平均数=均值公式及介绍作用及优缺点标准差公式及介绍作用及优缺点方差公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点公式及介绍作用及优缺点二、应用三、其它一、指标平均数=均值平均数,统计原创 2021-01-24 18:40:18 · 5720 阅读 · 0 评论 -
机器学习:7个步骤-2-数据预处理-异常值处理
异常值的判断1、使用均值和标准差进行判断mean 为数据的均值std 为数据的标准差数据的正常范围为 【mean-2 × std,mean+2 × std】import pandas as pdimport numpy as nptips = pd.read_csv('tips.csv')tipmean=tips['tip'].mean()tipstd = tips['tip'].std()topnum1 =tipmean+2*tipstdbottomnum1 = tipmean-2原创 2020-11-20 19:17:28 · 1343 阅读 · 0 评论 -
Hive HQL使用记录
inner join,join, left join, full join区别inner join(内连接)【 join默认是inner join】(等值连接) 只返回两个表中【联结字段相等的行】left join(左联接)返回包括【左表中所有记录】和右表中联结字段相等的记录right join(右联接)返回包括【右表中的所有记录】和【左表中联结字段相等】的记录...原创 2020-01-06 10:44:14 · 280 阅读 · 0 评论