
数据分析
Jamin2018
热爱互联网的转行狗。
展开
-
NumPy/Pandas-目前接触到要用的方法
Numpy:astype:显式转换成其他dtype类型arr.array([1,2,3,4,5])# int --> float64folat_arr = arr.astype(np.float64) # arr.astype(float64) , numpy会自动映射到等价dtype上 np.nan : 手动设定NaNPandas:数据读入:pd.read_csv('目标文件.cs...原创 2018-04-02 20:11:49 · 609 阅读 · 0 评论 -
数据分析各度量数据描述及应用对象
分类数据:评价等级A,B,C,D,E顺序数据:1,2,3,4,5,6,7,8,9数值型数据:温度,销售数,成绩各种字母对应:频数(fi)集中趋势的度量:分类数据:众数(Mo)顺序数据:中位数(Me),四分位数(Q)数值型数据:平均数(x-),几何平均数 G(算利率)离散程度的度量:分类数据:异众比率 (Vr)顺序数据:四分位差(Qd)数值型数据:方差(s2),标准差(s),极差(R),平均差(Md...原创 2018-07-10 17:41:16 · 2129 阅读 · 0 评论 -
数据分析-Python数据分析与挖掘所需的Pandas常用知识
转载至:https://mp.weixin.qq.com/s/jlDTXBmuMUU6kC2nRQXoSg前言Pandas基于两种数据类型:series与dataframe。一个series是一个一维的数据类型,其中每一个元素都有一个标签。series类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。一个dataframe是一个二维的表结构。Pandas的dataframe可以存...转载 2018-07-02 14:50:48 · 513 阅读 · 0 评论 -
统计学陷阱
1.内在有偏的样本:样本条件不一致,不具备准确性2.精心挑选的平均数:平均数误导(算术平均数,众数,中位数在不满足正太分布的前提下,差距较大)3.没有披露的数据:样本过低4.毫无意义的工作:利用毫无价值的数据宣传产品,提高产品竞争力5.惊人的统计图形:图表数据不展示基数,或省略中间部分(刻度值欺骗)6.平面图形:在三维角度上,根据增加倍率相应变宽变高,达到视觉欺骗7.不相匹配的资料:比如:“去年飞...原创 2018-06-19 19:47:39 · 1699 阅读 · 0 评论 -
数据分析-多因子探索分析理论铺垫
多因子探索分析理论铺垫假设检验与方差检验相关系数:皮尔逊、斯皮尔曼回归:线性回归PCA与奇异值分解假设检验: 1.建立原假设Ho(包括等号),Ho的反命题为H1,也叫备择假设2.选择检验统计量3.根据显著水平(一般为0.05),确定拒绝域4.计算P值或样本统计值,作出判断卡方检验:一个样本样本内部比较假设化妆这个行为不分男女,用卡方检验检验该假设129.3 > 3.841 ,在拒绝区,故假...原创 2018-04-04 15:06:36 · 952 阅读 · 1 评论 -
回顾正态分布
如果一组数据满足正态分布,请问意义是什么,数据有什么特点?1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。 2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。 4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越...转载 2018-04-04 15:02:40 · 655 阅读 · 0 评论 -
数据分析与挖掘建模(理论知识)
学习进度(3-10)理论铺垫:集中趋势(数据聚拢位置的衡量):均值( df.mean() )、中位数( df.median() )、众数( df.mode() )、分位数( df.quantile(q=0.25) 0.25下四分位数 0.5中四分位数 0.75上四分位数 )离中趋势(值越大越离散,越小越集中):标准差( df.std() )、方差( df.var() )数据分布:偏态( df...原创 2018-04-03 19:53:29 · 1900 阅读 · 0 评论 -
绘图-图形(柱状图)中添加纯文本注释(text)
转载至:https://blog.youkuaiyun.com/you_are_my_dream/article/details/53455256在图形中,通过text添加纯文本的注释text所有相关的参数:官网链接[python] view plain copy #!/usr/bin/python #c...转载 2018-04-03 15:42:03 · 4103 阅读 · 0 评论