
R语言数据分析
数据科技社
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
SQL常见六大字符串格式时间处理11方法
SQL中日期处理非常常见,尤其是字符串格式的时间分区。如果数据是日期格式,那么直接用库中函数处理日期,比较简单。但当日期是字符串时,就需要做一些预处理工作。本文介绍常见字符串日期的处理方法。以impala为例。01 将日期字符串20200119转化为bigint时间戳: unix_timestamp (string date,格式)如:unix_timestamp (‘20200119’,‘...转载 2020-01-21 16:27:00 · 2946 阅读 · 0 评论 -
男的更容易买房子还是女的更容易买房子?Logistic模型预测
现在房价在小幅下降,但对于刚需的朋友来说,到必要时刻还是得买。对多数普通人来说,买房子是件大事,买一套房需要多看几次,但看几次最合适呢?我们可以从历史顾客的到访次数、年龄、性别和成交情况来探究到访次数与成交的关系。买房子成交与不成交只有两种结果,用Logistic回归模型来预测最合适不过了, Logistic模型最适合对二元输出结果的情况进行预测。Logistic回归模型对事件发生的响应概率p...转载 2019-09-01 15:19:19 · 254 阅读 · 0 评论 -
男性顾客可以忽视,女性顾客到访次数最重要?决策树回归模型帮你揭晓答案
在上一期文章中我们用Logistic回归模型通过到访次数、性别、年龄预测了客户的成交情况(详情请见男的更容易买房子还是女的更容易买房子?Logistic模型预测)。如何通过输入条件一步一步预测客户的行为呢?决策树回归模型可以很好地模拟和解决这一类问题。顾名思义,决策树回归就是根据要分类的特征属性,构建一颗树的结构,在这棵树中,从根节点开始,在分叉节点处根据概率选择进入哪一个分支,顺着分支推论到...转载 2019-09-01 15:26:21 · 292 阅读 · 0 评论 -
明星(如fsf)到底有没有出轨?Logistic回归模型告诉你
明星恋情和婚姻是吃瓜群众们经常讨论的话题,如最近的fsf疑似出轨事件,zly的粉丝众多和传言将要复出,fsf几度被送上热搜。身边的朋友也经常讨论这个话题,并且意见不一。于是,数学君想到了功能强大的Logistic模型,并费了九牛二虎之力找到了Logistic模型的样本数据,预测出了fsf出轨的概率。不了解Logistic回归模型的粉丝可能会问:这个Logistic模型预测的结果可信不可信?准确...转载 2019-09-01 15:37:52 · 1186 阅读 · 0 评论 -
身高、体重、脚长三个数值足以判断一个人的性别?贝叶斯分类模型
你的信用评分是高还是低?你在某个App上的活跃度怎么样?你是什么兴趣类型的用户?每个商家对我们的信息了如指掌,几乎可以做到精准推荐,这一点都不奇怪,因为用户被商家建立的分类模型分类了无数次。商家通过我们的信息和行为留下的痕迹对我们进行分类,并且随着我们在商家那里留下的行为痕迹越来越多,分类结果会被自动更新,最后模型越来越精确。是什么神通广大的模型让商家对用户能进行准确分类呢?其中最简便也应用最...转载 2019-09-01 15:44:47 · 4282 阅读 · 0 评论 -
什么影响了你的工资?方差分析告诉你
看到这个标题,你可能会想影响工资的因素太多了。学历、工作经验、能力、人脉、机会、行业、地域,等等,都会影响工资,怎么确定每个因素影响了多少工资呢?别急,我们一个一个来分析。方差分析就是研究类别型自变量和连续型因变量之间关系的一种统计分析方法。方差分析是不是特别适合解决我们刚才提到的问题?工资是近似的连续型因变量(说近似,是因为虽然工资可以为任意实数,但现实中我们基本以整数为单位,扣完保险和公积...转载 2019-09-01 15:54:25 · 842 阅读 · 0 评论 -
公司的收益如何预测?时间序列模型轻松搞定
公司的收益受很多因素的影响,一般的回归模型在预测公司收益方面并不容易奏效,因为回归模型需要的解释变量(自变量)很多,而在现实中,这些自变量也难以预测。但时间序列模型可以在仅知道历史收益一个变量的情况下,实现较高准确度的预测。时间序列模型有多种,如:单指数平滑模型(simple/single exponential model)双指数平滑模型(double exponential model...转载 2019-09-08 23:45:01 · 3290 阅读 · 0 评论