
统计学
dltan
百川终到海。微信:realtimedata
展开
-
R语言java.lang.OutOfMemoryError: Java heap space解决
R语言堆栈错误描述解决错误描述:数据占用的java内存空间过大解决方法是:在加载使用包之前,设定空间占用的java内存大小即可,一定是在调用之前,如果不是:则重启R软件,再执行该语句,按照顺序即可。options(java.parameters=’-Xmx6144m’)options(java.parameters=’-Xms6144m’)library(RJDBC)R本地数据内存过大解决...原创 2019-11-12 10:01:00 · 4046 阅读 · 0 评论 -
姓名数据挖掘偏好选字分析
姓名数据挖掘好的名字,将伴随人的一生。一个人的姓氏很难改变,但名却又有很多相同,红楼梦尚有贾史王薛,百家姓尚有整合。那关于一个人的名,是否有什么意义探究呢?为此选择一些数据进行姓名的名偏好进行分析,看大家取名的偏好如何,是否天生丽质,婷婷静好?选择数据如下所示:第一步:分割数据library(readxl)library(data.table)data=read_excel(“C:\...原创 2019-10-31 19:37:48 · 767 阅读 · 1 评论 -
统计学常识笔记整理(一)
统计学是指导统计活动的科学,也就是要为如何获取数据、表现数据和分析数据提供理论方法。其研究对象为各种各样客观现象的数量方面。统计学派的观点和引用政治算术学派采用了数量分析方法;数理统计学派引入了大数法则;现代统计学时期出现了小样本思想。国势学派对统计学的主要贡献是提出了“统计学”这一名词数据特征的划分定距数据:对事物类别或次序之间间距的测度所形成的数据。定类数据:按照事物的某种属性...原创 2019-07-30 13:46:31 · 2421 阅读 · 0 评论 -
实现数字和汉字的自动分离方法
数字和汉字合并在一起进行分离,用lenb函数将数字和汉字进行分裂。原创 2019-08-01 16:22:51 · 2263 阅读 · 0 评论 -
统计学常识笔记整理(二)
异众比率主要适合测度分类数据的离散程度,当然,对于顺序的数据以及数值型数据也可以计算异众比率。而变异系数用来检测数据中的异常值情况。原创 2019-08-06 14:53:32 · 1038 阅读 · 0 评论 -
统计学常识笔记整理(三)
变异系数的别名又叫做均值的标准误差、离散系数、标准差系数、变异系数置信区间支出为95%[a,b]的表述为:以95%的置信区间推断支出的金额在(a,b)之间,样本容量知道期望E,显著性水平为0.05下的z的统计量为1.96,标准差为1000,求得样本容量为385.计算方式为:置信度和精确度什么是置信度呢?如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,...原创 2019-09-02 19:34:11 · 840 阅读 · 0 评论