自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 假设检验的过程

假设检验的核心思想是小概率事件在一次实验中不可能发生,假设检验就是利用小概率事件的发生进行反正。学习假设检验,有几个概念不能跳过,原假设、p值。

2024-02-08 11:25:42 1694

原创 AB测试最小样本量

2.将策略推全来验证策略效果是比较危险的,因此AB实验的对象是从总体当中去抽样数据,总体的分布可能会有多种形态,如正态分布、偏态分布、严重偏态分布等,总体的数据量也有多有少。4.当每次从总体中抽样数据时,计算均值会得到一个数,抽样同样的数据量,计算均值,也会得到一个数,两个数大概率不会一样,因此,当抽样多次,计算的均值就会形成一个分布。5.小标4说的是样本容量,即每个随机样本中个体的数量,用n表示,当按照样本量抽取多次的时候,才能得到正态分布,抽样的次数,叫样本量。

2024-02-07 16:27:16 1992 2

原创 R语言-检验正态性

在R中,检验正态性的方法有shapiro-wilk(w检验)、QQ图来检验,本次以QQ图为例讲解,以后有时间再不全w检验。下图是QQ图,有比较高大的离群点,需要剔除。train_data1<-raw[setdiff(train_ind,c(14,1)),] #使用这样的方法#...

2024-01-24 16:41:25 2850 1

原创 R语言ggplot画双坐标-柱状图、折线图

ggplot画双坐标,主坐标柱形图,次坐标折线图

2022-12-28 19:01:14 4196 1

原创 git在push时报错:! [rejected] master -> master (non-fast-forward) error: failed to push some refs to

git push 提交错误

2022-12-26 17:35:20 271

原创 数据分析总结

数据分析,技能

2022-12-23 10:32:53 186

原创 生存分析-R

生存曲线-手动计算与代码计算

2022-12-22 20:13:21 236

原创 读取文件,invalid input found on input connection

read.table及read.csv出现如下问题原因是文件中含有中文,文件编码不匹配造成的。解决办法:在notepad中将文件转为utf-8编码,再重新执行下语句就可以了。...

2019-09-06 10:53:59 8823 1

原创 机器学习:R实现k-means算法做画像

K-means算法结论:K-means算法原理:k-means算法R实现:

2019-04-18 21:41:48 1083

原创 R语言进行数据预处理

在做机器学习之前需要对数据进行数据预处理,下面介绍几种数据预处理的方法,配合着前面讲到的数据结构看会比较好。数据预处理有四个任务:数据清洗、数据集成、数据变换、数据规约。...

2019-04-15 18:32:11 4769

原创 R数据结构

1. R语言介绍R是一种为统计计算和绘图而生的语言和环境,是一套开元的数据分析解决方案,最主要特点是:1)开源2)几乎任何类型的数据分析工作用R可以完成2.R基本概念用R来处理数据,首先需要了解数据结构,数据结构说白了就是用于存储数据的结构。R总共是5中数据结构:向量、矩阵、数组、数据框、列表。这5个包含范围逐渐扩大,如多个向量可以组成矩阵。1)向量存储数值、字符、逻辑型的一维数组,...

2019-04-14 15:49:29 2213 1

原创 R语言获取中文文件

使用R读取文件R常用的读取文件的方式是read.csv、read.table、read.xlsx,分别对应csv、txt、xlxs格式的文件,一般情况下使用txt、csv格式的文件比较多,xlxs我是未成功被R读取到过,若将xlsx变为csv格式的时候,需要将xlsx另存为csv格式,不是该个后缀那么简单。在读取文件的时候...

2019-04-13 00:17:46 7501 4

原创 ubuntu16.04 装kvm过程

我们在vmware workstation安装的ubuntu16.04,欲在此系统中安装kvm。 首先确定系统可以上网,选择网卡网路适配器为NAT方式即可连接互联网。 确定CPU是否有虚拟化的功能,一般情况下都有。确定在vmware workstation中是否开启 开启 cpu的虚拟化,在设置中,点击处理器,把下面两项都打上对勾:1.进入系统查看CPU是否支持硬件虚拟化 egrep -c

2017-10-31 10:53:38 942

原创 linux系统启动经历的过程

当我们点击开机按钮后到进入页面,这个过程发生了什么呢?总体的过程如下: 开机—BIOS系统—主引导记录—操作系统,linux和windows真正出现分歧的是在MBR之后。现在先讲一下linux。 在这个过程中,总结一下三个部分的主要工作。 BIOS系统:硬件检测,查找加载磁盘的MBR。 主引导系统:MBR会将控制权转交给系统启动程序引导系统启动。 操作系统:内核启动。 1.BIOS系统

2017-08-15 15:02:38 313

原创 MAC OS装win10

好久不写博客了,前几天给MAC OS系统装了个win10系统,早就听说过给MAC OS装系统是非常麻烦的一件事儿,因为MAC OS没有BIOS,然而真正实践起来并没有那么难,截图就不发了,只说安装步骤。 最重要的是,一定要联网,网速尽量有保证,不难会很慢,因为会现在一些驱动啥的。 1.在MAC OS中找到BootCamp,要是没有的话,请去官网下载。Boot Camp 是苹果公司的软件,它可以让

2017-08-14 14:41:00 5529

原创 布隆滤波器的改进

好久不更新博客了,最近一段时间在看布隆滤波器及其改进方案,下面我就基本的方案与我所用到的改进策略写一写,有问题的地方还请各位指导一下。 1.基本布隆滤波器 基本的布隆滤波器是由布隆(Burton Howard Bloom)在1970年提出的。它实际上是由一个很长的二进制向量和一系列随机映射函数组成,布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,

2017-07-28 09:03:20 716

原创 访问控制技术

因为我所参与的项目涉及到访问控制,所以总结出几种比较常见访问控制以及openstack内部的访问控制。 1.访问列表 2.基于角色 3.基于属性(ABAC) 基于属性的访问控制是以决策过程中涉及的相关实体的属性(而不仅仅是标识)为基础涉及的一种访问控制机制。它能够根据相关实体属性的动态变化,适时更新访问控制决策,从而提供一种细粒度、更灵活的访问控制方法。 ABAC利用现有实体(用户、资源、

2017-06-12 09:45:31 1225

原创 ubuntu 安装

第二章 Ubuntu安装 用devstack安装openstack需要使用linux的server版。实验室的电脑大概是10年前的,相当老旧,抱着试一试的态度开始了安装之路。 1. 原双系统重装ubuntu 这台机器以前装过win7和ubuntu 14.04的桌面版,现在需要先删除掉原先ubuntu的桌面版,再安装server版。 1.1 删除原ubuntu 桌面版 上上次也是想删除ub

2017-06-10 21:31:08 251

原创 Openstack的学习之路

Openstack的学习之路-起步由于项目的需要,开始使用openstack,以前也看过,甚至把官网的材料翻译了一遍,然而效果甚微。本身不是计算机专业的,学习起来比较盲目,还好现在有人指导,方向明朗了,特此记下我的学习之路,希望能为你提供下参考。 我要做的最终结果是一个监听程序,首先,分为4大步走。 1.学习架构 2.安装openstack 3.看源码 4.编程1.学习架构 Openst

2017-06-08 11:27:49 444

手动计算生存曲线的excel

计算生存曲线的过程,与r计算结果吻合

2022-12-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除