
SPSS
文章平均质量分 67
dogdogggg
这个作者很懒,什么都没留下…
展开
-
SPSS(基础篇09)--拆分数据文件
拆分数据文件文章目录拆分数据文件前言1. 在原始文件中拆分,1.1 拆分文件--‘比较组’1.2. 拆分文件--‘按组来组织输出’1.3. 其它用法2. 直接存储为多层(拆分结果单独存为文件)前言导语:拆分文件是一种很常见的操作,比如:一个数据集有北京、上海、广州的相关信息,我们想要对三个城市做相同的分析,比如:分别检验三个城市的性别之间有没有差异。操作:可以将数据集中的北、上、广数据分别筛选出来,分别做三次操作。在SPSS里,则可用‘拆分文件’,将一个数据集拆成三块,只有做一次分析。拆分原创 2021-02-04 21:28:01 · 15106 阅读 · 1 评论 -
SPSS(基础篇09)--个案排序与变量排序
个案排序与变量排序文章目录个案排序与变量排序前言1. 案例排序(个案排序)2. 变量排序3. 新增属性前言排序的用途:将案例按ID变量排序,有利于查找、修改;将某个变量按升序或降序排列,可以非常容易的发现输入错误,因为它们往往就是最大/最小值;缺失值在排序中会排在最小值前面,可以通过排序的方法发现哪些记录为缺失。排序的实现:数据视图,变量名处右键菜单。【简单排序:单变量、多变量的同种排序规则(同为升序或降序)】数据–> 个案排序。【多变量的复杂排序(比如:一部分变量升序,一部分原创 2021-02-04 16:16:03 · 7237 阅读 · 0 评论 -
SPSS(基础篇08)--定位指定特征的案例
定位指定特征的案例文章目录定位指定特征的案例前言1. 简单的定位--排序与查找2.1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考1. 简单的定位–排序与查找对于简单的定位,比如:需要找60岁以上的人,通过将年龄变量S3进行升序排序,即可定位。但是,一般在项目中,尽量不要改变个案排序。关于‘查找与原创 2021-02-04 14:43:16 · 766 阅读 · 0 评论 -
SPSS(基础篇07)--随机数生成器
随机数生成器文章目录随机数生成器前言COMPUTE的函数随机数生成器--设定随机种子前言概述:真随机数:(1)完全不可重现、不可预测的数据序列;(2)实际上,只要给定了边界条件,真随机数就不存在,但是可以尽量逼近。【在保险学中,就是尽量逼近真随机数】伪随机数:(1)在给定的随机二进制序列中,1的数量大致等于0的数量,满足这类要求的数字,人类“一眼看上去”是随机的。【这在实际中已经够用】(2)这些数列是“似乎”随机的数,实际上它们是通过一个固定的、可以重复的计算方法产生的数字序列,并不是真正的原创 2021-02-03 16:46:20 · 9366 阅读 · 1 评论 -
SPSS(基础篇06)--将分类变量转换为哑变量组
将分类变量转换为哑变量组文章目录将分类变量转换为哑变量组前言1. 创建哑变量(虚拟变量)的基本操作--一个变量2. 创建哑变量(虚拟变量)的基本操作--多个变量3. 考虑交互作用前言哑变量(DummyVariable)引入哑变量的目的:将不能够定量处理的变量进行量化,在线性回归分析中引入哑变量的目的是,可以考察定性因素对因变量的影响;理解:它是人为虚设的变量,通常取值为0或1,来反映某个变量的不同属性。对于有n个分类属性的自变量,通常需要选取1个分类作为参照,因此可以产生n-1个哑变量;例原创 2021-02-03 14:30:37 · 12863 阅读 · 0 评论 -
SPSS(基础篇05)--连续变量数值的最优分段
连续变量数值的最优分段文章目录连续变量数值的最优分段前言1. 最优分箱(出现了问题)前言最优分箱:可视分箱,操作简单,适合如04节所说的简单分箱方法,比如:等距、等量、标准差。可视分箱没有考虑建模时怎样最优化,因此在SPSS中推出了最优分箱。对前述(04节)的可视化分段的进一步自动化;用于 建模分析前,对连续变量的最优分段方式进行探索(变量如何切,能使得建模效果达到最好);根据某些作为“关键指示变量”的分类变量(因变量),将原有的一个或多个连续变量按照==该分类变量 类间差异最大化(对原创 2021-02-02 21:09:28 · 3059 阅读 · 1 评论 -
SPSS(基础篇04)--连续变量的可视化分段(分箱)
连续变量的可视化分段文章目录连续变量的可视化分段前言1.数值变量的离散化分段(分箱)1.1 可视分箱--等宽(等距)分割1.2 可视分箱--等量分割1.3 可视分箱--标准差范围分割2. 可视分箱的其它用法前言分段意义:符合实际情况,比如,在临床医学中,将年龄分为老、中、青三类。细致的刻画出变量与因变量的关联,比如,有些疾病的发生与年龄不是线性的关系,是曲线或者其它关系,此时将年龄变量分为n分段,有利于刻画自变量和因变量的关系。上一节的重编码过程其实也可以用于分箱过程,它可以随意分段,但是原创 2021-02-02 15:48:07 · 7792 阅读 · 0 评论 -
SPSS(基础篇03)--自动重编码与指定数值查找
自动重编码与制定数值查找基于RECODE(重编码)的衍生用法文章目录自动重编码与制定数值查找1. 变量自动重新编码2. 指定数值的查找与计数1. 变量自动重新编码 * 可用于将字符变量转换为从1开始的数值变量Steps: 转换–> 自动重新编码–> 选中S3,新名称:S3new【可以选择编码起点,是否对所有变量使用编码】–> 确定。Result: 年龄从18-65岁,从1开始编码到48.Notice: 如果编码起点为最高值,那么从65岁开始编码为1,到18岁编码为48.原创 2021-01-31 21:06:33 · 2497 阅读 · 0 评论 -
SPSS(基础篇02)--已有变量值的重编码
已有变量值的重编码***注意***:在变量赋值时,用上一节的方法,会将缺失值命为1。提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录已有变量值的重编码前言一、重编码(Recode)二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、重编码(Recode)可直原创 2021-01-31 19:57:45 · 8404 阅读 · 0 评论 -
SPSS(基础篇01)--变量赋值(Compute)
变量赋值(Compute)计算新变量 or 给老变量赋值检查函数组Compute复杂用法工作间介绍1、计算新变量 OR 给老变量赋值例如:样本CCSS.Sample.sav. 其变量信息如下图。目的:将年龄变量S3重新赋值,18-34岁(青年)—>135-54岁(中年)—>255-65岁(老年)—>3并存为新变量TS3.Step1: Transform–计算变量–目标变量:TS3=1–确认此时,样本中会出现一个新的变量TS3,且数值原创 2021-01-21 17:29:57 · 21596 阅读 · 0 评论