在上一期中,我们介绍了几种变量整理的常用操作(SPSS教程 | 第3期. 数据大杂烩?别怕,掌握SPSS数据整理的基本策略!)。本期将会为大家介绍文件合并的方法。文件合并分为两种形式,一种为个案合并,一种为变量合并。个案合并指的是数据集中的数据纵向相加,如将男性和女性的数据合并;而变量合并指的是数据集中的数据横向相加,如一组人群的身高数据和体重数据合并。文件合并可以帮助我们整理不同时期收集的多批数据,是一项非常有用的技能,而SPSS这一软件也让文件合并这一过程变得清晰直观。大家一起来学习相关操作吧!
1. 个案合并操作详解
打开待合并的数据集subject 1和subject 2.可以发现两个数据集囊括了不同的人群,但包含相同变量。
要注意!!!在这一示例中,心率这一变量在subject 1中由hr表示,subject 2中由HR0表示。
数据集subject 1(左)和subject 2(右)
在数据集subject 1点击【数据】-【合并文件】-【添加个案】。
选择subject 2.点击【继续】。
选择变量:【配对】-勾选【指示个案源变量】-点击【确定】
右侧的【新的活动数据集中的变量】显示了需要配对的变量,而左侧的【非成对变量】显示了未能匹配的变量,这时需要我们仔细挑选,看看有没有变量能进行配对。鉴于hr和HR0均代表心率,只是在不同数据集中拥有不用名字,所以这两个变量可以进行配对,两个变量合并后会显示在一列数据中。如果不配对,这两个变量合并后变成两列,最终会出现缺失值。
勾选【指示个案源变量】后,来源于不同数据集的个案在【source01】一列会被打上不同的数字标记。
此时个案的合并就大功告成啦,subject 1这一数据集中合并了subject 2的所有数据,HR0这一列数据也顺利合并在hr这一变量下。最后一列的source01代表数据集来源,其中0来源于subject 1数据集,1来源于subject 2数据集。
合并后的结果
2. 变量合并操作详解
变量合并需要两个数据集至少存在一个共同的变量,即为键变量,且这个键变量包含的数值在两个数据集中需要有一定重合或者完全一致。在示例数据集subject 3和subject 4中,【subjectno】就是我们变量合并的键变量。
打开数据集subject 3和subject 4.两个数据集包含了同一批人群,但除subjectno外,囊括的变量是完全不同的。
数据集subject 3(左)和subject 4(右)
在数据集subject 3中,点击【数据】-【合并文件】-【添加变量】。
subject 4.点击【继续】。
要注意:对话框有两个部分,分别是【合并方法】和【变量】。
在【合并方法】部分,我们勾选【基于键值的一对一合并】,勾选【在合并前按键值对文件进行排序】。
在【变量】部分,我们根据【包含的变量】和【排除的变量】两个数据框筛选最后数据库需要的变量,最后点击【确定】。
在最后输出的结果里,我们可以发现subject 4中的变量合并进了subject 3数据集,因为两个数据集【subjectno】这一项的数据完全一致,所以最终没有产生缺失值,达到了我们想要的结果。
合并后的结果
那么这就是本期的全部内容啦,你学会了吗?下一期,我们将为大家讲解SPSS中如何对变量进行重编码。大家对于推送内容有任何问题或建议可以在公众号菜单栏“更多--读者的话”栏目中提出,我们会尽快回复!