有思想 更有信仰
就等你来关注
作者 | 陈青山
编辑 | 张园媛
统计分析的数据库中,研究对象的每项观察指标都可以看作是一个分析的变量。由于统计学是一门关于结果变量与影响变量(简称变量与变量)间关系分析的科学,那么变量的性质和类型就是统计分析中选择不同统计方法的依据。所以,分清楚变量的性质和类型是正确选择统计方法的基础和关键。
变量(variable)即观察变量,也称变化的量,实际上就是观察指标,一般特指用于数学、统计或软件计算的分析指标。例如,小学生身体生长发育的身高、体重指标,在统计计算时,分别称为身高变量、体重变量。变量值(variable value)指某一变量的观察值或测量结果。如,测得某个小学生的身高1.20m、体重30kg,可分别称该小学生身高的变量值为1.20m、体重的变量值为30kg。
变量的性质是指变量是否影响其它变量或是否受到其它变量的影响,分为影响变量和结果变量。影响变量(affect variable),也称自变量(independent variable),是指自身变化并影响结果变量变化的量;结果变量(outcome variable),又称因变量(dependent variable)或反应变量(response variable),是指受到影响变量的影响而变化的量,看作是影响变量变化的结果。
如果分析某地小学生体重依赖于年龄的变化规律,那么年龄可看作是影响变量,体重则为结果变量;如果分析不同性别之间身高是否存在统计学差异,那么性别是影响变量,身高是结果变量。
从数据库、数据分析的角度来看,变量反映数据库数据不同指标间的内在数量关系,变量的性质由不同的研究目的所决定。一般而言,那些相对固有的、不易改变的指标(如性别、籍贯等),或易于被人为控制的处理因素(如实验分组、疫苗接种与否等)作为影响变量或影响因素;而那些容易变化,或较难确定的观察效应或结局指标(如疗效、患病与否等)作为结果变量,看成是最终观察或反应的结果。
变量的类型分为分类变量和数值变量两大类。
分类变量(categorical variable),又称定性变量(qualitative variable),是指用定性方法确定的、说明观察单位某项属性特征或类别的指标。在有关分类变量的统计分析中,由于选择的统计方法与分类变量的分类个数、分类类别之间是否存在等级或程度差异等有关,因此根据分类变量的分类项数和各项数间有无等级程度差异分为二项分类变量(包括二项无序分类变量和二项有序分类变量)、多项无序分类变量、多项有序分类变量,见表5-1。
数值变量(numerical variable),又称定量变量(quantitative variable),是指用定量方法测定的、具有数值大小(高低或多少)的指标,变量值一般有度量衡单位,可以带小数点,如身高、体重、血压等。
可见,从应用统计分析选择统计方法的角度考虑,变量可分为两大类(数值变量、分类变量)4种(小)类型:二项分类变量、多项无序分类变量、多项有序分类变量和数值变量。
此外注意,不同类型变量可有下列顺序的转换:数值变量→多项有序分类变量→多项无序分类变量→二项分类变量,称为降级转换,简称降级。如某科学生的考试成绩用具体分数表示(张三95分、李四88.5分……)是数值变量;当≧90为优,≧75且
需要理解的是,这种降级转换过程会不断丧失变量本身藴藏的数据信息,导致统计分析过程中假阴性结果的增加。至于逆向转换即升级转换,实际应用中不可行,亦不建议采用。
- END -
1.
“一句话”让你理解什么是单一变量的假设检验|
陈青山
2.统计分析需要明确研究目的|陈青山
3.一种新型的应用统计学教学方法——PDTR教学模式|陈青山
专委会原创作品 | 尽情分享朋友圈 | 转载请联系授权
留言 点赞 也是一种支持
The more we share, the more we have
领取专属 10元无门槛券
私享最新 技术干货