参数检验:是推断统计的重要组成部分,传统上采用抽样研究的方法,从总体中随机抽取一定数量的样本进行研究,以此来推断总体,当总体分布已知的情况下,利用样本数据对总体包含的参数进行推断的问题,就是参数检验,参数检验不仅能够对一个总体的参数进行推断,还能够比较两个或多个总体的参数,在实际问题研究中,对于总体分布未知或无法准确的假设时,就用非参数性检验,这个我们之后会继续学习。 参数检验中,包括平均值检验、单样本T检验、两独立样本T检验和配对样本的T检验。 大家好,今天我们一起先学习平均值检验,是计算一个或多个自变量类别中,因变量的值组平均值和相关的单变量的统计,也可以通过比较两个样本的均值,来判断两个样本的均值是否相等,零假设是两个样本的均值有显著差异。 话不多说,直接上操纵。 原始数据 原始数据 操作: 1、导入数据 2、编辑变量 性别:1表示男,2表示女 定义性别变量:变量视图→值标签 性别值标签 年龄段:1表示“<35”,2表示“35-44”,3表示“45-64”,4表示“65 ” 定义年龄段变量: 转换→重新编码为不同变量→输出变量(名称)→旧值和新值→确定旧值和新值对应关系→继续→确定 重新编码为不同变量 不同变量名称 重新编码对应值 变量视图→值标签 年龄段值标签 研究问题:通过平均值检验,研究不同性别之间的储蓄金额是否存在显著差异 3、操作:分析→比较平均值→均值 因变量列表:储蓄金额 自变量列表:性别 选项→Anova表和eta、线性相关检验→继续 平均值检验 4、结果输出 ANOVA 表a 平方和 df 均方 F 显著性 储蓄金额 * 性别 组间 (组合) 33931568495.762 1 33931568495.762 .429 .513 组内 18093029252322.832 229 79008861363.855 总计 18126960820818.594 230 a. 少于三组,无法计算 储蓄金额 * 性别 的线性度量。 其中,显著性为0.513>0.05,说明性别对储蓄金额无显著性差异。 同理,可以看不同年龄段对储蓄金额是否有显著差异 ANOVA 表 平方和 df 均方 F 显著性 储蓄金额 * 年龄段 组间 (组合) 357818045639.858 3 119272681879.953 1.524 .209 线性 20916585451.104 1 20916585451.104 .267 .606 线性偏差 336901460188.754 2 168450730094.377 2.152 .119 组内 17769142775178.734 227 78278162005.193 总计 18126960820818.594 230 通过上表可知,显著性均大于0.05,说明不同年龄段对储蓄金额无显著性差异 相关性度量 R R 方 Eta Eta 方 储蓄金额 * 年龄段 -.034 .001 .140 .020 上表的相关性度量,可知R方为0.001,Eta值为0.140,两个值都是越接近1,说明两者之间的相关性越强,相反越弱,因此,可知年龄段和储蓄金额之间的相关性非常弱,即无相关性。 今天的数据分析就学习到这里,有任何问题可以评论留言,如有想看的操作讲解,可以私信我。谢谢大家的点赞、和转发。
|