前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >类别变量的分析

类别变量的分析

作者头像
herain
发布2022-04-27 15:48:38
发布2022-04-27 15:48:38
77700
代码可运行
举报
文章被收录于专栏:数据指象数据指象
运行总次数:0
代码可运行

1,问题与思考:网购满意度与地区有关系

  • 如果检验两个类别变量网购满意度,地区是否存在关系?
  • 如果存在,关系强度有多大?

拟合合优度检验使用的统计量:

2,具体案例分析

第一步:提出假设

代码语言:javascript
代码运行次数:0
运行
复制
Ho:满意度与地区独立
H1:满意度与地区不独立

第二步:计算期望频数和检验统计量:

要计算检验统计量,关键是计算期望频数,如果两个变量独立,则两个变量各类别交叉项的概率可以依据独立时间的概率乘法公式求得。

设给定单元格所在行的合计频数为RT,所在列的合计频数为CT,任意给定单元格(比如第i行第j列的单元格:RiCj)的概率为:

概率乘以总观察频数(即样本量n),可以得到任意单元格的期望频数为:

按照上面的公式可以计算出如下表格,合计的出统计量的值。:

R实战模拟:

检验注意事项:

代码语言:javascript
代码运行次数:0
运行
复制
1,仅有两个单元格,单元格最小期望不应小于5
2,两个以上单元格,期望小于5的单元格不能超过20%

3,两个类别变量相关性强度的度量

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据指象 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档