Loading [MathJax]/jax/input/TeX/jax.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >🧐 pwr | 谁说样本量计算是个老大难问题!?(三)(配对样本与非等比样本篇)

🧐 pwr | 谁说样本量计算是个老大难问题!?(三)(配对样本与非等比样本篇)

作者头像
生信漫卷
发布于 2023-02-24 06:25:32
发布于 2023-02-24 06:25:32
1K00
代码可运行
举报
运行总次数:0
代码可运行

1写在前面

之前我们介绍的基于发生率或者均值进行样本量计算的方法,但都是在组间进行计算。🤔 有的时候我们需要获取组内变化,进行样本量计算。🤫 常见的就是配对样本,比如相同受试者进行多个时间点的观察,如下图:👇

本期我们就介绍一下如何估算配对样本样本量吧。🥰

2用到的包

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
rm(list = ls())
library(pwr)
library(tidyverse)

3研究假设

还是假设我们正在进行一项前瞻性研究,测量一组开始节食患者的体重变化。🧐 我们先提出研究假设,H0H1 :👇

  • H0 : 该组患者基线和节食3周后体重的平均变化没有差异。
  • H1 : 该组患者基线和节食3周后体重的平均变化存在差异。

4计算样本量

现在我们假设需要招募足够多的受试者,以检测节食开始3周后体重减轻了5磅。⤵️ 假设基线平均体重为130磅标准差11,节食3周后,预期平均体重为125磅标准差12。🤪

4.1 计算Cohen’s d

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mu_x <- 130     ### Baseline体重均值
mu_y <- 125     ### diet后体重均值

sd_x <- 11      ### Basline体重SD
sd_y <- 12      ### diet后体重SD

rho <- 0.5      ### diet前后相关性

sd_z <- sqrt(sd_x^2 + sd_y^2 - 2*rho*sd_x*sd_y)
  
d_z <- abs(mu_x - mu_y) / sd_z
d_z

Note! 顺便说一下,有时候我们不知道这个相关性rho是多少,可以默认设置成0.5。🤓


4.2 pwr计算样本量

现在,我们可以利用pwr包计算节食前后平均体重变化差(5磅)所需的样本量,具有 80%power0.05显著性。🥳 这里我们可以看到需要44例受试者,进行2次体重检测。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
n.paired <- pwr.t.test(d = d_z, power = 0.80, sig.level = 0.05, type = "paired")
n.paired

5Power Analysis

接着是效力分析Power Analysis),配对t检验样本量变化对power的影响吧。🤜 与之前的示例一样,随着我们增加样本量,估算的不确定性也随之减小。🧐

通过减少这种不确定性,我们在估算中更好地避免了II类错误。😙

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
n_z <- seq(1, 80, 5)
n_z.change <- pwr.t.test(d = d_z, n = n_z, sig.level = 0.05, type = "paired")
n_z.change.df <- data.frame(n_z, power = n_z.change$power * 100)
n_z.change.df

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
plot(n_z.change.df$n, 
     n_z.change.df$power, 
     type = "b", 
     xlab = "Sample size, n", 
     ylab = "Power (%)")

6改变一下

让我们看看当我们改变effect sizepower如何变化。😗 接着我们改一下患者节食导致的平均体重变化,看看减少到100磅power如何变化。😂 这里我们从50磅开始,逐渐增加到130磅,间隔5磅。😉

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mu_y <- seq(50, 130, 5)

d_z <- abs(mu_x - mu_y) / sd_z

n_z.change <- pwr.t.test(d = d_z, n = 44, sig.level = 0.05)
n_z.change.df <- data.frame(d_z, power = n_z.change$power * 100)
n_z.change.df

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
plot(n_z.change.df$d_z, 
     n_z.change.df$power, 
     type = "b", 
     xlab = "Cohen's d_z", 
     ylab = "Power (%)",
     xlim = c(0, 2))

7不等比样本量的Power Analysis

有时候我们做的研究,两组并不是等比的,这个时候就非常需要做Power Analysis了。😘

假设我们现在准备做一个回顾性研究Retrospective study),其中患者分别接受了Treatment ATreatment B。🤨 Treatment A130名患者 (nA = 130),Treatment B120名患者 (nB = 120)。😜 在Treatment A中,HbA1c的平均变化为1.5%,标准差为1.25%。🤫 在Treatment B中,HbA1c的平均变化为1.4%,标准差为1.01%。🫢

7.1 计算并合标准偏差

首先我们计算一下并合标准偏差(pooled standard deviation, σpooled)。😂

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sd1 <- 1.25
sd2 <- 1.01
sd_pooled <- sqrt((sd1^2 +sd2^2) / 2)
sd_pooled

7.2 计算Cohen’s d

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mu1 <- 1.5
mu2 <- 1.4
d <- (mu1 - mu2) / sd_pooled
d

7.3 Power Analysis

这个时候我们只有11%power来可以发现HbA1c与基线相比变化0.10%或更大的差异。🤠 也就是说在nA = 130nB = 120以及显着性水平为0.05的情况下,我们是发现不了HbA1c变化与基线的0.10%或更大的差异。🫠

这个时候我们如果还要做这个研究,就很可能会出现II类错误。😅

解决这个问题的唯一方法是招募更多患者或通过放宽纳入标准来扩大样本量。🤪

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
n1 <- 130
n2 <- 120

power.diff_n <- pwr.t2n.test(d = d, n1 = n1, n2 = n2, sig.level = 0.05)
power.diff_n

8补充一下

8.1 其他功能

这里我们补充pwr包里的其他功能,不过可能不是特别常用,主要还是看你的研究设计。🤩

Function

Power Calculation For

pwr.2p.test

two proportions equal n

pwr.2p2n.test

two proportions unequal n

pwr.anova.test

balanced one way anova

pwr.chisq.test

chi square test

pwr.f2.test

general linear model

pwr.p.test

proportion one sample

pwr.r.test

correlation

pwr.t.test

t-tests (one sample, 2 samples, paired)

pwr.r.test

t-test (two samples with unequal n)


8.2 Effect size

确定Effect size有时候真的特别难,这里提供一些经验性的参考吧。🥸

Effect size

Cohen’s w

Small

0.10

Medium

0.30

Large

0.50


最后祝大家早日不卷!~


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-01-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信漫卷 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
🧐 pwr | 谁说样本量计算是个老大难问题!?(二)(独立样本均值篇)
1写在前面 上次介绍了两组发生率的样本量计算方法,通过pwr包进行计算非常简单,可以有效地减少我们的工作量。😘 有时候我们想比较两组之间的均值,如何计算样本量又一次成了老大难问题。🤒 本期我们还是基于pwr包,试一下通过两组的均值进行样本量的估算。😏 2用到的包 rm(list = ls()) library(pwr) library(tidyverse) 3研究假设 还是假设我们正在进行一项RCT研究,旨在评估Treatment A和Treatment B之间血红蛋白A1c (HbA1c)相对于基线的平
生信漫卷
2023/02/24
7710
🧐 pwr | 谁说样本量计算是个老大难问题!?(二)(独立样本均值篇)
🧐 pwr | 谁说样本量计算是个老大难问题!?(一)(分类变量篇)
1写在前面 估算前瞻性研究的样本量是我们在招募受试者之前首先要做的事情之一。😘 招募受试者太少会无法得到准确的答案,招募的太多又是巨大的浪费,所以需要估算最佳的受试者数量。🧐 本期我们介绍一下如何使用pwr包进行样本量的估算。😏 2用到的包 rm(list = ls()) library(pwr) library(tidyverse) 3研究假设 假设我们准备进行一个RCT研究,研究Treatment A和Treatment B的疗效,结局事件为Response或No response的二分类结局。🤫 那
生信漫卷
2023/02/24
5800
🧐 pwr | 谁说样本量计算是个老大难问题!?(一)(分类变量篇)
R语言和医学统计学系列:样本量计算
样本量计算也是医学统计学中的一块重要内容,但是在课本中并没有详细介绍,今天我们说一下常见的研究设计的样本量计算。我使用的课本是孙振球主编的《医学统计学》第4版,封面如下:
医学和生信笔记
2022/11/15
2.4K0
R语言和医学统计学系列:样本量计算
数据科学19 | 统计推断-t分布置信区间
当样本量足够大,总体标准差已知时,根据中心极限定理可以用标准正态分布估计总体均值;t分布适用于小样本估计呈正态分布的总体均值。
王诗翔呀
2020/07/03
3.9K0
数据科学19 | 统计推断-t分布置信区间
AB试验(六)A/B实验常见知识点的Python计算
前面理论知识上提到了很多的知识点需要计算,作为一个实用主义的博主,怎么可以忍受空谈呢?所以本期就给大家分享如何利用Python对这些知识点进行计算。
HsuHeinrich
2023/10/25
9120
AB试验(六)A/B实验常见知识点的Python计算
如何用血常规发 Nature,临床常见指标的深度挖掘
生信菜鸟团
2025/02/03
1620
如何用血常规发 Nature,临床常见指标的深度挖掘
Molecular Psychiatry:抑郁症患者经ECT治疗后齿状回增大的7T磁共振成像研究
摘要:ECT(电休克)被认为是治疗抑郁最为有效的方式,然而其作用机制仍不清楚。有关动物ECT相关研究中发现海马齿状回存在神经元再生现象。在人类研究中也有报道指出海马增大,但由于常规MRI技术难以对其亚区进行准确的测量。如果人类海马体积的增大是由神经元再生引起的,那么它应该只存在于齿状回中,事实上其它过程(如血管生成、突触生成)也会影响其它海马亚区。
用户1279583
2019/06/06
8830
Molecular Psychiatry:抑郁症患者经ECT治疗后齿状回增大的7T磁共振成像研究
深度好文 | 探索 Scipy 与统计分析基础
云朵君推荐 本文部分内容仅展示部分核心代码,本文提供含完整代码的完整PDF版本下载,获取方式:关注公众号 「数据STUDIO」并回复【210512】获取。若你对代码不感兴趣,直接略过,不影响阅读。
数据STUDIO
2021/06/24
3.1K0
数据分析:假设检验方法汇总及R代码实现
显著性检验方法,通常也被称为假设检验方法,是统计学中用于评估样本统计量是否显著不同于某个假设值的一种重要工具。以下是假设检验方法使用时需要考虑的三个条件的书面化表述:
生信学习者
2024/06/20
8800
数据分析:假设检验方法汇总及R代码实现
斯坦福 Stats60:21 世纪的统计学:第十章到第十四章
在上一章中,我们讨论了如何使用数据来检验假设。这些方法提供了一个二元答案:我们要么拒绝要么未能拒绝零假设。然而,这种决定忽略了一些重要的问题。首先,我们想知道答案有多大的不确定性(无论结果如何)。此外,有时我们没有一个明确的零假设,因此我们想看到与数据一致的估计范围。其次,我们想知道效应实际上有多大,因为正如我们在上一章中的减重示例中看到的,统计上显著的效应未必是实际上重要的效应。
ApacheCN_飞龙
2024/01/16
3010
斯坦福 Stats60:21 世纪的统计学:第十章到第十四章
Diabetes:糖尿病周围神经病变患者的初级躯体感觉皮层的结构及功能异常
请点击上面“思影科技”四个字,选择关注我们,思影科技专注于脑影像数据处理,涵盖(fMRI,结构像,DTI,ASL,EEG/ERP,FNIRS,眼动)等,希望专业的内容可以给关注者带来帮助,欢迎留言讨论,也欢迎参加思影科技的其他课程。(文末点击浏览)
用户1279583
2019/07/30
6360
Diabetes:糖尿病周围神经病变患者的初级躯体感觉皮层的结构及功能异常
浅谈一款进阶软件R的实际运用
发现这款软件在小样本,常见的临床问题中可以快速的解决我们大部分问题,其简单操作界面以及菜单式操作方式成为很多人选择它的理由。但是,当我们遇到某些大数据,或者复杂统计运算时,如果还拿SPSS作为自己的救命稻草,那可能就是一出损招了,甚至会一度click到想要剁手。
微点
2019/05/11
1.1K0
PNAS:整合抑郁症的分子、细胞和皮层神经影像特征
抑郁症产生于生物系统的复杂相互作用,跨越基因和分子到细胞、脑网络和行为。为了确定不同的神经生物学过程是如何联合起来导致抑郁症的,我们需要一种多尺度的方法,包括对大脑结构和功能的测量,以及遗传和细胞特异性的转录数据。在这里,我们研究了三个群组影像数据集中与抑郁和负性情绪相关的大脑解剖(皮层厚度)和功能(功能变异、全脑功能连接),包括:英国生物银行(UK Biobank)、大脑基因组超结构项目(Brain Genomics Superstruct Project)和Meta分析增强神经影像数据库(ENIGMA;总被试数n≥23,723)。整合的分析包括皮层基因表达、死后患者转录数据、抑郁症全基因组关联分析(GWAS)和单细胞基因转录。在这三个独立的数据集中,抑郁和负面情绪的神经影像相关物是一致的。将体外基因下调与体内神经影像联系起来,我们发现抑郁症影像表型的转录组相关物追踪了抑郁症患者死后皮层样本中的基因下调。对单细胞和Allen人脑图谱表达数据的综合分析显示,抑郁症体内影像和体外皮层基因失调的细胞相关物是生长抑素(SST)中间神经元和星形胶质细胞。GWAS驱动的抑郁症多基因风险富集在中间神经元的表达基因,而不是胶质细胞,这为我们的观察提供了一致的证据。为了强调多尺度方法的转化潜力,与抑郁症相关的大脑功能和结构的转录相关物富集于抑郁症相关的分子通路。这些发现将特定的基因、细胞类别和生物学通路与抑郁症的体内神经影像表型联系了起来。
悦影科技
2022/07/11
1K0
因果推断与反事实预测——利用DML进行价格弹性计算(二十四)
经济学课程里谈到价格需求弹性,描述需求数量随商品价格的变动而变化的弹性。价格一般不直接影响需求,而是被用户决策相关的中间变量所中介作用。假设 Q 为某个商品的需求的数量,P 为该商品的价格,则计算需求的价格弹性为,
悟乙己
2022/05/09
4.2K0
因果推断与反事实预测——利用DML进行价格弹性计算(二十四)
统计学_显著性检验综述
比如研究血型与性格是否独立,如果性格a的血型比例与性格b的血型比例相同,那么统计上独立。
用户1147754
2019/05/26
2.5K0
机器学习时代,神经科学家如何阅读和解码人类的思想
机器之心分析师网络 作者:Jiying 编辑:Joni 这篇文章围绕机器学习(ML)和功能性磁共振成像(fMRI)的应用问题,以三篇最新的研究型论文为基础,探讨基于统计学中 ML 的 fMRI 分析方法。 本文主要讨论的是机器学习(ML)和功能性磁共振成像(fMRI)的应用问题。fMRI 主要用来检测人在进行各种脑神经活动时(包括运动、语言、记忆、认知、情感、听觉、视觉和触觉等)脑部皮层的磁力共振讯号变化,配合在人脑皮层中枢功能区定位,就可研究人脑思维进行的轨迹,揭示人脑奥秘。其基本原理是利用 MRI 来
机器之心
2023/03/29
5170
机器学习时代,神经科学家如何阅读和解码人类的思想
斯坦福 Stats60:21 世纪的统计学:第十五章到第十八章
我们已经遇到了许多情况,我们想要询问样本均值的问题。在本章中,我们将更深入地探讨我们可以比较不同组均值的各种方法。
ApacheCN_飞龙
2024/01/16
2940
斯坦福 Stats60:21 世纪的统计学:第十五章到第十八章
经颅磁刺激治疗老年抑郁症
背景:难治性老年抑郁症(geriatric depression, GD)的流行表明,需要在保持老年人认知功能和识别多药治疗的同时有效减轻症状负担。经颅磁刺激(Transcranial magnetic stimulation, TMS)是一种已被证实的治疗年轻人难治性抑郁症的干预手段,但TMS对老年人抑郁症的疗效仍不清楚。这篇综述提供了TMS治疗GD疗效的最新观点,讨论了TMS试验之间的方法学差异,并探索了在大脑老化背景下优化TMS治疗的途径。
用户1279583
2022/02/28
1.3K0
经颅磁刺激治疗老年抑郁症
统计学学术速递[8.30]
【1】 Bayesian Sparse Blind Deconvolution Using MCMC Methods Based on Normal-Inverse-Gamma Prior 标题:基于正反伽马先验的贝叶斯稀疏盲反卷积MCMC方法 链接:https://arxiv.org/abs/2108.12398
公众号-arXiv每日学术速递
2021/09/16
5690
如何用基本临床数据预测癌症免疫检查点抑制剂疗法的疗效 | Nat.Med
◉ 队列收集。顶部:使用了来自 MSKCC 的真实世界队列(MSK-I)进行模型开发。◉ 中部:使用了来自 MSKCC(MSK-II)和 MSHS 的两个真实世界队列。◉ 底部:使用了 10 项全球 III 期临床试验。ITT,意向治疗人群。◉ 特征选择分析。顶部:在 MSK-I 队列中用于模型开发所收集的特征数量。◉ 底部:测试了 47 个特征与总生存期的关联性,使用 Cox 比例风险回归模型,或使用 Cochran-Mantel-Haenszel 检验评估临床获益。◉ 系统性治疗史在这两项测试中均作为混杂因素进行了调整。◉ 机器学习分析。顶部:分别构建预测总生存期和临床获益的模型。◉ 中部:使用 ROC 和 AUC(受试者工作特征曲线及其曲线下面积)比较模型性能。◉ 底部:模型性能评估。在两个机器学习模型中,保留测试集中表现最佳的模型以进行后续分析。
生信菜鸟团
2025/04/11
1280
如何用基本临床数据预测癌症免疫检查点抑制剂疗法的疗效 | Nat.Med
推荐阅读
相关推荐
🧐 pwr | 谁说样本量计算是个老大难问题!?(二)(独立样本均值篇)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档