首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

在R中是否有病例对照匹配(个体1:N匹配)(非倾向性得分匹配)的软件包?

在R中,有一个常用的软件包叫做"MatchIt",它可以用于进行个体1:N匹配的病例对照匹配(非倾向性得分匹配)。MatchIt软件包提供了一系列的函数和方法,用于实现匹配算法和评估匹配结果。

MatchIt软件包的主要功能包括:

  1. 数据预处理:MatchIt可以帮助用户对数据进行预处理,包括变量选择、缺失值处理、变量转换等。
  2. 匹配算法:MatchIt提供了多种匹配算法,包括最近邻匹配、最近邻匹配加权、最近邻匹配加权和替代、最近邻匹配加权和替代加强等。
  3. 匹配评估:MatchIt可以帮助用户评估匹配结果的质量,包括平衡性检验、匹配效果评估等。
  4. 结果可视化:MatchIt可以生成匹配结果的可视化图表,帮助用户更直观地理解匹配效果。

MatchIt软件包的应用场景包括医学研究、社会科学研究等领域,特别适用于需要进行个体1:N匹配的病例对照研究。

腾讯云没有提供类似的产品或服务,因此无法给出相关产品和产品介绍链接地址。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

倾向性评分法(propensity score method,PSM)

观察性研究,以队列研究为例,暴露因素分配(如吸烟)通常不受人为控制,暴露组和暴露组形成无法等于随机分组,因此很难做到研究对象组间均衡可比。组间因素不均衡可能造成混杂。...倾向评分匹配: 倾向评分匹配是使用最广泛一种倾向性评分方法。而在倾向性评分匹配,又以1:1近邻匹配被使用最广泛。...观察性研究,如病例对照研究,经常会见到匹配概念,即按照某些因素或特征,将病例组(或暴露组)和对照研究对象进行匹配,以保证两组研究对象具有可比性,从而排除匹配因素干扰。...(FigureB.)这些成功匹配患者倾向性评分往往是中等,意味着日常就医,这些患者接受两种治疗概率是相近。(FigureB.)这不正是我们想要模拟随机对照试验均衡效果吗?...如果损失病例数太多,则不能排除匹配造成选择性偏移。此外还有匹配变量必须是已知等等。那倾向性评分方法当中,有没有其他方法让我们既能做到均衡组间,又能避免上述情况下样本量丢失呢?答案是有的。

13.2K40

因果推断笔记——python 倾向性匹配PSM实现示例(三)

第三步:反驳 4 倾向性匹配案例二(无代码):是否诊所与死亡率因果关系 4.1 PSM Step1:计算Propensity Score 4.2 PSM Step2:Matching 4.3 PSM...Step3:实验组 VS 新对照组 评估建立健康诊所对新生儿死亡率影响 5 倾向性匹配案例(含代码)案例三 5.1 倾向性得分计算 5.2 Matching 1 从matching -> 倾向性得分...1.2 倾向性得分 / 倾向评分匹配 由来 由此衍生了用倾向性得分进行匹配方式Propensity Score Matching,简称 PSM: PSM 方法,我们首先对每一个用户计算一个倾向性得分...当两组倾向性评分分布偏离较大时,可能有的层只有对照个体,而有的层只有试验组个体,这些层不参与评估因果效应。PSS关键问题是分层数和权重设定。...安慰剂数据法,由于生成安慰剂数据(Placebo)替代了真实处理变量,每个个体接收培训事实已不存在,因此反驳测试因果估计效应大幅下降,接近0,这反过来说明了处理变量对结果变量具有一定因果效应

4.2K31
  • 手把手教你做倾向评分匹配

    PSM PSM英文全称为Propensity Score Matching,意思是倾向匹配得分,炸一听?多么学术气息呀 ? 那么如何通俗理解PSM模型呢?...这样方法一个专业名词,即PSM。 官方的话语则是:为了探讨某因素(暴露或干预,下面统称处理因素)与结局关系,需要设立对照组进行比较,其目地是控制处理因素干扰,突显处理因素效应。...但是观察性研究(如队列研究),研究对象是非随机分配,这就会使混杂因素两组中分配不均匀,导致处理因素和结局关系受到混杂因素干扰。...近几年在国外研究中用比较广泛控制混杂因素方法—倾向性评分匹配(propensity score matching, PSM)。...,该方法是PSM中最常见也最基本方法,该方法是将处理组和对照倾向性评分中最接近个体进行匹配,当处理组个体全部匹配后,匹配结束,ratio代表匹配比例,当ratio=1,代表进行1:1匹配

    4.9K60

    因果推断笔记—— 相关理论:Rubin Potential、Pearl、倾向性得分、与机器学习异同(二)

    3.4.0 从matching -> 倾向性得分 3.4.0.1 精准匹配 3.4.0.2 倾向性得分 / 倾向评分匹配 由来 3.4.0.3 精准匹配 -> 倾向评分匹配 3.4.1 基于倾向性评分法因果推断...【3.0章节】 随机实验提到,ATE = E(Yi|Ti=1)−E(Yi|Ti=0)前提是T⊥(Y(1),Y(0)), 也就是干预与Y是独立、无因果、内生 那如果不符合这个条件应该怎么办...3.4.0.2 倾向性得分 / 倾向评分匹配 由来 由此衍生了用倾向性得分进行匹配方式Propensity Score Matching,简称 PSM: PSM 方法,我们首先对每一个用户计算一个倾向性得分...当两组倾向性评分分布偏离较大时,可能有的层只有对照个体,而有的层只有试验组个体,这些层不参与评估因果效应。PSS关键问题是分层数和权重设定。...3.4.3 倾向性评分法均衡性检验 倾向性评分法要求匹配后样本所有混淆变量处理组和对照组达到均衡,否则后续分析会有偏差,因此需要对匹配之后样本进行均衡性检验。

    4K41

    因果推断笔记——自整理因果推断理论解读(七)

    ATE,修复CIA、消除混淆因子影响过程,比较重要就是确认(W,T,Y)变量之间关系,因为有些变量蛮难人为判定是否因果关系可能性,或者是混淆因子,以下是比较重要鉴定关系方法: backdoor...一般来说,通过匹配方法给出第i个单元潜在结果为: 对匹配样本分析实际上是一种 RCT 模仿: RCT ,理想情况下干预组与对照协变量分布是类似的,因此我们可以直接比较两个组之间结果...核心要义,就是为每个实验组(T=1)样本,找到一个相近对照组(T=0) 那么这里找、匹配方法就是非常多了: 第一种:最给力+科学 当然是,利用PS倾向性得分,直接用欧式距离进行计算,那么这里,PS...最常用匹配算法是「最近邻匹配」(NNM),具体步骤是基于相似度得分(例如倾向评分)选择对照组和干预组中最接近单元进行匹配,干预组单元可以和一个对照组单元进行匹配,称为成对匹配1-1 匹配;也可以匹配到两个对照组...code 合成控制法一些关键变量比较重要,所以值得咱们提出来单独说一说。

    9.9K66

    Nature medicine:基于可穿戴运动追踪数据早期识别帕金森疾病

    利用这些数据,我们试图确定加速度计数据是否可以作为PD前驱标志物,通过将PD诊断或已经诊断为PD的人与匹配和不匹配未受影响对照组以及诊断为相关疾病(即神经退行性疾病)个体数据进行比较,来检查其特异性...我们对三个对照组进行了区分:(1)以1:1性别和年龄匹配未受影响对照组;(2)所有未受影响个体;(3)一般人群代表性样本,包括所有未受影响对照组和被诊断患有其他疾病(如痴呆、肌张力障碍、骨关节炎和其他形式帕金森病...训练了三种不同模型类型:(1)诊断性生物标志物,从对照识别诊断PD (n-153);(2)前驱标志,将前驱PD (n= 113)与对照组区分开来;(3)从对照筛选、识别确诊和前驱PD (n=...平均加速度将诊断为PD个体(n =153)与匹配未受影响对照组(n =153)区分开来,平均AUPRC为0.78±0.06,能够区分前驱PD(n=113)和未受影响对照组(n=113),且表现相同...基于加速度特征训练模型,匹配未受影响健康对照,平均AUROC为0.74±0.04;在所有未受影响对照识别出前驱症状病例时,平均AUROC为0.86±0.06;普通人群训练时,平均AUROC

    38220

    因果推断(二)倾向匹配得分(PSM)

    因果推断(二)倾向匹配得分(PSM) 前文介绍了如何通过合成控制法构造相似的对照组,除此之外,也可以根据倾向匹配得分(PSM)进行构造,即为每一个试验组样本在对照找对与之相似的样本进行匹配。...PSM 通过统计学模型计算每个样本每个协变量综合倾向性得分,再按照倾向性得分是否接近进⾏匹配。本文参考自PSM倾向得分匹配法[1]。 ⚠️注意:倾向匹配得分常用于截面数据 数据准备 # !...n = len(groups) # 计算True和False数量 n1 = groups[groups==1].sum() n2 = n-n1 g1, g2...= propensity[groups==1], propensity[groups==0] # 确保n2>n1,,少匹配,否则交换下 if n1 > n2: n1...3个匹配对象,但是只有一个候选对照错误,故进行判断 if k < len(array): # array里面选择K个最小数字,并转换成列表

    74230

    教你更科学地花钱:因果推断增长业务ROI量化评估上应用

    用户因为节假日影响,自然频率上升 ④活动期间多种策略同时影响用户,不只活动一种策略 为了解决这个效果评估问题,本文采用因果推断倾向性得分加权方法,找到对照组和实验组同质用户群进行比较分析。...(还有一种常用方法——PSM倾向性得分匹配,经对比,PSM倾向性得分匹配方法能够处理数据量几w级别,且随着数据量增加计算效率降低很快,甚至出现计算不出结果情况,故推荐倾向性得分加权方法)。...1)观察变量显著性 对于不显著变量可弱化模型该变量上匹配效果。...2)匹配结果量化 实验组和控制组样本量接近11 SMD < 0.1 SMD 即 Standarized Mean Difference SMD 一种计算方式为:(实验组均值 - 对照组均值)/ 实验组标准差...即参与活动前两组用户日活跃率曲线是否重合,以此来验证倾向性加权得分效果。 ② 将 N 日时间周期拉长,从后续留存时长变化趋势上帮我们清晰地定位到活动效应存续周期。

    1K21

    Molecular Psychiatry:抑郁症患者经ECT治疗后齿状回增大7T磁共振成像研究

    通过视野自动放置来进一步增加个体间测量敏感性。共有31名被试完成此次研究,其中包括23名病例和8名对照。...对于健康对照年龄超过18岁且无任何精神类疾病。并且对照人口学变量方面与病例组基本匹配对照组排除标准:具有精神疾病史,具有核磁禁忌症,脑部异常,卒史,怀孕或哺乳,及重大躯体疾病。...需要注意是纳入健康对照目的是确定是否体积变化是由扫描仪器特征系统变化引起。 本研究38人符合入组排除标准,其中病例26人,对照12人。...T2加权像通过刚性配准到T1加权像,T1加权像配准到ASHS内部提供模板上。这些配准应用于T1和T2加权像在左右感兴趣区模板空间进行重新采样。随后,软件包模板分割被配准到个体空间。...统计分析 对于每个亚区时间和组别的交互作用分别通过R软件包线性混合模型进行重复测量,其中时间、组别、年龄和性别作为固定因素,半球(左右半球建模为为个体被试斜率)和个体被试作为随机因素(建模为截距)

    84720

    因果推断中期学习小结

    、Pearl、倾向性得分、与机器学习异同(二)[2] 因果推断笔记——python 倾向性匹配PSM实现示例(三)[3] 因果推断笔记——双重差分理论、假设、实践(四)[4] 因果推断笔记——因果图建模之微软开源...(九)[11] 1 分析型:因果推断智能决策应用 从腾讯看点『观测数据因果推断应用-启动重置体验分析』,QQ浏览器『QQ 浏览器:PUSH配额优化实践』,还有快手『快手因果推断与实验设计』 里面都用因果推断智能决策中进行应用落地...,在这个方向,可以使用方法非常多,直接抄一下腾讯看点团队总结了非常给力通用框架: 是否实验数据下,进行拆分,特别是实验数据可获得性非常差,所以这个时间,IV 、 DID、PSMmatching...了解到组间溢出和干扰下,通过双边实验我们可以更加准确测算处理效应,挂件场景下,我们认为N3是代表完全没有处理过效果,Y代表处理后结果,N3和Y进行差分,计算产品功能推全后影响,而且,双边实验能够更好帮助我们归因...然而双边实验只能描述简单组间溢出,个体个体之间存在干扰复杂情况下,双边实验是无法帮助我们判断实验效果,例如直播PK暴击时刻这种情况下,我们通过时间片轮转实验解决,即在一定实验对象上进行实验组策略和对照组策略反复切换

    1.5K32

    MP:精神疾病患者和正常发育人群皮层特征共同模式

    确定了PC1高度可重复性并与正常神经发育相关后,我们接下来确定它是否与精神病理相关皮层改变模式重现。...我们将ENIGMA成瘾症和英国生物样本库数据PC1图与患有酒精依赖被试和依赖对照组之间病例-对照比较效应大小图进行了比较。...3.5 病例对照差异ENIGMA成瘾和UKB,分别检验了酒精依赖患者和依赖对照组被试之间病例-对照差异效应量。...UKB对照组(N = 296)从UKB被试中选择,AUDIT < 1和其他人口统计学变量与病例匹配。接下来,我们研究了PC1似乎酒精依赖被试和对照组之间病例-对照比较占主导地位程度。...GO数据库使用R软件包org.Hs.eg.db获得

    39710

    Annals of Neurology:新生儿卒后发展性传导性失语多模态脑成像研究

    n=30,age=7–18 years, left-sided lesions in 21 cases)和年龄、性别匹配对照组(n=40)T1、T2结构图和通过弥散张量成像概率追踪方法得到背侧和腹侧语言通路结构受损情况以及基于...另外还招募了同一时期出生各方面对应匹配对照组(n=40),这一组在年龄(6 - 18岁)、性别和母亲教育程度上与实验组相匹配(人口学信息见表1)。 表1 人口学信息及量表测试得分 ?...语言测试结果 患者组,总表达和接受性语言得分(CELF-3UK)显著低于对照组,FSIQ得分也显著较低(见表1)。...图2 表达性语言技能和接受性语言技能测试得分比较 背侧受损组中发现重复错误错误类型很大差异(即使是个体),包括句子重新措辞、简单省略、替换和单个单词增加或颠倒/调换。...对个别病例fMRI偏侧侧化模式检查(见图3)表明,右半球语言优势个体(病例4)语言重复更好,尽管病变位置与严重缺陷个体相似(病例3)。

    67110

    nature communications!乳腺癌DNA甲基化分子标志物研究~

    为了根据宫颈甲基化 WID-BC-index得出区分乳腺癌女性和乳腺癌女性特征,本研究使用岭回归和套索回归将个体分类为病例对照。...分类器发现数据集三分之二(572 例对照,217 例乳腺癌病例)上进行训练,其余三分之一用作内部验证集(297 例对照,112 例病例)(图 1)。...为了评估 WID-BC-index(源自基于宫颈液体细胞学样本)是否可以扩展到其他组织类型,本研究分析了来自上述 BRCA 数据集匹配口腔和血液样本(图 1)。...本研究接下来分析了来自内部验证集(69 名对照和 66 名病例 135 名女性子集匹配口腔样本。...在对照样本,未发现 WID-BC-index 和 BMI(图 5e)、0 和 ≥1 一级亲属患有乳腺癌个体(图 5f)、初潮年龄(图 5g)和第一次活产年龄(图 5h)之间没有显著关联。

    33630

    最强倾向性评分方法—— 重叠加权(Overlap Weighting,OW)

    不知道大家是否记得,前面的文章给大家介绍过一种用于降低混杂实用方法——倾向性评分法(Propensity Score Method,PSM)。...倾向性评分只是一个用于综合需要调整变量分数,而综合完之后我们要用传统方法去调整倾向性评分,常用方法4种,匹配、加权、调整以及分层。...可是匹配却面临着可能匹配不上以及更重要样本量丢失这些问题,这也是为什么倾向性匹配只能应用在对照组比暴露组人群样本大很多情况下。...常规IPTW对治疗组权重为1/PS,未治疗组为1/(1−PS),使得特征不充分个体权重分析中计算更多。...匹配操作方式是不同,每一个被处理研究参与者在对照组中找到最接近PS匹配,通常在一定范围内。

    7.5K21

    「经验」不适合做AB实验场景下,通过这4种方式来衡量策略效果

    预计阅读时间:8min 00、序言 日常产品迭代过程,我们常常需要去验证某个功能、策略改动是否符合预期,是否可以完全替代现有的方案。小流量实验往往是最常用、最直接验证因果方式。...此种方式最大局限性在于效率,假设实验组M个用户,对照N个用户,则其计算量为M×N,当样本量与特征均较高时,该种方式效率会非常低(同分类模型KNN原理一致)。...倾向性得分匹配(Propensity Score Matching,PSM) PSM是MDM方式上一种优化,其本质是将高维特征映射到一维倾向分上,然后再在不同label寻找相近倾向分用户。...其一:对于样本量要求,如果样本量过少,会导致匹配样本距离过远,达不到真实相似要求。 其二:对于模型训练要求较高,会出现两用户各特征并不相似,但倾向性分很相近情况,即:信息折损。...其二:由于Matching重采样存在随机性,因此鲁棒性没有Weighting强。

    33021

    干货 | 携程火车票基于因果推断业务实践

    图2-1 相关和因果关系 2.2 理论框架 因果推断以下两种框架: Rubin 虚拟事实模型(Potential Outcome)核心是寻找合适对照组。...图3-2 UPLIFT模型结果展示 3.2 虚拟价值评估场景 — 倾向性得分匹配 模型介绍:通过计算倾向性得分从观测数据中找到相似的人群,即在未干预人群中找到与干预人群相似的人,如图 3-3。...实验组:加入企业微信环境且留存达到 180 天用户。 对照组:用户加入企业微信环境当日,无放回用 PSM 大盘人群匹配与之相似的用户放入对照组。...图3-5 解决问题思路图 结果展示:如图 3-6 所示,左上角图中展示是实验组和对照组原始倾向性得分,右下角图为实验组和对照匹配之后的人群得分,可以看出,从两组挑选出来的人群倾向性得分匹配程度较高...4.2 使用场景识别 通过实践总结,因果推断方法常见使用场景以下四种(如图4-1): 1)场景一:实验场景策略效果评估 问题判别:评估计算是群体效应(ATE)、无法进行 AB 实验。

    73931

    R语言倾向性评分:匹配

    4种方法均有各自特点和局限,参考下图: 其中协变量调整又可以称为倾向性评分回归、倾向性评分矫正等。 用于倾向性评分数据要进行一些预处理,比如缺失值处理,这在倾向性评分是很重要一部分内容!...所以要想办法解决x.Age和x.Gender两个变量两组间差异,达到基线可比目的。今天要介绍方法就是倾向性评分匹配。...replace:能否重复匹配,默认是FALSE,意思是假如干预组1匹配到了对照A,那A就不能再和其他干预组进行匹配了。 ratio:设置匹配比例,干预组:对照组到底是1比几,默认为1:1。...ratio=2即是干预组:对照组是1:2。所以一般要求数据对照组数量多于干预组才行。如果对照组比干预组多出很多,完全可以设置1:n进行匹配,这样还能损失更少样本信息,但是一般也不会超过1:4。...m.out$discarded查看某个样本是否被丢弃: table(m.out$discarded) ## ## FALSE ## 831 匹配后数据平衡性检验 检查匹配数据,主要是看协变量不同组间是否已经均衡了

    2.5K40

    脑成像双胞胎设计——阿尔茨海默病生物标志物综述

    双胞胎样本允许进行准实验双胞胎病例对照方法,可以控制大脑认知关联遗传和环境混淆,与不相关个体研究相比,因果关系方面提供更多信息。...与相关个体研究相比,准实验不协调双胞方法(一种特殊匹配病例对照设计)可以提供更多关于从脑成像标记到认知因果机制信息。...换句话说,这种准实验病例对照设计可以控制遗传和环境混杂时测试大脑认知关联是否明显。...对双胞胎内分析结果解释如果双胞胎内部关联与个体水平分析相似,那么就没有混淆,并且与相关个体分析相比,更多证据证明因果关系。...干预试验病例对照双胞法也是一种强有力方法,可以观察治疗方法,例如针对淀粉样蛋白病理药物,完全控制阿尔茨海默病遗传易感性情况下,是否对认知有影响。

    24830

    因果推断笔记——双重差分理论、假设、实践(四)

    章节】 随机实验提到,ATE = E(Yi|Ti=1)−E(Yi|Ti=0)前提是T⊥(Y(1),Y(0)), 也就是干预与Y是独立、无因果、内生 那如果不符合这个条件应该怎么办?...例:我养狗了会变开心,无论是什么狗、不存在因为狗是黑就不开心 互不干预(No interference):个体接受处理后导致潜在结果不受其他个体处理影 例:我淘宝上领到了红包之后会更愿意买东西...2.2 解决平行趋势假设:DID+PSM连用(最常用) 双重差分法(DID)原理与实际应用 具体PSM实现过程可见:因果推断笔记——python 倾向性匹配PSM实现示例(三) 目的:从干预的人群和未干预的人群里找到两批人符合平行趋势假设...完成PSM后数据会呈现一些规律(如图所示): 干预人群与干预人群score分布 —— 匹配后分布一致 抽样后人群一些画像(如年龄、性别、职业)上分布会更接近 这里后台操作步骤是,为treatment1...同理一些比赛,也可以使用,作为训练集 / 测试集分布鉴定方式。

    2.6K31

    Neurology:患有流利性原发性失语症英语母语者和意大利母语者口语产出差异

    但是从目前研究看,流利/语法缺失原发性进行性失语症(nfvPPA)临床表型是否因患者母语不同而存在差异仍旧存在较大差异。...执行评分,连接语音样本分析显示患者语言领域没有差异,但是nfvPPA-E比nfvPPA-I更多语音歪曲,且nfvPPA-I一些句法复杂性测量显示得分更低。...从加利福尼亚大学旧金山分校记忆和衰老中心招募44名nfvPPA病例,选择英语为英语nfvPPA病人进行年龄,性别和微精神状态检查(MMSE),并与nfvPPA-I匹配。...最终使用69位年龄和性别相匹配右利手意大利语被试(n = 38)和右利手英语(n = 31)被试作为健康对照。...为了使各组之间认知数据具有可比性,通过使用年龄,性别和教育匹配健康意大利语和英语对照人群规范化数据,将神经心理学评估原始绩效得分转换为z得分

    99020
    领券