蛋白质-蛋白质相互作用网络是已知的。它是一个无向图。网络的每一行都是这样的(蛋白质2-蛋白质6),它代表蛋白质2和蛋白质6之间的相互作用。
networks:
Protein 2 - Protein 6
Protein 4 - Protein 5
Protein 6 - Protein 5
Protein 5 - Protein 7
...
在这个网络中,一些蛋白质的功能是已知的,功能相似的蛋白质往往是相关的。
The function of some proteins:
Protein 2,Func_002
Protein 2,Func_007
Protein 2,Func_008
Prot
我想用library(alluvial)做一个冲积图
我的数据看起来是这样的:
> id Diagnose 1 Diagnose 2 Diagnose 3
1 Cancer cancer cancer
2 Headache Breastcancer Breastcancer
3 Breastcancer Breastcancer cancer
4 Cancer
对不起,我不认为我的问题体现了我想要问的问题,但希望我的解释能澄清。
假设我有一个引用数据框架对象"df",它看起来如下所示:
data.frame(v1 = rep(x, 5), direction = c(-3, 5, -2, 1, 4), cancer = c("can1", "can2", "can1", "can3", "can2"))
如下所示:
v1 direction cancer
1 x -3 can1
2 x 5 can2
3 x
我试图使用格式表来查找ICD代码.
我正在导入一个包含icd_code和cancer_type两列的csv格式表,我的主数据集有两列patient_id和icd。
因此,我可以使用这些格式查找icd代码,并在癌症列中返回癌症类型。但是,当某些icd代码不是在格式表中时,癌症列将返回ICD值本身。因此,我希望PROC格式的值为“other=*”。由于我有超过200种不同的癌症类型,所以不可能一个一个地以PROC格式添加它们。当ICD代码不在格式表中时,它不能返回它自己的值,有什么方法可以这样做吗?
谢谢你的帮助!
DATA FORMAT; SET FORMAT_TABLE(RENAME = (I
我有一个包含多列的JSON文件,其中一列是诊断列表。我想在该列的基础上创建一个专栏,其中只包含我需要的信息。例如,如果我有一列 Pneumonia
Cancer
Nodules
Nodules | Cancer
Cancer
Nodules
Pneumonia | Nodules 我想要一个只过滤掉癌症的专栏: Not Cancer
Cancer
Not Cancer
Cancer
Not cancer
Not cancer 从这里开始,用同样的方法,我会做另一个二进制的列,例如"1“代表癌症,"0”代表非癌症。 在导入Json文件d之后,我有: d['Pneumon