假设输入文件按照第3列排序(条形码以“TCGA”开头):
Joe 1 TCGA-A8-A08L-01A-11W-A019-09 T
John 2 TCGA-A8-A08L-01A-11W-A019-09 T
Jack 3 TCGA-A8-CVDL-01A-11W-A019-09 T
Jane 4 TCGA-A8-CVDL-01A-11W-A019-09 F
Justin 5 TCGA-A8-E08L-01A-11W-A019-09 F
Jasmine 6 TCGA-A8-E08L-01A-11W-A019-09 T
Jacob 7 TCGA-A8-E08L-01A-11W-A019-09 T
我想通过只保留第三个连字符之前的子字符串来重命名我的熊猫数据索引。我的代码不修改索引。为什么?
import re
for i in meth_450.index:
re.sub(r"^[^-]*-[^-]*:[^-]*", "", i)
meth_450.index
Index(['TCGA-06-0125-01A-01D-A45W-05', 'TCGA-06-0125-02A-11D-2004-05',
'TCGA-06-0152-01A-02D-A45W-05', 'TCGA-
我正在尝试从ggstatplot运行ggwithinstats函数,但是我得到了以下错误。
这是我在跑
ggwithinstats( # independent samples
data = dat,
x = FAB,
y = BM_percentage,
plot.type = "box", # for boxplot
type = "nonparametric", # for wilcoxon
centrality.plotting = FALSE # remove median
)
########################
我有两个列表(更确切地说,是字符原子向量),我想使用正则表达式对它们进行比较,以生成其中一个列表的子集。我可以使用一个' for‘循环来做这件事,但是有没有更简单的代码呢?下面是我的例子:
# list of unique cities
city <- c('Berlin', 'Perth', 'Oslo')
# list of city-months, like 'New York-Dec'
temp <- c('Berlin-Jan', 'Delhi-Jan', '