我有一个如下所示的数据文件(来自TCGA的miRNA数据):
A X X X Y Y Y Z Z Z
B a b c a b c a b c
0
1 regular 5x9
2 data matrix
3
4
A描述第一个标题行,B描述第一个列。我希望使用pandas.read_csv返回一个DataFrame,这样我就可以通过df[0]之类的东西访问行,通过df['X']['a']之类的东西来访问列,从而最终删除选定的行和/或列。在我的搜索中,我发现MultiIndex可以帮助我的,但是df = pandas.read_csv("datafil
我想通过只保留第三个连字符之前的子字符串来重命名我的熊猫数据索引。我的代码不修改索引。为什么?
import re
for i in meth_450.index:
re.sub(r"^[^-]*-[^-]*:[^-]*", "", i)
meth_450.index
Index(['TCGA-06-0125-01A-01D-A45W-05', 'TCGA-06-0125-02A-11D-2004-05',
'TCGA-06-0152-01A-02D-A45W-05', 'TCGA-