我有一个包含几列数据的数据。在数据中,a-1等同于丢失的数据.我要计算每列中的-1值的数目。
我相信,当我加载数据时,我可以将-1注册为一个NaN/缺失值,然后我看到一些使用isna()和计数布尔值的东西。然而,我想要做的事情(对每一列应用一个条件)似乎是我应该知道如何做的一件基本事情,所以我想知道如何这样做。
下面是一个例子。假设我有以下数据框架:
row A B C D E
1 3 5 6 9 -1
2 -1 3 -1 2 0
3 -1 -1 -1 1 -1
我想得到的输出是:
A B C D E
2 1 2 0 2
我
我有一个包含调查数据的数据框架,其中每一列都被标记为Q1-Q100。数据框中的第一行包含调查中的实际问题(每列一个问题)。我想将该行设置为每列的属性或元数据,以便以后可以引用它。 数据帧如下所示: Q1 Q2 Q3 Q4
ID Age Gender Handedness
1 19 Female Right
2 19 Male Right
3 25 Female Right
4 17 Female Left 但对于Q10-100,标签是一个完整的句子/疑问句,而不是像“年龄”这样的简短标签。 我知道我可以使用以下命令单独设置属性: df.a
我有一个数据框架(Df):
group col
a 12
a 15
a 13
b 21
b 23
期望的输出也是一个数据帧(Df1):
col1 col2
12 21
15 23
13 0
我想将"df“的"col2”按"group“划分为多列,如"col1”和“col2”。
当每一列的长度不相等时,必须在每一列的末尾加上"0“,直到每一列的长度达到最大列长为止。
有两列的数据格式,然后每列用‘\t’分隔。第一列是数字,第二列是meaning.The数据,每一列的数据是字符串
111 A
112 B
113 C
114 D
115 E
116 F
117 G
118 H
...
其他数据也有两列,每列的数据都是字符串。格式是这样的。
111 112:0.75,114:0.43,117:0.21
112 113:0.67,114:0.48,115:0.34,116:0.12
113 114:0.33,118:0.12
...
然后,我需要将第二个数据的数量转换成它的具体含义。结果如下:
A B:0.75,D:0.43,G:0.21
如何对行进行分组/筛选,然后获取每个列的总行数。我要画出结果应该是什么。我不想显示实际数据。只是每列的计数
输出应该是这样的
Column A Column B Column C
Row A - 235 records 300 records 15 records
Row B - 1 record 80 records 900 records
每一列表示同一字段上的计数,但已筛选。所以..。
Column A is really Count(MyColumn) WHERE = A
Column B is really Count(My