在GroupedDataFrame上迭代时,如何获得组的名称/密钥?
例如访问每个组的a等于什么:
df = DataFrame(a=repeat([1, 2, 3, 4], outer=[2]),
b=repeat([2, 1], outer=[4]),
c=1:8);
gd = groupby(df, :a)
for g in gd
#... do something with the dataframe and the key of the dataframe
end
我有下面的DataFrame。描述每个用户所居住的城市。
City Name
0 Seattle Alice
1 Seattle Bob
2 Portland Mallory
3 Seattle Mallory
4 Memphis Bob
5 Portland Mallory
你能和熊猫一起实现以下目标吗?
Name City1 City2 City3
0 Alice Seattle NaN Nan
1 Bob Seattle Memphis Nan
2
我有以下DataFrame:
Stint Year ID Data1 Data2 Team
1 2010 A 10 1 SFN
1 2011 A 10 1 SFN
1 2013 A 10 1 SFN
2 2013 A 10 1 ATL
1 1922 B 10 1 ARI
1 1923 B 10 1 AR
我有一个有多个索引的数据帧,我想循环这个数据帧,拉出几组行进行处理。
我想循环遍历多索引中的所有组合,但只针对索引的一个子集,而不是所有组合。我事先不知道键/索引值是什么,但我知道有多少。
例如:
data1
key1 key2 key3
A A A 10
A A B 11
A B A 12
A B C 13
A C A 14
假设我只对key1 + key2感兴趣。
key1 +key2有3种独特的组合:
(A A)
(A
我有一个问题,就是根据大熊猫的列值,只将某些行组合在一起(按时间戳排序)。
下面是一个例子:
df=pd.DataFrame({"text":["Hello.",
"I had a question.",
"Hi!",
"Yes how can I help?",
"Do you ship to the UK?"