我有一个Pandas Dataframe,希望每月统计和显示事件的发生情况如下。我该怎么做呢?
我有一个Pandas数据帧,如下所示:
Name Month
Jack February
Jill December
Bill September
Jack June
Jill August
Bill July
.
.
.
我希望有一个每月出生的名字的计数,然后显示如下:
Name January February March ... December
Jack 0 6 10 ...
在我的数据帧中,我有许多名称(字符串)、日期(datetime64)和观察量(num)。 In [8]: df
Out[8]:
name date num
0 a 1 3
1 a 2 4
2 a 3 9
3 b 1 6
4 b 2 8
5 b 3 3 我想要的是为每个名字计算一个最新的平均值。因此,我希望每个名称都有以下附加列: name date num avg
0 a 1 3 3
1 a 2 4
我有一个大约100x100的数据帧,我想要添加以前的单元格+当前单元格=当前单元格
数据框架的一个例子:
User A B C D
Apple 0 5 6 4
Orange 23 0 3 5
Grape 5 10 9 6
Fruit 67 3 0 9
期望的输出:
User A B C D
Apple 0 5 11 15
Orange 23 23 26 31
Grape 5 15 2
我已经从Excel电子表格导入了一组数据,现在有了一个常规的DataFrame。
下面是我的原始数据帧的样子:
Meter Number Site Name Size
123 Site A 1
456 Site B 10
现在,我必须为每个米添加每月的能量输出值。这意味着我需要为我的数据帧中的每个现有行添加12行。为了简单起见,每个现有行的12行可以是相同的,但可以根据数组的大小进行缩放。所以,我需要我的新DataFrame看起来像下表。稍后,我将不得不将其与来自网站的测量数据进行比较。
有没有人有关于如何使用Pan
我想使用pandas将数据帧按一列分组,然后对这些组运行扩展窗口计算。想象一下下面的数据帧: G Val
A 0
A 1
A 2
B 3
B 4
C 5
C 6
C 7 我正在寻找的是一种按列G对数据进行分组的方法(结果是组['A', 'B', 'C']),然后将函数首先应用到组A中的项,然后应用到组A和B中的项,最后应用到组A到C中的项。 例如,如果函数为sum,则结果将为 A 3
B 10
C 28 对于我的问题,应用的函数需要能够访问dataframe中的所有原始项,而不仅仅是groupby中的聚合。 例如,在应用mean时,预期结果
我有一个pandas数据帧,其中包含如下数据: levels char_1 char_2
a dog dog
a cat dog
b cow cat
b dog dog 我想对levels列执行group_by操作,并计算某个值在char_1列或char_2列中出现的总次数 生成的数据帧将如下所示: levels char count
a dog 3
a cat 1
b dog 2
b cow 1
b cat 1 我已经尝试过使用数据透视表,但是我
我正在尝试分解数据帧的文本列,并按行/文档分解前几个单词。我有最热门的单词,在这个例子中,机器和学习都是8。但是我不确定如何分解每个文档的最高单词,而不是整个数据帧。 下面是整个数据框中最热门的单词的结果: 机器8 学习8 重要2 思考1 重要的1 import pandas as pd
y = ['machine learning. i think machine learning rather significant machine learning',
'most important aspect is machine learning. machin
我有一个数据集,我正在使用Python3.7和Pandas,并且我正在计算行数。根据下面的简化版本,我有一个包含多列的数据帧,我需要迭代以获得计数。 A B
WalMart "Yes"
Target
WalMart "Yes"
BestBuy
Target "Yes" 我想要做的事情如下: A B C
Gap 0
WalMart "Yes" 1
Target 1
WalMart "Yes" 2
B
嗨,我有一个时间序列,我想计算一下数据帧中每分钟有多少个事件。然后,我想将所有日期组合在一起,并打印包含事件的日期时间。最后,我想使用bokeh和matplotlib输出折线图和直方图。
import numpy as np
import pandas as pd
from pandas import Series, DataFrame
import matplotlib.pyplot as plt
#alows you to see matplotlib in Inotepad
%matplotlib inline
dframe = pd.read_table('info.txt