我有一个这样的DataFrame:
df2 = pd.DataFrame({'date': ['2015-01-01', '2015-01-02', '2015-01-03'],
'value': ['a', 'b', 'a']})
date value
0 2015-01-01 a
1 2015-01-02 b
2 2015-01-03 a
我试图了解如何应用自定义滚动功能。我
我有一只熊猫的数据,在1963-2012年期间(近6000万行),每个公司每天都有股票回报。我想估计CAPM的贝塔,所以我需要运行一个滚动OLS回归在过去250天为每个公司,并将测试值添加到现有的数据。
我已经尝试将来自pyfinance包的PandasRollingOLS函数与'groupby‘组合在一起,后者只返回一个内存错误。我还试图编写两个for循环,第一个按公司分组('PERMNO'),第二个用于执行滚动回归的循环。然而,这也不起作用。
我的数据看起来是这样的:
PERMNO RET mkt RF
da
我需要从我的时间序列中创建一个数据集,其中包含由滚动的重叠窗口组成的样本。也就是说,以特定的窗口大小和特定的步长拆分我的数据帧。
如何使用Pandas做到这一点?我看到有一个滚动窗口,但它用于对窗口中的值执行一些聚合(例如,计算滚动平均值)。我只对隔离这些重叠的窗口感兴趣。该怎么做呢?
因此输出将是数据帧,如下所示:
1, a
2, b
3, c
4, d
5, e
6, f
7, g
对于窗口大小3和步骤2,输出将是:
1, a
2, b
3, c
3, c
4, d
5, e
5, e
6, f
7, g
为了清楚起见,我知道如何为此编写一个函数,只是想检查一下Pandas中是否已经有
我有一些困难,在熊猫使用.apply或.aggregate滚动(当然,这是正确的方式解决我的问题)。假设我有一个有A和B列的数据,如果A的值为1,我想要创建一个列C,其中包含B的滚动平均值。更广泛地说,我希望能够在滚动的基础上应用一个自定义函数,其中涉及数据数据的几列(例如,当B>x和/或C=y时,A列的滚动和)。
import pandas as pd
import numpy as np
df2 = pd.DataFrame({'A':[1,1,1,0,0,0,1,1,1],'B': [50,40,50,-20,20,10,10,-5,-2]}, in
我有一个包含时间序列的数据框架。我想计算列之间的滚动相关性(periods=20)。
store_corr=[] #empty list to store the rolling correlation of each pairs
names=[] #empty list to store the column name
df=df.pct_change(periods=1).dropna(axis=0) #Prepate dataframe of time series
for i in range(0,len(df.columns)):
for j in range(i,len(
我想在行业层面上获得一个2年的滚动平均值,时间序列如下:
firm industry year roe
A agri 1992 0.05
B agri 1992 0.065
A agri 1993 0.055
B agri 1993 0.07
C tech 1992 0.10
D tech 1992 0.11
C tech 1993 0.11
D tech 1993 0.12
结果不像预期的那样
df.set_index('year').groupby('industry')['ro
密码
s = pd.Series([0,1,2,3,4])
sr = s.rolling(3)
sr.apply(np.sum)
返回具有指数0、1、2、3、4和值NaN、NaN、3、6、9的序列。是否有快速攻击,特别是使用熊猫滚动函数,以便从以下3个索引返回滚动和,即序列值为3、6、9、NaN、NaN
我想知道你们是否有问题,如果你们有一些JPanel,他们有自己的JScrollPane,而在你们的面板中,你们用了很多的JTable和他们自己的JScrollPane,有一个问题来滚动你的面板吗?
我的意思是当你的鼠标在某个表的视图上,然后JScrollPane of JTable在听滚动,所以当我得到很多JTables时,我只能在面板的几个地方滚动,这太烦人了……
当JPanel滚动甚至没有显示时,是否有一些函数将我的滚动事件发送给父JScrollPane?我的意思是,每当某些JScrollPane不需要使用滚动(当它被隐藏时,因为记录太少),我就想禁用它。
我希望在pd.rolling_mean操作中使用groupby。我希望在每一组中有一个滚动均值的前一个项目网在同一组内。下面是一个示例:
id val
0 1
0 2
0 3
1 4
1 5
2 6
按id分组,应将其转换为:
id val
0 nan
0 1
0 1.5
1 nan
1 4
2 nan