eviews和Python中的移动平均线不一样是为什么呢?
0 1256
1

我想问一下,在时间序列趋势分析中进行移动平均模型时,我们在eview中进行移动平均时,我们在下面执行类似代码的操作

moving average = @movavc(data, n)

但是在python中,我们将执行以下操作:

data["mov_avc"] = data.rolling(window=n).mean()

在eview中进行简单移动平均时,我们会丢失前面几个和后面几个观察值,在python中,我们只会丢失第一个观察值,这是为什么呢?

收藏
2021-02-10 12:09 更新 han •  269
共 1 个回答
高赞 时间
0

查看pandas.rolling()docs,您会看到以下注释:

By default, the result is set to the right edge of the window. This can be changed to the center of the window by setting center=True.

这意味着默认情况下,滚动窗口不以其计算平均值为中心。

让我们来看一个例子。我们有一个简单的DataFrame:

In [2]: ones_matrix = np.ones((5,1))
   ...: ones_matrix[:,0] = np.array([i+1 for i in range(ones_matrix.shape[0])])
   ...: index = [chr(ord('A')+i) for i in range(ones_matrix.shape[0])]
   ...: df = pd.DataFrame(data = ones_matrix,columns=['Value'],index=index)
   ...: df
Out[2]:
   Value
A    1.0
B    2.0
C    3.0
D    4.0
E    5.0

现在让我们滚动3号窗口。(请注意,我明确写了参数center = False,但这是调用df.rolling()的默认值)

In [3]: rolled_df = df.rolling(window=3,center=False).mean()
   ...: rolled_df
Out[3]:
   Value
A    NaN
B    NaN
C    2.0
D    3.0
E    4.0

前两行是NaN,而最后的点保留在那里。例如,如果您在索引为C的行上注意到,则滚动后的值为2。但在3点之前。这意味着该索引的新值是对索引分别为{1,2,3}的索引为{A,B,C}的行进行平均的结果。

因此,在计算该位置的平均值时,您可以看到窗口不在索引C的中心,而是在索引B的中心。

您可以通过设置centered = True来更改它,从而输出预期的行为:

In [4]: centred_rolled_df = df.rolling(window=3,center=True).mean()
   ...: centred_rolled_df
Out[4]:
   Value
A    NaN
B    2.0
C    3.0
D    4.0
E    NaN

收藏
2021-02-10 14:01 更新 玩手机的豆浆 •  679