statsmodels.api返回MissingDataError: exog在尝试拟合多元回归时包含inf或nans - 腾讯云开发者社区

文章/答案/技术大牛

发布

Statsmodels线性回归看特征间关系

Statsmodels Statsmodels是Python进行拟合多种统计模型、进行统计试验和数据探索可视化的库。statsmodels包含许多经典的统计方法，但没有贝叶斯方法和机器学习模型。...在一个2×2的图中绘制了四幅图:"endog vs exog"，"残差vs exog"，"拟合vs exog"和"拟合+残差vs exog" fig = plt.figure(figsize=(15,8...回归图像解释 "Y和拟合x"图绘制了因变量相对于预测值与置信区间。图中直线关系在表明开盘价与收盘价是线性正相关的，例如当一个变量增加时另一个变量也增加。...线性回归拟合散点图一般在不使用statsmodels模块时，运用线性回归加散点图的绘制组合图，同样可以以此判断变量是否线性相关性。以Open为预测自变量，Adj_Close 为因变量，绘制散点图。...二阶多项式回归模型研究一个因变量与一个或多个自变量间多项式的回归分析方法，称为多项式回归 Polynomial Regression 。

4K2 0

Statsmodels线性回归看特征间关系

statsmodels包含许多经典的统计方法，但没有贝叶斯方法和机器学习模型。...import statsmodels.api as sm import statsmodels.formula.api as smf statsmodels.api x = sm.add_constant...在一个2×2的图中绘制了四幅图:"endog vs exog"，"残差vs exog"，"拟合vs exog"和"拟合+残差vs exog" fig = plt.figure(figsize=(15,8...图中直线关系在表明开盘价与收盘价是线性正相关的，例如当一个变量增加时另一个变量也增加。 "残差与开盘价"的图像显示了模型关于预测变量对应的残差。...一般在不使用statsmodels模块时，运用线性回归加散点图的绘制组合图，同样可以以此判断变量是否线性相关性。

4.1K2 0

您找到你想要的搜索结果了吗？

是的

没有找到

Python实现固定效应回归模型实现因果关系推断

相关可以表示因果关系 — 仅在满足某些条件时让我们给出因果关系的正式定义。因果关系是x导致y。关联意味着x和y沿相同或相反的方向一起移动。...但是，在大多数情况下进行RCT会不可行。RCT可能很耗时，或很昂贵，或难以向需要合作的公众解释，并且有时是不道德的。例如，在医院中，研究人员可能会建议将患者保留为对照组。...假设个体i在治疗组（x_i = 1）或对照组（x_i = 0）中，并且在治疗前（t_i = 1）或治疗后（t_i = 0）。后期的效应为?_2，如图（E）所示。这是通过以下方式得出的： ?...该数据包含11家公司中每家20年的数据：IBM，通用电气，美国钢铁，大西洋炼油，钻石比赛，西屋电气，通用汽车，固特异，克莱斯勒，联合石油和美国钢铁。在面板数据中，将“确定”和“年份”设置为索引。...模型3：汇总OLS # Coding method 1 from linearmodels.panel import PanelOLS import statsmodels.api as sm exog

5.1K4 1

快速入门简单线性回归 (SLR)

线性回归是最简单的回归算法，它试图通过将线性方程/最佳拟合线拟合到观察数据，来模拟因变量与一个或多个自变量之间的关系。...当kind='reg'时，它显示最佳拟合线。使用 df.corr() 检查变量之间是否存在相关性。...statsmodels.regression.linear_model.OLS(endog, exog) endog 是因变量 exog是自变量。...默认情况下不包含截距项，应由用户使用 add_constant添加。...model.fit() # print('n'+"Confidence interval:"+'n', results.conf_int(alpha=0.05, cols=None)) # 返回拟合参数的置信区间

3K1 0

python aic准则_pythonAIC准则下线性回归实现及模型检验案例分析

coding=utf/8 #time:2019/8/11 #function:线性回归 #author：Karen import pandas as pd import numpy as np import statsmodels.api...回归线 plt.plot([Test[‘对数房价’].min(), Test[‘对数房价’].max()], [pred.min(), pred.max()], ‘r–‘, lw=2, label=’拟合线...’),float(‘inf’) #目前的分数和最好分数初始值都为无穷大(因为AIC越小越好) #循环筛选变量 while variate: aic_with_variate=[] for candidate...if current_score>best_new_score: #如果目前的aic值大于最好的aic值 variate.remove(best_candidate) #移除加进来的变量名，即第二次循环时，...=fit.model.exog)) # Breusch-Pagan print(sm.stats.diagnostic.het_breuschpagan(fit.resid, exog_het=fit.model.exog

1.1K2 0

Introduction to debugging neural networks

但大多数情况是，NaNs 在前100轮迭代中就出现了，这时候这个答案就非常简单：你的学习率设置的太高了。当学习率非常高时，在训练的前100轮迭代中就会出现NaNs。...还有一个众所周知的产生NaNs的layer就是softmax层。 softmax的计算在分子和分母中都含有指数函数exp(x)，当inf除以inf时就可能会产生NaNs。...一旦网络可以拟合10个样本了，继续尝试拟合100个。如果现在可以正常训练了但不如预期，则可以进入下一步了。 2）解决你感兴趣的问题的最简单版本。...花一些时间来熟悉在标准数据集（如ImageNet或Penn Tree Bank）上训练的成熟网络中的组件的权值直方图应该是什么样子。...神经网络不是输入尺度不变的，尤其当它使用SGD训练而不是其他的二阶方法训练时，因为SGD不是一个尺度不变的方法。在确定缩放尺度之前，花点时间来尝试多次缩放输入数据和输出标签。

1.2K6 0

你应该知道的神经网络调试技巧

但大多数情况是，NaNs 在前100轮迭代中就出现了，这时候这个答案就非常简单：你的学习率（learn rate）设置的太高了。当学习率非常高时，在训练的前100轮迭代中就会出现NaNs。...还有一个众所周知的产生NaNs的layer就是softmax层。 softmax的计算在分子和分母中都含有指数函数exp(x)，当inf除以inf时就可能会产生NaNs。...在代码中加入一些log输出以确保是以你期望的方式运行的。一般来说，通过暴力排查总会找到这些错误。一旦网络可以拟合10个样本了，继续尝试拟合100个。...花一些时间来熟悉在标准数据集（如ImageNet或Penn Tree Bank）上训练的成熟网络中的组件的权值直方图应该是什么样子。...神经网络不是输入尺度不变的，尤其当它使用SGD训练而不是其他的二阶方法训练时，因为SGD不是一个尺度不变的方法。在确定缩放尺度之前，花点时间来尝试多次缩放输入数据和输出标签。

1.2K7 0

4大类11种常见的时间序列预测方法总结和代码示例

这类似于多元回归，但是使用 yt 的滞后值作为预测变量。我们将其称为 AR(p) 模型，即 p 阶的自回归模型。...#AR 4、移动平均模型(MA) 与在回归中使用预测变量的过去值的 AR 模型不同，MA 模型在类似回归的模型中关注过去的预测误差或残差。MA模型的简单数学表示如下：这里，εt 是白噪声。...ACF 和 PACF 图在求 p 和 q 阶中的意义：为了找到 AR(p) 模型的阶 p：我们预计 ACF 图会逐渐减小，同时 PACF 在 p 显著滞后后会急剧下降或切断。...外生变量的观测值在每个时间步直接包含在模型中，并且与主要内生序列的使用不同的建模方式。...如果序列是平稳的，可以通过将 VAR 直接拟合到数据来预测它们（称为“VAR in levels”）。

4.3K4 1

从零开始学量化（五）：用Python做回归

lstsq比较方便用在只需要回归系数的情况下，如果需要对回归结果做评估，比如算拟合值、算残差、算R2，做t检验、F检验、算P值，就很麻烦了，而statsmodel恰好适合这种情况。...此外，还有missing这个参数，对于回归数据包含缺失值时很好用，比如设置missing = 'drop'表示回归时删除包含缺失值的样本。...statsmodels.api（sm) sm.ols是statsmodels中另一个回归的模块，它的输入类似lstsq，输入变量y，x即可,这里使用patsy中的dmatrics生成x，y，需要注意的是...常用的输入包括因变量endog，自变量exog，残差的协方差阵sigma，missing设定样本中缺失值的处理方法，这里exog也是不带截距项的，需要自己加入，可以用sm.add_constant()，...endog表示Y，exog表示X，constr线性约束的A，params表示线性约束的B，默认为0，sigma是权重，同GLS。

8.5K3 1

用于时间序列数据的泊松回归模型

如果回归模型不能充分捕获这些相关性中包含的“信息”，“未解释的”信息将以自相关误差的形式泄漏到模型的残差中。在这种情况下，模型的拟合优度会很差。...在季节性调整后的时间序列上拟合基于Poisson（或相关）计数的回归模型，但包括因变量y的滞后副本作为回归变量。在本文中，我们将解释如何使用方法(3)在计数的时间序列上拟合泊松或类泊松模型。...对数似然比检验的p值为0.03589，表明该模型在95％的置信水平下比仅截距模型（又称为零模型）做得更好，但在99％或更高的置信水平下表现不佳。让我们看一下拟合模型的残差的自相关图： ?...我们可以看到残差误差在时间滞后1、2和3时是自相关的，这表明因变量罢工中存在自相关，因为NB2模型无法完全解释导致泄漏到模型残差中的原因。。总体而言，此模型的拟合优度非常差。...下一步我们可以尝试通过以下修改来改善滞后变量模型的拟合优度: 除输出外，还将输出变量的前三个时间滞后量作为回归变量。将输出变量和罢工变量的时滞值作为回归变量。

2.5K3 0

R tips：使用glmnet进行正则化广义线性模型回归

正则化项的大小是通过一个超参数（一般命名为lambda）控制，lambda越大则正则化项作用越强，拟合的模型系数会变小或变成0，这个超参数一般使用Cross-validation交叉验证来获取。...alpha为0时，模型退化为Ridge回归，alpha为1时，模型退化为Lasso回归。同样的如果需要进行弹性网络拟合，则这个参数一般使用Cross-validation交叉验证来确定。...再往后拓展就是如何拟合多次模型，比如平方项、立方项、交互作用项等等，其实有了多元回归的概念，平方项等高次项是很好解决的，先将相应的自变量运算得到相应的高次项，再将它也作为一个特征即可，比如需要拟合x1平方项...以logistics回归为例，它的连接函数是，如果绘制这个函数的图像，则可以发现它的自变量在（0,1），函数值是（-Inf，Inf)。...交叉验证可以返回两种lambda值：lambda.min和lambda.1se，lambda.1se是指的在错误度量值最低的1个标准差内的最大lambda值。

5.1K1 1

PYTHON用时变马尔可夫区制转换（MARKOV REGIME SWITCHING）自回归模型分析经济时间序列|附代码数据

它应用了Hamilton（1989）的滤波器和Kim（1994）的平滑器 %matplotlib inline import numpy as np import pandas as pd import statsmodels.api...每个时期，区制现在都根据以下的时变转移概率矩阵进行转移。其中 pij,tipij,t 是在 t 期间从区制 i 转移到区制 j 的概率，并定义为。...这些系数将转移概率与预先确定的或外生的变量xt-1向量联系起来。...exog_tvtp参数指定的。...exp_dura[0].plot( figsize=(12,3)); 在经济衰退期间，低生产状态的预期持续时间要比经济扩张时高得多。

6331 0

python时间序列分析代码_时间序列分析VAR实验报告

以虚假回归为例，当响应变量和输入变量都平稳时，我们用t统计量检验标准化系数的显著性。...下面就可以使用ARMA模型进行数据拟合了。这里我不使用ARIMA(ts_diff_1, order=(1, 1, 1))进行拟合，是因为含有差分操作时，预测结果还原老出问题，至今还没弄明白。...样本拟合模型拟合完后，我们就可以对其进行预测了。由于ARMA拟合的是经过相关预处理后的数据，故其预测值需要通过相关逆变换进行还原。...利用该准则进行判别时，需要剔除“非预测”数据的影响。...基于此我编写了一个名为arima_model的类，主要包含模型自动识别方法，滚动预测的功能，详细代码可以查看附录。

1.4K1 0

时变马尔可夫区制转换MRS自回归模型分析经济时间序列

%matplotlib inline import numpy as np import pandas as pd import statsmodels.api as sm from pandas_datareader.data...每个时期，区制现在都根据以下的时变转移概率矩阵进行转移。其中 pij,tipij,t 是在 t 期间从区制 i 转移到区制 j 的概率，并定义为。...这些系数将转移概率与预先确定的或外生的变量xt-1向量联系起来。...exog_tvtp参数指定的。...exp_dura\[0\].plot( figsize=(12,3)); 在经济衰退期间，低生产状态的预期持续时间要比经济扩张时高得多。

1.7K5 0

Python数据科学：Logistic回归

想了解更多，可以查阅相关资料或书籍。 Logistic回归是通过构建logit变换，从而进行概率预测。线性回归同样也是一种预测方法。...import numpy as np import pandas as pd import statsmodels.api as sm import matplotlib.pyplot as plt import...当然还可以结合线性回归时使用的，基于AIC准则的向前法，对变量进行筛选。...'), float('inf') # 自变量列表含有自变量时 while remaining: aic_with_candidates = [] # 对自变量列表进行循环...在ROC曲线中，主要涉及到灵敏度与特异度两个指标。灵敏度表示模型预测响应的覆盖程度。特异度表示模型预测不响应的覆盖程度。覆盖度表示预测准确地观测占实际观测的比例。

2.1K3 1

PYTHON用时变马尔可夫区制转换（MARKOV REGIME SWITCHING）自回归模型分析经济时间序列|附代码数据

4580 0

python数据统计分析「建议收藏」

scipy的stats包含一些比较基本的工具，比如：t检验，正态性检验，卡方检验之类，statsmodels提供了更为系统的统计模型，包括线性模型，时序分析，还包含数据集，做图工具等等。 2....有谁来对上联或下联? (3) 结果分析返回结果 p-value=0.029035290703177452，比指定的显著水平（一般为5%）小，则拒绝假设：x不服从正态分布。 3....基本数据有R行C列, 故通称RC列联表(contingency table), 简称RC表，它是观测数据按两个或更多属性（定性变量）分类时所列出的频数表。...单变量统计分析 (1) 用途单变量统计描述是数据分析中最简单的形式，其中被分析的数据只包含一个变量，不处理原因或关系。...逻辑回归 (1) 用途当因变量Y为2分类变量（或多分类变量时）可以用相应的logistic回归分析各个自变量对因变量的影响程度。

2.2K2 0

NumPy 秘籍中文第二版：十、Scikits 的乐趣

在本秘籍中，我们将加载 scikit-learn 分发中包含的示例数据集。数据集将数据保存为 NumPy 二维数组，并将元数据链接到该数据。操作步骤我们将加载波士顿房价样本数据集。...此函数返回一个包含第二个元素的元组，即 p 值，介于 0 和 1 之间。...最后，将打印相关性，并显示一个图：要创建数据框，请创建一个包含股票代码作为键的字典，并将相应的日志作为值返回。...在本教程中，我们将专注于铜数据集，其中包含有关铜价，世界消费量和其他参数的信息。准备在开始之前，我们可能需要安装 patsy。 patsy 是描述统计模型的库。很容易看出这个库是否是必需的。...DataSet对象具有名为exog的属性，当作为 Pandas 对象加载时，该属性将成为具有多个列的DataFrame对象。在我们的案例中，它还有一个endog属性，其中包含世界铜消费量的值。

3.8K2 0

训练的神经网络不工作？一文带你跨过这37个坑

在优秀课程《编程人员的深度学习实战》（http://course.fast.ai）中，Jeremy Howard 建议首先解决欠拟合。这意味着你充分地过拟合数据，并且只有在那时处理过拟合。 31....紧要时你也可以打印权重／偏差／激活值。寻找平均值远大于 0 的层激活。尝试批规范或者 ELUs。...试着把你当前的学习速率乘以 0.1 或 10。 37. 克服 NaNs 据我所知，在训练 RNNs 时得到 NaN（Non-a-Number）是一个很大的问题。...一些解决它的方法：减小学习速率，尤其是如果你在前 100 次迭代中就得到了 NaNs。 NaNs 的出现可能是由于用零作了除数，或用零或负数作了自然对数。...尝试逐层评估你的网络，这样就会看见 NaNs 到底出现在了哪里。 ?

1.3K10 0

经验分享 | 解决NN不work的37个方法

在一个极小的数据集上实验 Solve for a really small dataset 取数据集的一个非常小的子集来做实验，过拟合这个子数据集，保证模型在这个数据集上是能work的（如果连这么小的数据集都过拟合不了...在 “Practical Deep Learning for coders” 这门课程中， Jeremy Howard 建议先解决欠拟合的问题，当你能充分地过拟合训练数据的时候再考虑如何解决过拟合。...训练模式和测试模式之间的切换 Switch from Train to Test mode 有些层，比如 Batch Norm，Dropout 等等在训练和测试时进行的操作是不同的，要确保它们在训练的时候以训练模式工作...克服 NaNs Overcoming NaNs 在训练 RNNs 时，结果可能会变成 NaN（Non-a-Number）。...有几种方法可以解决这个问题： - 降低学习率，特别是在前100次迭代就得到了 NaNs 的时候； - NaNs 也可能是因为除0操作/对0或负数取对数造成的，检查一下是否有这些问题； - Russell

1.5K2 0

点击加载更多

Statsmodels线性回归看特征间关系

Statsmodels线性回归看特征间关系

Python实现固定效应回归模型实现因果关系推断

快速入门简单线性回归 (SLR)

python aic准则_pythonAIC准则下线性回归实现及模型检验案例分析

Introduction to debugging neural networks

你应该知道的神经网络调试技巧

4大类11种常见的时间序列预测方法总结和代码示例

从零开始学量化（五）：用Python做回归

用于时间序列数据的泊松回归模型

R tips：使用glmnet进行正则化广义线性模型回归

PYTHON用时变马尔可夫区制转换（MARKOV REGIME SWITCHING）自回归模型分析经济时间序列|附代码数据

python时间序列分析代码_时间序列分析VAR实验报告

时变马尔可夫区制转换MRS自回归模型分析经济时间序列

Python数据科学：Logistic回归

PYTHON用时变马尔可夫区制转换（MARKOV REGIME SWITCHING）自回归模型分析经济时间序列|附代码数据

python数据统计分析「建议收藏」

NumPy 秘籍中文第二版：十、Scikits 的乐趣

训练的神经网络不工作？一文带你跨过这37个坑

经验分享 | 解决NN不work的37个方法

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐