首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

为什么stargazer给了我lm回归输出的输出表,而不是我使用lm_robust()时的输出表?

在统计学中,线性回归模型是一种用于建立自变量和因变量之间关系的方法。在R语言中,lm()函数用于拟合线性回归模型。然而,当数据存在异方差性(heteroscedasticity)时,传统的最小二乘法(OLS)估计可能不再有效。为了解决这个问题,可以使用lm_robust()函数,它使用了异方差稳健标准误差来计算回归系数的估计。

回到你的问题,为什么stargazer给了你lm回归输出的输出表,而不是lm_robust()的输出表。stargazer是一个用于生成漂亮的回归结果表格的R包。然而,stargazer包目前只支持基本的线性回归模型,不支持异方差稳健回归模型。因此,当你使用lm_robust()函数拟合了一个异方差稳健回归模型后,stargazer无法直接处理该模型的结果。

如果你想使用stargazer生成回归结果表格,有几种解决方案。一种方法是将lm_robust()的结果转换为lm()的结果,然后使用stargazer生成表格。这可以通过将异方差稳健标准误差替换为传统的标准误差来实现。另一种方法是使用其他支持异方差稳健回归模型的R包,例如sandwich包和lmtest包,它们可以生成与lm_robust()函数相似的结果,并且可以与stargazer一起使用。

总结起来,stargazer给出了lm回归输出的输出表,而不是lm_robust()的输出表,是因为stargazer目前不支持异方差稳健回归模型。如果你需要生成异方差稳健回归模型的结果表格,可以考虑使用其他支持该模型的R包,或者将结果转换为lm模型的结果后再使用stargazer。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

翻译|记住一些常用R包

教授履历[1]丰富,他博客[2]写了好多好文章,小编受益匪浅。 简介 这些年来,记了一些笔记。包括:研究思路,见过R软件包,要做事情等。正打算在博客上公开一些笔记。...它可以用于根据代码、代码输出和markdown编写自定义邮件正文;并使用SMTP服务器发送电子邮件-甚至GMail -或集成生产服务,如RStudio Connect。...equatiomatic[7]从lm()函数中提取输出,用LaTeX写出方程。 markdowntemplates[8]包括一组R markdown模板和knitr针织引擎替换。...stargazer[21]可以用来创建回归模型输出表。...stargazer-booktabs[22] 是stargazer软件包修改版本,可使用booktabs(LaTeX)命令(\ toprule,\ midrule和\ bottomrule)输出表格以包含水平尺

2.9K30

stargazer包——线性回归结果输出到文档中

前言 今天小编在做线性回归时候,突然想 R 能不能把结果以表格形式输出呢?这样就不需要自己复制粘贴画表格啦。...1. stargazer 简介 stargazer 包中只有 stargazer()函数,其主要优势在于支持模型数量多、易于使用以及表格清楚美观。...stargazer() 函数为格式良好回归表创建 LATEX 代码、HTML 代码和 ASCII 文本,其中包括多个模型并排、汇总统计表和矩阵等。...本文使用 R 中自带数据集 mtcars 来简要说明 stargazer() 函数用法。 3. 使用方法 数据集 mtcars 中有 mpg 、 cyl 等 11 个变量, 32 个观察值。...例 4 Fig 5. rmarkdown 代码 results='asis' 保证输出是表格,不是 LATEX 格式。 Fig 6.

4.6K50

MADlib——基于SQL数据挖掘解决方案(17)——回归之Cox比例风险回归

大于0表示该病人对应危险度大于平均水平;等于0为达到平均水平;小于0表示该病人危险度小于平均水平。 回归系数 ? ,协变量取值越大,风险函数 ?...值越大,表示病人死亡风险越大。 回归系数 ? ,表示协变量对风险函数 ? 没有影响。 回归系数 ? ,协变量取值越大,风险函数 ? 值越小,表示病人死亡风险越小。...output_table VARCHAR 保存模型输出表名,主输出表列和概要输出表列分别如表2、表3所示。...()函数输出表。...output_table TEXT 存储预测结果输出表名,输出表具有以下列: l id:TEXT类型,id列。

1K20

MADlib——基于SQL数据挖掘解决方案(15)——回归之序数回归

model_table VARCHAR 包含输出模型表名。主输出表列和概要输出表列如表2、3所示。 dependent_varname VARCHAR 因变量列名。...和SQL中“GROUP BY”类似,是一个将输入数据集分成离散组表达式,每个组运行一个回归。此值为NULL,将不使用分组,并产生一个单一结果模型。...,是ordinal()函数输出表。...当predict_type = response输出表中包含两列:SERIAL类型id,表示主键,TEXT类型category列,包含预测类别。...使用前者将输出预测最大概率类别值,使用后者将输出每种类别的预测概率。 verbose BOOLEAN 控制是否显示详细信息,缺省值为FALSE。

92420

MADlib——基于SQL数据挖掘解决方案(14)——回归之多类回归

多分类则充分利用了完整信息,可能提供更多结果。如果目标类别数超过两个,这时就需要使用多类回归(Multinomial Regression)。...具体来说,就是通过将自变量和相应参数进行线性组合之后,使用某种概率模型来计算预测因变量中得到某个结果概率,自变量对应参数,即回归系数,是通过训练数据计算得到。 2....和SQL中“GROUP BY”类似,是一个将输入数据集分成离散组表达式,每个组运行一个回归。此值为NULL,将不使用分组,并产生一个单一结果模型。...,是multinom()函数输出表。...当predict_type = response输出表中包含两列:SERIAL类型id,表示主键,TEXT类型category列,包含预测类别。

63510

MADlib——基于SQL数据挖掘解决方案(13)——回归之逻辑回归

为此,在实际应用逻辑回归模型过程中,常常不是直接对p进行回归,而是先定义一种单调连续概率π,令 ? 有了这样定义,逻辑回归模型就可变形为: ?...out_table VARCHAR 包含输出模型表名。主输出表列和概要输出表列如表2、3所示。...和SQL中“GROUP BY”类似,是一个将输入数据集分成离散组表达式,每个组运行一个回归。此值为NULL,将不使用分组,并产生一个单一结果模型。...表2 logregr_train函数主输出表列说明 训练函数在产生输出表同时,还会创建一个名为_summary概要表,具有以下列: 列名 数据类型 描述 source_table...每一个自变量至少要10例结局保证估计可靠性。注意:这里是结局例数,不是整个样本例数。

1.3K30

1w+ 字深入解读 Flink SQL 实现流处理核心技术!

使用SQL实现流处理核心技术 在了解了Table\SQL API使用方法以及作业运行机制之后,接下来分析SQL实现流处理核心技术。 为什么要分析这个问题呢?...pId为商品1数据,所以这时就不是将结果[商品1, 13]插入到动态输出表了,而是将结果更新(UPDATE)到动态输出表中。...有读者可能会疑惑为什么这个场景中动态输出表不会发生更新呢? 在这个案例中,虽然动态输入表数据是源源不断,但是这个SQL查询计算逻辑是事件时间滚动窗口。...pId为商品1数据,所以这时就不是将结果[商品1, 13]插入到动态输出表了,而是将结果更新(UPDATE)到动态输出表中,这时就会将这条UPDATE操作编码为一条回撤消息和一条新增消息,即-[商品1...为商品1数据,所以这时就不是将结果[商品1, 13]插入到动态输出表了,而是将结果更新到动态输出表中,这时就会将这条UPDATE操作编码为插入或更新消息,即*[商品1, 12]。

61910

MADlib——基于SQL数据挖掘解决方案(20)——时间序列分析之ARIMA

采用时间序列分析进行预测时需要用到一系列模型,这种模型统称为时间序列模型。在使用这种时间序列模型,总是假定某一种数据变化模式或某一种组合模式总是会重复发生。...逗号分隔列名,与SQL中GROUP BY子句类似,用于将输入数据集划分为离散组,每组训练一个ARIMA模型。当此值为空,不使用分组,并生成单个结果模型。...表2 arima_train函数主输出表列说明 概要输出表包含ARIMA模型描述性统计信息,具有以下列: 列名 数据类型 描述 input_table TEXT 源数据表名。...表3 arima_train函数概要输出表列说明 残差输出表包含‘input_table’中每个数据点残差,具有以下列: 列名 数据类型 描述 timestamp_col INTEGER...表4 arima_train函数残差输出表列说明 2.

1K20

MADlib——基于SQL数据挖掘解决方案(19)——回归之聚类方差

out_table:VARCHAR类型,包含输出模型生成表名称。输出表包含以下列: coef:DOUBLE PRECISION[]类型,回归系数向量。...一个列表表达式,类似于SQL GROUP BY子句,用于将输入数据集分组为离散组,每组运行一次​​回归。当此值为空,不使用分组,并生成单个结果模型。...out_table:VARCHAR类型,包含输出模型生成表名称。输出表包含以下列: coef:回归系数向量。 std_err:系数标准误向量。...out_table:TEXT类型,存储回归模型名称。输出表包含以下列: category:类别。 ref_category:用于建模参考类别。 coef:回归系数向量。...在计算多类逻辑回归聚类方差,它使用默认参考类别为零,回归系数包含在输出表中。输出回归系数与多类逻辑回归函数顺序相同。对于K个因变量(1,...,K)和J个类别(0,...

72510

MADlib——基于SQL数据挖掘解决方案(12)——回归之广义线性模型

model_table VARCHAR 包含模型输出表名。主输出表列和概要输出表列如表3、4所示。 dependent_varname VARCHAR 训练数据中因变量列名称。...和SQL中“GROUP BY”类似,是一个将输入数据集分成离散组表达式,每个组运行一个回归。此值为NULL,将不使用分组,并产生一个单一结果模型。...表3 glm函数主输出表列说明 训练函数在产生输出表同时,还会创建一个名为_summary概要表,具有以下列: 列名 数据类型 描述 Method VARCHAR...total_rows_skipped BIGINT 由于缺失值或失败跳过总行数。 表4 glm函数概要输出表列说明 2....给定输出x,关于参数θ似然函数L(θ|x)(在数值上)等于给定参数θ后变量X概率:L(θ|x)=P(X=x|θ)。

91820

集成学习---如何增强个体学习器多样性

、输入属性、输出表示、算法参数进入扰动引入随机性来增强个体学习器多样性。...输入属性扰动 著名随机子空间算法依赖就是输入属性扰动,这个算法从初始属性集中抽取出若干个属性子集,再基于每个属性子集在子空间中训练个体学习器不仅能够产生多样性大个体,还会因属性数减少大幅节省时间开销...输出表示扰动 基本思路是对输出表示进行操纵以增强多样性。...可对训练样本类标记稍作变动,如“翻转法”,翻转法由Breiman在2000年随机改变一些训练样本标记;或者是对输出表示进行转化,如“输出调制法”将分类输出转化为回归输出后构建个体学习器。...比如可以将决策树使用属性选择机制替换为其他属性选择机制。“负相关法”显示地通过正则化项来强制个体神经网络使用不同参数。

1.4K20

MADlib——基于SQL数据挖掘解决方案(18)——回归之稳健方差

线性、逻辑和多类逻辑回归稳健方差接口是相似的。每种回归类型都有自己训练函数。回归结果保存在一个输出表中,取决于回归类型,只具有很小差异。...out_table:VARCHAR类型,包含输出模型生成表名称。输出表包含以下列: coef:DOUBLE PRECISION[]类型,回归系数向量。...out_table:VARCHAR类型,包含输出模型生成表名称。输出表包含以下列: coef:DOUBLE PRECISION[]类型,回归系数向量。...在计算多类逻辑回归稳健方差,它使用默认参考类别零,并且回归系数被包括在输出表中。输出回归系数与多类逻辑回归函数顺序相同。对于K个因变量(1,...,K)和J个类别(0,......因此,不能像Huber-White稳健估计那样直接使用 ? 公式,需要额外条件。

69610

MADlib——基于SQL数据挖掘解决方案(11)——回归之线性回归

SST称为总平方和,SSR称为回归平方和。在使用平均值估计因变量,SST表示预测误差,SSR代表回归模型误差量。SST、SSE和SSR之间关系为:SST = SSE + SSR。 3....out_table VARCHAR 包含模型输出表名。主输出表列和概要输出表列如表2、3所示。 dependent_varname VARCHAR 训练数据中因变量列名称。...和SQL中“GROUP BY”类似,是一个将输入数据集分成离散组表达式,每个组运行一个回归。此值为NULL,将不使用分组,并产生一个单一结果模型。...表2 linregr_train函数主输出表列说明 训练函数在产生输出表同时,还会创建一个名为_summary概要表,具有以下列: 列名 数据类型 描述 source_table...表3 linregr_train函数概要输出表列说明 2.

71210

MADlib——基于SQL数据挖掘解决方案(7)——数据转换之其它转换

output_table TEXT 包含转置后数据输出表名。输出表包括在‘index’参数列出全部字段,‘pivot_cols’参数中给出每个不同值也在输出表中用一个字段表示。...有时将分类变量每一个可能值称为级别,与随机分类变量相关概率分布称为分类分布。 回归分析需要特别注意分类变量,与双值或连续变量不同,分类变量不能直接代入回归方程。...例如,假设有一个名为race变量,其编码为1=Hispanic,2=Asian,3=Black,4=White,那么在回归中直接代入race变量数字值,将会得出线性效果,但这并不是分类本来意义。...由于任何单个元组数组输出都是稀疏(每个分类列只有一个非零元素),‘svec’输出类型存储效率最高。如果后续处理需要使用数组,如与其它非分类特征相关联,可以使用‘array’输出类型。...该技术在英文网站优化中作用比较明显,对中文网站优化也有一定借鉴意义。在网页内容写作中,可尽量把同一词干衍生出不同形式自然融合在句子当中,不要仅使用单一形式。

3K20

面试真题 | 腾讯数据分析最爱考两道面试题

【fis_sign_in:0否1是】; 问题1:请计算截至当前每个用户已经连续签到天数(输出表仅包含当天签到所有用户,计算其连续签到天数) 输出表【t_user_consecutive_days】:...问题2:请计算每个用户历史以来最大连续签到天数(输出表为用户签到表中所有出现过用户,计算其历史最大连续签到天数) 输出表【t_user_max_days】:用户id【fuser_id】,用户最大连续签到天数...答案可能也不是最佳答案,但暂时还没问到过别的答案吧。 Python题目 题目:针对股票最大回撤率指标定义,给出代码实现思路。给定是产品所有交易日净值序列,且其净值序列已按照日期排序。...最大回撤率:在选定周期内任一历史时点往后推,产品净值走到最低点收益率回撤幅度最大值。 追问:如何在提升计算效率?...漫谈 其实这俩题目,核心考察不是语言能力,因为语言永远都在更新,始终可以通过写得多来提升熟悉度;核心考察其实都是逻辑和算法能力,就算忘记核心函数或者语法,回归到问题本身,有逻辑candidate

2.5K30

【Excel系列】Excel数据分析:相关与回归分析

16.2 协方差工具使用 当您对一组个体进行观测获得了 N 个不同测量值变量,“相关”和“协方差”工具可在相同设置下使用。...“相关”和“协方差”工具都会提供一张输出表(矩阵),其中分别显示每对测量值变量之间相关系数或协方差。不同之处在于协方差取值在 -1 和 +1 之间,协方差没有限定取值范围。...(当只有两个测量值变量,即 N=2 ,可直接使用 COVAR,不要使用“协方差”工具。)...在“协方差”工具输出表第 i 行、第 i 列对角线上输入值是第 i 个测量值变量与其自身协方差;这正好是用工作表函数 VARP 计算得出变量总体方差。...17.2 回归工具使用回归”分析工具通过对一组观察值使用“最小二乘法”直线拟合来执行线性回归分析。本工具可用来分析单个因变量是如何受一个或几个自变量值影响

6.4K81

质疑Lambda架构

在这里有许多变数,例如,你能使用Kafka, Storm, 和 Hadoop, 人们经常使用两个不同数据库存储输出表,一个是为实时优化,另外一个是为批处理更新优化。...已经在LinkedIn建立这样一个大数据实时系统和pipeline系统,但这不是喜欢风格,下面谈谈它优缺点,然后表达喜欢风格。...也喜欢Reprocessing 重新处理数据,也就是将输入数据再计算一次输出,只要你代码变化,你需要重新计算一下结果,以便查看代码对数据处理结果影响。 那么代码为什么会变化呢?...当你要开始再次处理reprocessing数据,你只要从你流式处理job第二个实例开始处理你保留数据,但是这次输出数据是直接输出到一个新输出表,当这第二个job实例完成后,切换到应用从这个新表中读取...,然后停止这个job老版本运行,再删除刚才输出表

1.7K30

突破双塔: 生成式交互向量化召回

一篇比较经典工作是美团对偶增强双塔[模型]-(https://dlp-kdd.github.io/assets/pdf/DLP-KDD_2021_paper_4.pdf),即在训练,q侧和d侧各自...fake出一段embedding作为底层特征,去学习对方正样本输出表征。...该段特征预期上其实是与对方有过正反馈行为输出表均值。可以看到,经过这种方法处理后表征,能够携带对方表征信息,隐式实现了交叉特征引入。...不过,这种方式引入交叉特征实际是非常"粗粒度"和"高阶",即携带信息仅仅是对方tower最后输出表征,对方tower在编码这段表征,也仅仅只利用了fakeemb和tower本身输入特征交互...对偶增强双塔这篇工作珠玉在前,给了我们很多启发。这篇工作则告诉我们,其实我们可以在双塔中用生成式方法去fake出更多对方输入特征,不仅仅限于一段fake对方输出表特征。

99611

CIKM2023 | 突破双塔: 生成式交互向量化召回

一篇比较经典工作是美团对偶增强双塔[模型]-(https://dlp-kdd.github.io/assets/pdf/DLP-KDD_2021_paper_4.pdf),即在训练,q侧和d侧各自...fake出一段embedding作为底层特征,去学习对方正样本输出表征。...该段特征预期上其实是与对方有过正反馈行为输出表均值。可以看到,经过这种方法处理后表征,能够携带对方表征信息,隐式实现了交叉特征引入。...不过,这种方式引入交叉特征实际是非常"粗粒度"和"高阶",即携带信息仅仅是对方tower最后输出表征,对方tower在编码这段表征,也仅仅只利用了fakeemb和tower本身输入特征交互...对偶增强双塔这篇工作珠玉在前,给了我们很多启发。这篇工作则告诉我们,其实我们可以在双塔中用生成式方法去fake出更多对方输入特征,不仅仅限于一段fake对方输出表特征。

44910

Lambda架构质疑

例如,我们可以切换到与 Kafka、Storm 和 Hadoop 等类似的系统上,并使用两个不同数据库来存储输出表,其中一个针对实时做特定优化,另一个针对批次更新做特定优化。...其中有一些也是以这种方式工作,经过思考后认为这不是最好方法。认为有必要陈述一下该架构优缺点,并给出喜欢替代方案。 2. 优点 赞同 Lambda 架构强调保持输入数据不变性。...建议是,如果您对延迟不敏感,则使用像 MapReduce 这样批处理框架,如果敏感,则使用流处理框架,除非必须使用,否则不要尝试同时使用这两者。 那么,我们为什么对 Lambda 架构感兴趣呢?...当我们要进行重处理,我们需要另外启动一个流处理作业实例,从头开始处理保留数据,并将输出数据输出到一个新输出表。 当第二个作业完成后,切换应用程序从这个新表中读取。...我们可以将其称为 Kappa 架构,尽管它思想比较简单。 当然,我们可以进一步优化它。在许多情况下,我们可以合并两个输出表。但是,认为在短时间内同时拥有两个输出表会更好一点。

2K20
领券