首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据分享|Python用PyMC3贝叶斯模型平均BMA:采样、信息准则比较和预测可视化灵长类动物的乳汁成分数据

全文链接:https://tecdat.cn/?p=33449

相关视频

模型选择因其简单性而具有吸引力,但我们正在丢弃有关模型中不确定性的信息。

模型平均

一种替代方法是执行模型选择,但讨论所有不同的模型以及给定信息准则的计算值。重要的是要将所有这些数字和测试放在我们问题的背景下,以便我们和客户能够更好地了解方法可能存在的局限性和缺点。如果你在学术界,你可以使用这种方法向论文、演示文稿、论文等的讨论部分添加元素。

另一种方法是执行模型平均。现在的想法是使用模型的加权平均值生成元模型(和元预测)。有几种方法可以做到这一点,PyMC3 包括其中的 3 种,我们将简要讨论,您将在 Yuling Yao 等人的工作中找到更彻底的解释。

伪贝叶斯模型平均

贝叶斯模型可以通过其边缘概率进行加权,这被称为贝叶斯模型平均。我们可以使用以下公式来做到这一点:

这种方法称为伪贝叶斯模型平均或类似赤池的加权,是一种启发式方法,用于根据信息标准值计算每个模型(给定一组固定的模型)的相对概率。看看分母只是一个归一化项,以确保权重总和为 1。

使用贝叶斯自举进行伪贝叶斯模型平均

上述计算权重的公式是一种非常好且简单的方法,但它没有考虑 IC 计算中的不确定性。

堆叠

在PyMC3中实现的第三种方法被称为预测分布的堆叠,并且最近被提出。我们希望在一个元模型中组合多个模型,以最小化元模型和真实生成模型之间的分歧,当使用对数评分规则时,这相当于:

加权后验预测样本

一旦我们计算了权重,使用上述 3 种方法中的任何一种,我们就可以使用它们来获得加权后验预测样本。PyMC3 提供了以简单方式执行这些步骤的函数,因此让我们通过示例查看它们的实际效果。

仅使用新皮层变量的模型

仅使用质量变量对数的模型

使用两个变量的模型

现在我们有了数据,我们将仅使用 。

第二个模型与第一个模型完全相同,只是我们现在使用质量的对数

最后是第三个模型使用 和 变量

现在我们已经对 3 个模型的后验进行了采样,我们将对它们进行视觉比较。一种选择是使用支持绘制多个迹线的函数。

另一种选择是在同一图中绘制多条迹线是使用 。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/ORIST34lKfJI050JioK89MQQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券