首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用中位数偏差误差条绘制中位数浓度分布图

中位数偏差误差条(Median Absolute Deviation, MAD)是一种用于衡量数据集中变异程度的统计量。它通过计算每个数据点与数据集的中位数之间的绝对差异来衡量数据的离散程度。中位数偏差误差条绘制中位数浓度分布图可以帮助我们可视化数据的分布情况。

绘制中位数浓度分布图的步骤如下:

  1. 首先,计算数据集的中位数(Median)作为中心位置的参考点。
  2. 然后,计算每个数据点与中位数之间的绝对差异(Absolute Deviation)。
  3. 接下来,计算所有绝对差异的中位数,即中位数偏差误差(Median Absolute Deviation)。
  4. 根据中位数偏差误差的值,可以确定绘制中位数浓度分布图的误差条的长度。一般来说,误差条的长度可以选择为中位数偏差误差的倍数,例如2倍或3倍。
  5. 最后,绘制中位数浓度分布图时,将中位数作为中心点,上下分别绘制误差条,表示数据集的浓度分布情况。误差条的长度即为中位数偏差误差的倍数。

中位数偏差误差条绘制中位数浓度分布图可以帮助我们直观地了解数据集的离散程度和分布情况。在实际应用中,它常用于异常检测、数据质量分析和统计建模等领域。

腾讯云提供了一系列与数据处理和分析相关的产品,可以帮助用户进行中位数浓度分布图的绘制和数据分析。其中,腾讯云的数据计算服务TencentDB for PostgreSQL(链接:https://cloud.tencent.com/product/tcdb-postgresql)提供了强大的数据处理和分析能力,用户可以使用SQL语言进行数据查询和计算,方便进行中位数偏差误差条的计算和绘制。此外,腾讯云还提供了云原生数据库TencentDB for TDSQL(链接:https://cloud.tencent.com/product/tdsql)和大数据分析平台TencentDB for TDSQL(链接:https://cloud.tencent.com/product/tdsql)等产品,用户可以根据具体需求选择适合的产品进行数据处理和分析。

请注意,以上所提到的腾讯云产品仅作为示例,不代表对其他云计算品牌商的推荐或评价。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

数据挖掘机器学习[七]---2021研究生数学建模B题空气质量预报二次建模求解过程:基于Stacking机器学习混合模型的空气质量预测{含码源+pdf文章}

但受制于模拟的气象场以及排放清单的不确定性,以及对包括臭氧在内的污染物生成机理的不完全明晰,WRF-CMAQ预报模型的结果并不理想。故题目提出二次建模概念:即指在WRF-CMAQ等一次预报模型模拟结果的基础上,结合更多的数据源进行再建模,以提高预报的准确性。其中,由于实际气象条件对空气质量影响很大(例如湿度降低有利于臭氧的生成),且污染物浓度实测数据的变化情况对空气质量预报具有一定参考价值,故目前会参考空气质量监测点获得的气象与污染物数据进行二次建模,以优化预报模型。二次模型与WRF-CMAQ模型关系如图 3所示。为便于理解,下文将WRF-CMAQ模型运行产生的数据简称为“一次预报数据”,将空气质量监测站点实际监测得到的数据简称为“实测数据”。一般来说,一次预报数据与实测数据相关性不高,但预报过程中常会使用实测数据对一次预报数据进行修正以达到更好的效果。

01

2021华为杯数学建模B题完整思路+部分代码

问题 1. 使用附件 1 中的数据,按照附录中的方法计算监测点 A 从 2020 年 8 月 25 日到 8 月 28 日每天实测的 AQI 和首要污染物,将结果按照附录“AQI 计算结 果表”的格式放在正文中。 问题一就是单纯的计算问题,在附录中相关的计算规则都已经告知了,因此直接 带入数据进行计算即可,但需要注意各种逻辑关系,先捋顺在去计算。注意如果 计算结果过长就只选择部分代表性数据放在正文中即可,其它的部分放在附录 里。 问题 2. 在污染物排放情况不变的条件下,某一地区的气象条件有利于污染物扩 散或沉降时,该地区的 AQI 会下降,反之会上升。使用附件 1 中的数据,根据 对污染物浓度的影响程度,对气象条件进行合理分类,并阐述各类气象条件的特 征。 针对问题二,根据附件一可知,仅告诉我们检测点 A 的各类实测污染物数据, 但并未告知气象情况,因此我们首先根据问题一计算得到的 AQI 数据以及相关 的污染物数据进行无监督聚类,无监督聚类模型有很多,如层次聚类、高斯混合 聚类等,在这里比较推荐 SOM 自组织神经网络聚类算法,将原始数据输入网络 后能够自动根据各类数据的特点在不同的步数下生成不同的结果,如将 31 个省 市的 GDP 数据输入网络则会自动对发达程度进行聚类; % 二维自组织特征映射网络设计 % 输入数据为各类实测污染物数据 clc clear close all %--------------------------------------------------- %随机生成 100 个二维向量,作为样本,并绘制出其分布 P=[此处填写污染物数据] % %建立网络,得到初始权值 net=newsom([0 1;0 1],[5 6]); w1_init=net.iw{1,1}; %--------------------------------------------------- %绘制出初始权值分布图 figure(2); plotsom(w1_init,net.layers{1}.distances) %--------------------------------------------------- %分别对不同的步长,训练网络,绘制出相应的权值分布图 for i=10:30:100 net.trainParam.epochs=i; net=train(net,P); figure(3); plotsom(net.iw{1,1},net.layers{1}.distances) end %--------------------------------------------------- 问题 3. 使用附件 1、2 中的数据,建立一个同时适用于 A、B、C 三个监测点(监 测点两两间直线距离>100km,忽略相互影响)的二次预报数学模型,用来预测 未来三天 6 种常规污染物单日浓度值,要求二次预报模型预测结果中 AQI 预报 值的最大相对误差应尽量小,且首要污染物预测准确度尽量高。并使用该模型预 测监测点 A、B、C 在 2021 年 7 月 13 日至 7 月 15 日 6 种常规污染物的单日浓度 值,计算相应的 AQI 和首要污染物,将结果依照附录“污染物浓度及 AQI 预测 结果表”的格式放在论文中。 首先分析题目已知数据包括了各监测点逐小时污染物浓度和气象一次预报数据 以及实测的污染物浓度和气象数据等;这里就是利用实测数据对预报数据进行误 差修正,既然是预测,那实测数据在未来肯定是无法得到的,所以思路就是通过 前期的预测数据和实测数据的差,找到相关的误差修正规律即可;因此在这里推 荐的模型是神经网络模型,具体是设置一个三层的网络机构,输入层数据是一次 预报的气象条件,而标准输出数据为真实污染物浓度与预测污染物浓度的差值, 这样就建立了预测气象条件与实际污染物浓度误差之间的关系;在这里推荐使用 基于遗传算法优化的神经网络模型,相对于传统的 BP 神经网络而言,其精度将 会更高。得到上述网络关系后,若新得到一组一次预报气象数据结合相关的误差 变量进行二次修正即可。 %程序一:GA 训练 BP 权值的主函数 function net=GABPNET(XX,YY) %-------------------------------------------------------------------------- % GABPNET.m % 使用遗传算法对 BP 网络权值阈值进行优化,再用 BP 算法训练网络 %--------------------------------------------------------------------------

01

工具 | R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)

数据分布图简介 绘制基本直方图 基于分组的直方图 绘制密度曲线 绘制基本箱线图 往箱线图添加槽口和均值 绘制2D等高线 绘制2D密度图 数据分布图简介 中医上讲看病四诊法为:望闻问切。而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样;闻:仔细分析数据是否合理;问:针对前两步工作搜集到的问题与业务方交流;切:结合业务方反馈的结果和项目需求进行数据分析。 “望”的方法可以认为就是制作数据可视化图表的过程,而数据分布图无疑是非常能反映数据特征(用户症状)的。R语言提供了多种图表对数据分布进行描述

010
领券