首页
学习
活动
专区
工具
TVP
发布

python全栈教程专栏

专栏成员
251
文章
423346
阅读量
30
订阅数
一种能让大型数据聚类快2000倍的方法,真不戳
国家天文台有个聚类任务:共11份数据,每份数据是从一张照片中提取出来的,包含500多万条记录,每条记录是一个天体的坐标及属性。11张“照片”中有些天体坐标是重复的,但这些重复的坐标不完全相同,他们会有一些差别但距离不会太远。任务就是把其中一张“照片”作为基础,从其他照片中找出重复的天体,把重复天体的坐标及属性均值作为该天体的最终坐标和属性,即把距离很近的天体聚成一类再做聚合运算,这样就可以得到一张坐标清晰且信息更加准确的天体“照片”。
川川菜鸟
2022-08-10
4460
gitbook安装教程
GitBook 是一款现代化的文档平台,这个工具链 (GitBook) 是一个使用 Git 和 Markdown 来构建书籍的工具。它可以将你的书输出很多格式:PDF,ePub,mobi,或者输出为静态网页。
川川菜鸟
2021-10-22
2K0
arserWarning: Falling back to the ‘python‘ engine because the ‘c‘ engine does not support regex sepa
文章目录 原来的代码为: df=read_csv('./rz10.csv',names=['YHM','DLSJ','TCSJ','YWXT','IP','REMARK'],sep=" ,") 报错如下: 解决方法: 追加一个参数:engine='python' 成功如下:
川川菜鸟
2021-10-22
4000
❤️手把手教你linux系统安装和完美配置❤️
还是一样,在我公众号:川川菜鸟 发送:ubuntu镜像 领取ubuntu镜像
川川菜鸟
2021-10-19
9600
2021华为杯数学建模B题完整思路+部分代码
问题 1. 使用附件 1 中的数据,按照附录中的方法计算监测点 A 从 2020 年 8 月 25 日到 8 月 28 日每天实测的 AQI 和首要污染物,将结果按照附录“AQI 计算结 果表”的格式放在正文中。 问题一就是单纯的计算问题,在附录中相关的计算规则都已经告知了,因此直接 带入数据进行计算即可,但需要注意各种逻辑关系,先捋顺在去计算。注意如果 计算结果过长就只选择部分代表性数据放在正文中即可,其它的部分放在附录 里。 问题 2. 在污染物排放情况不变的条件下,某一地区的气象条件有利于污染物扩 散或沉降时,该地区的 AQI 会下降,反之会上升。使用附件 1 中的数据,根据 对污染物浓度的影响程度,对气象条件进行合理分类,并阐述各类气象条件的特 征。 针对问题二,根据附件一可知,仅告诉我们检测点 A 的各类实测污染物数据, 但并未告知气象情况,因此我们首先根据问题一计算得到的 AQI 数据以及相关 的污染物数据进行无监督聚类,无监督聚类模型有很多,如层次聚类、高斯混合 聚类等,在这里比较推荐 SOM 自组织神经网络聚类算法,将原始数据输入网络 后能够自动根据各类数据的特点在不同的步数下生成不同的结果,如将 31 个省 市的 GDP 数据输入网络则会自动对发达程度进行聚类; % 二维自组织特征映射网络设计 % 输入数据为各类实测污染物数据 clc clear close all %--------------------------------------------------- %随机生成 100 个二维向量,作为样本,并绘制出其分布 P=[此处填写污染物数据] % %建立网络,得到初始权值 net=newsom([0 1;0 1],[5 6]); w1_init=net.iw{1,1}; %--------------------------------------------------- %绘制出初始权值分布图 figure(2); plotsom(w1_init,net.layers{1}.distances) %--------------------------------------------------- %分别对不同的步长,训练网络,绘制出相应的权值分布图 for i=10:30:100 net.trainParam.epochs=i; net=train(net,P); figure(3); plotsom(net.iw{1,1},net.layers{1}.distances) end %--------------------------------------------------- 问题 3. 使用附件 1、2 中的数据,建立一个同时适用于 A、B、C 三个监测点(监 测点两两间直线距离>100km,忽略相互影响)的二次预报数学模型,用来预测 未来三天 6 种常规污染物单日浓度值,要求二次预报模型预测结果中 AQI 预报 值的最大相对误差应尽量小,且首要污染物预测准确度尽量高。并使用该模型预 测监测点 A、B、C 在 2021 年 7 月 13 日至 7 月 15 日 6 种常规污染物的单日浓度 值,计算相应的 AQI 和首要污染物,将结果依照附录“污染物浓度及 AQI 预测 结果表”的格式放在论文中。 首先分析题目已知数据包括了各监测点逐小时污染物浓度和气象一次预报数据 以及实测的污染物浓度和气象数据等;这里就是利用实测数据对预报数据进行误 差修正,既然是预测,那实测数据在未来肯定是无法得到的,所以思路就是通过 前期的预测数据和实测数据的差,找到相关的误差修正规律即可;因此在这里推 荐的模型是神经网络模型,具体是设置一个三层的网络机构,输入层数据是一次 预报的气象条件,而标准输出数据为真实污染物浓度与预测污染物浓度的差值, 这样就建立了预测气象条件与实际污染物浓度误差之间的关系;在这里推荐使用 基于遗传算法优化的神经网络模型,相对于传统的 BP 神经网络而言,其精度将 会更高。得到上述网络关系后,若新得到一组一次预报气象数据结合相关的误差 变量进行二次修正即可。 %程序一:GA 训练 BP 权值的主函数 function net=GABPNET(XX,YY) %-------------------------------------------------------------------------- % GABPNET.m % 使用遗传算法对 BP 网络权值阈值进行优化,再用 BP 算法训练网络 %--------------------------------------------------------------------------
川川菜鸟
2021-10-19
1.8K0
2021华为杯E题思路+demo代码
2021 年中国研究生数学建模竞赛 E 题参考思路 交流群:912166339,非伸手党群 信号干扰下的超宽带(UWB)精确定位问题 一、背景 UWB(Ultra-Wideband)技术也被称之为“超宽带”,又称之为脉冲无线电技术。这是一 种无需任何载波,通过发送纳秒级脉冲而完成数据传输的短距离范围内无线通信技术,并且信 号传输过程中的功耗仅仅有几十µW。UWB 因其独有的特点,使其在军事、物联网等各个领域 都有着广阔的应用。其中,基于 UWB 的定位技术具备实时的室内外精确跟踪能力,定位精度 高,可达到厘米级甚至毫米级定位。UWB 在室内精确的定位将会对卫星导航起到一个极好的 补充作用,可在军事及民用领域有广泛应用,比如:电力、医疗、化工行业、隧道施工、危险 区域管控等。UWB 更多应用场景请参见[4—6]。 UWB 的定位技术有多种方法,本文仅考虑基于飞行时间(Time of Flight, TOF)的测距原 理,它是 UWB 定位法中最常见的定位方法之一。TOF 测距技术属于双向测距技术,其通过计 算信号在两个模块的飞行时间,再乘以光速求出两个模块之间的距离,这个距离肯定有不同程 度的误差,但其精度已经比较高。 在室内定位的应用中,UWB技术可以实现厘米级的定位精度(一般指2维平面定位),并 具有良好的抗多径干扰和衰弱的性能以及具有较强的穿透能力。但由于室内环境复杂多变 UWB 通信信号极易受到遮挡,虽然UWB技术具有穿透能力,但仍然会产生误差,在较强干 扰时,数据会发生异常波动(通常是时间延时),基本无法完成室内定位,甚至会造成严重事 故。因此,信号干扰下的超宽带(UWB)精确定位问题成为亟待解决的问题。 二、问题描述 为解决信号干扰下的超宽带(UWB)精确定位问题,我们通过实际场景实测,采集到一 定数量的数据,即利用 UWB 的定位技术(TOF),采集到锚点( anchor)与靶点(Tag)之间 的距离,希望通过数学建模(或算法)方法 ,无论信号是否干扰,都可以给出目标物(靶点) 的精确定位( 3 维坐标)。 三、实验场景和数据采集 如图所示,在 5000mm5000mm3000mm 的测试环境中,分别在 4 个角落 A0,A1,A2, A3 放置 UWB 锚点( anchor),锚点向所有方向发送信号。Tag 是 UWB 标签(靶点),即需 要定位的目标(只在测试环境范围内)。Tag 接收到 4 个 UWB 锚点( anchor)的信号(无论 信号是否干扰,Tag 一般都可以接收到信号),利用 TOF 技术,分别解算出对应的 4 个距离数 据。 实验在实验场景 1 中采集了 Tag 在 324 个不同位置,在信号无干扰和信号干扰下的 UWB 数据,即每个位置各测试(采集)2 次,一次信号无干扰,另一次信号有干扰(锚点与靶点间 有遮挡),注意:每次采集数据时,由于 Tag 在同一位置会停留一会儿时间,而锚点与 Tag 之 间每 0.2—0.3 秒之间就会发送、接收信号一次,所以在同一位置点,UWB 会采集到多组数据 (多组数据都代表同一位置的信息),组数的多少视 Tag 在同一位置的时间而定,停留的时间 越长,组数就越多。数据见文件夹“附件 1:UWB 数据集”。 图 1 实测环境示意图 实验场景 1: 靶点(Tag)范围:5000mm5000mm3000mm 锚点( anchor)位置(单位:mm): A0( 0,0,1300)、 A1( 5000,0,1700)、 A2( 0,5000,1700)、A3( 5000,5000,1300) 四、数据文件说明 ( 1)UWB 数据集 “附件 1:UWB 数据集”有 2 个文件夹和 1 个文件,1 个文件(Tag 坐标信息.txt)存放 324 个不同位置的编号及 3 维坐标信息,2 个文件夹中 1 个存放信号无干扰下(正常)采集的 数据(各文件名为 x.正常.txt,x 表示对应的位置编号),另 1 个存放信号有干扰下(异常)采 集的数据(各文件名为 x.异常.txt,x 表示对应的位置编号)。 ( 2)数据文件 Tag 在每个位置都采集了 2 个数据文件(1 个正常,另 1 个异常),共有 648 个数据文件, 无论正常、异常数据,数据格式都一样,每个数据文件开头第 1 行为采集开始行,无实际意义, 接下来,每 4 行为一组,表示 UWB 采集的一组完整数据(一组数据表示一个样品),如: T:144235622:RR:0:0:950:950:118:1910 T:144235622:RR:0:1:2630:2630:118:1910 T:144235622:RR:0:2:5120:5120:118:1910 T:144235
川川菜鸟
2021-10-19
1.5K0
jupyter设置默认打开文件夹
文章目录 cmd输入如下命令回车: jupyter notebook --generate-config 然后:打开生成的文件路径 进去后:编辑这个py 搜索:notebook_dir定位 去掉# ,引号后改为你要打开的文件路径(路径改为你自己的) ctrl+s保存。 右键-属性:删掉这部分"%USERPROFILE%/" 再打开就: 完成!
川川菜鸟
2021-10-19
2.3K0
亲测jupyter打不开浏览器
有粉丝给我说他们的jupyter不能自动打开浏览器,jupyter notebook输入回车后,不能跳转,把输出的链接复制粘贴到浏览器后,写的代码页不能运行。
川川菜鸟
2021-10-19
1.5K0
朋友问我:电脑连接不上WIFI,显示无法连接到这个网络,怎么解决?
文章目录 不废话,上教程: 连接成功
川川菜鸟
2021-10-19
3.6K0
❤️C++条件语句教程❤️
使用该if语句指定在条件为 时要执行的 C++ 代码块为true。 注意 if是小写字母。大写字母(If 或 IF)将产生错误。 例如:
川川菜鸟
2021-10-19
5360
❤️C++布尔值❤️
布尔表达式是一个C ++表达式返回一个布尔值:1(真)或0(假).你可以使用比较运算符,例如大于( >) 运算符来确定表达式(或变量)是否为真:
川川菜鸟
2021-10-19
1.1K0
❤️C++数学相关函数详细教程❤️
其他函数,例如sqrt(平方根)、round(log 取整一个数字)和(自然对数),可以在cmath头文件中找到:
川川菜鸟
2021-10-19
4310
❤️ 六千字C++字符串详细教程❤️
字符串用于存储文本。一个string变量包含一组用双引号括起来的字符。 例如创建一个类型的变量string并为其赋值:
川川菜鸟
2021-10-19
5160
❤️ 万字C++运算符大全讲解❤️
尽管+运算符经常用于将两个值相加,如上面的示例,但它也可用于将一个变量和一个值相加,或者将一个变量和另一个变量相加:
川川菜鸟
2021-10-19
2820
❤️ C++数据类型❤️
C++ 数据类型 如 变量 一篇所述,C++ 中的变量必须是指定的数据类型。所有类型如下: //C++数据类型 #include #include using namespace std; int main () { // 创建变量 int myNum = 5; // 定义整形 float myFloatNum = 6.99; //定义浮点类型 double myDoubleNum = 11.98; // 定义单精度浮点类型 ch
川川菜鸟
2021-10-19
3430
❤️ C++ 用户输入讲解教程❤️
前面已经学习了cout用于输出(打印)值的 。现在我们将使用cin来获取用户输入。cin是一个预定义的变量,它使用提取运算符 ( >>)从键盘读取数据。在以下示例中,用户可以输入一个数字,该数字存储在变量 中x。然后我们打印 的值x:
川川菜鸟
2021-10-19
7370
Python MySQL创建数据库
通过使用“SHOW DATABASES”语句列出系统中的所有数据库来检查数据库是否存在。如下则是返回所有数据库,看看我们创建的数据库是否存在。
川川菜鸟
2021-10-19
7.2K0
❤️【python表白神器】手把手教你用代码浪漫追求对象!❤️(附完整源码+讲解)
跟着我做,做成功就去表白,不介意的话表白成功给我打个赏。第一步是制作网站;第二步是部署网站,第三步是二维码制作。所有源码我都给了大家,如果你是小白,中途遇到不会的问题,可以主页加群联系我(粉丝群少的可怜)
川川菜鸟
2021-10-19
1.8K0
手把手教你opencv做人脸识别(附源码+文档)
python3.9 pycharm2020 人狠话不多,直接上代码,注释在代码里面,不说废话。
川川菜鸟
2021-10-19
2.7K0
❤️ C++变量的深度讲解,建议收藏❤️
变量是存储数据值的容器。在 C++ 中,有不同类型的变量(用不同的关键字定义),例如:
川川菜鸟
2021-10-19
5440
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档