Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >重要变量(数值)的数据挖掘:从哪里开始?

重要变量(数值)的数据挖掘:从哪里开始?
EN

Stack Overflow用户
提问于 2011-09-25 14:00:13
回答 1查看 2.5K关注 0票数 4

我在外汇市场上有一个交易策略,我正在努力改进。

我有一个很大的表(100k+行),它表示市场中的每一种可能的交易、交易类型(买入或卖出)、交易结束后的利润/损失,以及10个左右的额外变量,表示在交易开始时的各种市场衡量标准。

我正在尝试找出这10个变量中是否有任何变量与利润/亏损有显着相关。

例如,假设变量X的范围从50到-50。买入订单的X平均值为25,卖出订单的X平均值为-25。

如果大多数有利可图的买入订单的价值为X> 25,而大多数有利可图的卖出订单的价值为X< -25,那么我会认为X与利润的关系是重要的。

我希望这是一个好的起点。我已经安装了RapidMiner 5,以防有人能给我一个具体的建议。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-09-25 22:51:44

决策树可能是最好的起点。

树本身是特征重要性排名(或OP中所述的重要变量)的可视摘要。

  • 为您提供了整个分类/回归分析的可视化表示(以二叉树的形式),这使其有别于我所知道的任何其他分析/统计技术;
  • 决策树算法只需要对数据进行很少的预处理,无需归一化,无需重新缩放,无需将离散变量转换为整数(例如,男性/女性=> 0/1);它们可以接受分类(离散)变量和连续变量,并且许多实现可以处理不完整的数据(数据矩阵中的某些行缺少值);和
  • 一样,树本身是特征重要性排名的可视摘要

(即,重要变量)--最重要的变量是

根节点,并且比两个子节点更重要,而这两个子节点又比它们的四个子节点的总和更重要。“显着性”在这里指的是解释的方差百分比(相对于某个响应变量,也就是“目标变量”或你试图预测的东西)。一个条件:通过对决策树的目测检查,您无法区分变量重要性和

在相同等级的节点之间。

如果您以前没有使用过它们,下面是决策树的工作原理:算法将遍历数据中的每个变量(列)和每个变量的每个值,并根据每个值将数据分成两个子集。这些拆分中的哪一个实际上是由算法选择的--即拆分标准是什么?选择最“净化”数据(即最大化信息增益)的特定变量/值组合来拆分数据(该变量/值组合通常表示为节点的标签)。这个简单的启发式方法只是递归地执行,直到剩余的数据子集是纯的,或者进一步的拆分不会增加信息增益。

关于数据集中变量的“重要性”,这说明了什么?良好的重要性通过与根节点的接近程度来表示--即层次级别或等级。

一个建议:决策树处理分类数据和离散数据通常没有问题;然而,根据我的经验,如果响应变量(您试图使用所有其他变量预测的变量)是离散的/分类的而不是连续的,则决策树算法总是执行得更好。看起来你的分析可能是连续的,在这种情况下,会考虑将其离散化(除非这样做只会导致整个分析没有意义)。为此,只需使用对您的问题域有意义的参数(bin大小、bin数量和bin边缘)将响应变量值分类--例如,如果r/v由从1到100的“连续值”组成,您可能会明智地将它们分类为5个分类,0-20、21-40、41-60等等。

例如,在您的问题中,假设数据中的一个变量是X,它有5个值(10、20、25、50、100);还假设将此变量上的数据与第三个值(25)分开会产生两个几乎纯的子集--一个是低值,一个是高值。只要这种纯度高于通过对其他值进行拆分而获得的子集的纯度,数据就会在该变量/值对上进行拆分。

RapidMiner确实有一个决策树实现,而且网上似乎有相当多的教程(例如,来自YouTube,herehere)。(请注意,我没有使用过R/M中的决策树模块,也没有使用过RapidMiner。)

我会考虑的另一组技术通常被归类为rubric 降维。特征提取和特征选择可能是D/R之后最常见的两个术语。最广泛使用的是主成分分析( PCA ),它基于协方差矩阵(从导出到数据矩阵)的特征向量分解。

这种特征向量分解的一个直接结果是每个特征向量所占数据的可变性的分数。仅从这个结果,您就可以确定需要多少维度来解释数据中95%的可变性

如果RapidMiner具有主成分分析或其他类似功能的降维技术,那么在哪里可以找到它并不明显。我确实知道RapidMiner有一个R扩展,当然可以让你在RapidMiner.R中访问R。R有很多PCA库(包)。我在下面提到的所有包都可以在CRAN上找到,这意味着那里的任何PCA包都满足文档和小插图(代码示例)的最低包要求。我可以推荐pcaPP (基于投影寻踪的稳健主成分分析)。

此外,我可以推荐两个关于PCA的很好的分步教程。第一个来自NIST Engineering Statistics Handbook。第二个是独立分量分析的tutorial,而不是主成分分析,但我在这里提到了它,因为它是一个很好的教程,这两种技术用于类似的目的。

票数 16
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7545962

复制
相关文章
大疆无人机控制应用 DJI Go 4 监视用户? 谷歌已展开调查
外媒报道称,安全公司Synacktiv和Grimm的研究人员表示,「大疆的无人机控制应用 DJI Go 4 可能并不安全。」
新智元
2020/07/28
8960
大疆无人机控制应用 DJI Go 4 监视用户? 谷歌已展开调查
Dji Tello Telent无人机扩展件-开源控制器对外IO使用说明
lStrapping引脚在系统上电复位过程中,数字状态会存储到锁存器中,一直保存到芯片掉电或关闭,用于配置系统功能。复位后,strapping引脚与普通引脚功能相同。
云深无际
2021/07/23
1.3K0
Dji Tello Telent无人机扩展件-开源控制器对外IO使用说明
关于开发DJI应用时控制的顺序问题
很多开发者在开发的时候会苦恼这个遥控器的事情,比如我们运行自己的应用的时候,遥控器又摁下了按键,那机器到底发送的是什么呢?这篇文章就是解决这些问题,也有可能一部分没有解决。不过还是先吐槽了,这部分的内容其实在OSDK内。。。但是大部分人使用的是MSDK,那肯定是找不到的。
云深无际
2022/03/17
8600
关于开发DJI应用时控制的顺序问题
自制S-Bus接收器(控制dji EP车)
因为知道这个东西,所以一直想做一些改装S1的通用可编程性,一直不是那么好。。。可是你说都折腾这个了,买个接收器插上意思不大,自己做一个最好了~
云深无际
2021/09/14
1.7K0
自制S-Bus接收器(控制dji EP车)
关于摸到DJI A3 飞控
关于DJI的OSDK研究了很长的一段时间,但是一直也没有摸到实物,今天在工位摸到一套,研究了半天感觉少根线,看了看说明书,确实是少根线,去找看一圈也没有,emmmmm,果然我是天生看说明书的命。
云深无际
2022/11/29
1K0
关于摸到DJI A3 飞控
在Airtest中如何使用无线模式控制手机
在使用Airtest超快速开发App爬虫文章的最后,我们留了一个尾巴:如何启动Airtest的无线模式,不用USB线就能控制手机?
青南
2019/03/01
3.1K0
在Airtest中如何使用无线模式控制手机
自由意志是否受机器控制?
1963年,西班牙神经学家何塞·曼努埃尔·罗德里格斯·德尔加多(José Manuel Rodriguez Delgado)在一场蔑视死亡的公开演示中,展示了如何通过无线电控制的大脑植入来抑制暴力行为。当一头公牛把蹄子扎进地里,正要冲向德尔加多时,他按下了一个手持无线电发射机的开关,为植入公牛大脑的电极充电,公牛的四肢在他愤怒进攻时突然僵住了。这是一个非常经典的脑机接口实验,德尔加多认为,远程控制的大脑植入物可以抑制越轨行为,从而实现心理文明社会。
脑机接口社区
2022/08/26
2610
自由意志是否受机器控制?
策略模式(控制反转)
创建用于展示女性推荐展示化妆品的FemaleUserStrategy类文件实现UserStrategy接口
友儿
2022/09/11
2610
DJI和GoPro运动相机语音控制对比和语音控制技术和创新应用的探讨
作为运动相机,必须要满足运动场景下的HANDS-FREE解放双手的操作,而语音则以用户最自然的方式,赋予用户直观,强大和自然的人机交互方式。
用户6026865
2020/09/29
1.7K0
DJI和GoPro运动相机语音控制对比和语音控制技术和创新应用的探讨
Scratch多关卡类游戏设计智囊——两种关卡控制模式
Scratch多关卡类游戏设计具有一定的挑战性,其中关卡控制的“主控模块”对于游戏的顺利进行至关重要。今天向大家介绍两种关卡设置模式。
一石匠人
2018/09/12
1.3K0
Scratch多关卡类游戏设计智囊——两种关卡控制模式
DJI TT无人机 microPython编程指南
我这里还是希望dji可以把这个mpy的一些源码放出来,因为我觉得是无关紧要的东西,然后去学习一下。而不是这样盲目的去猜。
云深无际
2022/02/09
1.7K0
DJI TT无人机 microPython编程指南
Matlab控制Tello无人机(命令认识)
在matlab里面,对tello的控制不是很丰富,仅满足了,简单的飞行控制和姿态信息输出以及前置摄像头的捕获等。
云深无际
2021/09/14
1.2K0
Matlab控制Tello无人机(命令认识)
Python循环控制(下)
三.循环 a = 0 while a < 5: print(a)     a = a + 1 if a == "sad": break #跳过 continue #返回到头 else: print("这里是break没有跳过,则执行这个') for i in range(5):     print(i) a='123' b='123' a is b for i,t in zip(a,b): #zip会在2个数组其中最短的那个用完停止 四.推导式 name = [i for i in range(1
陈不成i
2021/06/18
3760
使用模式构建:模式版本控制模式
有一种说法,生命中唯一不变的东西就是变化。这同样适用于数据库模式。我们会想要获取我们曾经认为不需要的信息。或者一些新上线的服务需要包含在数据库记录中。不管变更背后的原因是什么,一段时间之后,我们不可避免地需要对应用程序中的底层模式设计进行更改。虽然这经常会在传统的表格数据库系统中带来一些挑战甚至是麻烦,但在MongoDB中,我们可以使用模式版本控制来简化这一过程。
MongoDB中文社区
2019/06/11
1.3K0
使用模式构建:模式版本控制模式
GoLang并发控制(下)
context的字面意思是上下文,是一个比较抽象的词,字面上理解就是上下层的传递,上会把内容传递给下,在go中程序单位一般为goroutine,这里的上下文便是在goroutine之间进行传递。
李海彬
2018/12/14
8780
redis在c#中的应用_redis写入数据的同时是否可以读
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
全栈程序员站长
2022/11/07
2.5K0
redis在c#中的应用_redis写入数据的同时是否可以读
如何使用一套键盘鼠标,同时控制多台电脑_控制鼠标
我使用的蓝牙键盘是 GANSS GS87键的蓝牙双模键盘茶轴,既支持有线,也支持无线。最大的优点是便宜,到手 300 多,这个价格能买到有牌子、质量还不错的机械键盘算是非常难得的。当然也有一点小瑕疵,就是不能充电,得用电池,不过大半年才换一次电池,这个缺陷也可以忽略了。
全栈程序员站长
2022/11/04
2.1K0
如何使用一套键盘鼠标,同时控制多台电脑_控制鼠标
大疆无人机安全与DroneID漏洞
消费级无人机可以用于高级航拍、物流和人道主义救援等等。但是其广泛使用给安全、安保和隐私带来了许多风险。例如,攻击方可能会使用无人机进行监视、运输非法物品,或通过侵入机场上方的封闭空域造成经济损失。为了防止恶意使用,无人机制造商采用多种对策来强制安全可靠地使用无人机,例如对速度和高度施加软件限制,或使用地理围栏实施禁飞区。
CDra90n
2023/06/24
3.1K2
大疆无人机安全与DroneID漏洞
关于angular 通过变量来控制样式两种方法可以实现该效果
两种方法可以实现该效果 1. [ngStyle]="{'height':'100px'}" 基本使用方法[ngStyle]="{'height':'100px'}" 判断添加 [ngStyl
用户1437675
2018/08/20
8640
端午出游不想再拍游客照?大疆Spark带你解锁空中新姿势
端午小长假即将到来,准备出门游玩的你是不是还打算在景点凹造型拍照片,再回到酒店修图发九宫格?长假年年有,每年都如此,你是不是已经厌倦了这样的玩法。今天,小编就来带你解锁拍照新姿势,让你从此和游客照说拜
VRPinea
2018/05/16
7750

相似问题

DJI无人机控制指示灯

10

是否可以用NVIDIA TX2以速度控制DJI M210无人机通过UART端口?

12

DJI无人机的DroneKit

22

是否可以在周期性拉取模式下使用无人机?

113

DJI无人机定位-移动SDK

08
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档