首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >在数据中有零是什么意思?

在数据中有零是什么意思?
EN

Stack Overflow用户
提问于 2014-07-14 04:15:57
回答 2查看 13.7K关注 0票数 1

我正在努力寻找规范化我的数据集的方法(表示为一个矩阵,以文档为行,以列为特征),我遇到了一种称为特征缩放的技术。我在维基百科上找到了一篇关于它的文章here

列出的方法之一是标准化,它说“特征标准化使数据中每个特征的值具有零均值和单位方差。”这是什么意思(没有双关语的意思)?

在这种方法中,“我们从每个特征中减去平均值,然后将每个特征的值(均值已经减去)除以它的标准差。”当他们说“减去均值”时,它是整个矩阵的均值还是与该特征相关的列的均值?

此外,如果应用此特征缩放方法,在对数据执行主成分分析(PCA)时,是否不必从列中减去平均值?

EN

回答 2

Stack Overflow用户

发布于 2018-03-23 15:45:25

基本思想是对数据集进行简单(且可逆)的转换,以使其更易于处理。您从每一列中减去一个常量,然后将每一列除以一个(不同的)常量。这些常量是特定于列的。

当他们说“减去平均值”时,它是整个矩阵的平均值还是与该特征相关的列的平均值?

与该特征相关的列的平均值。

...does在对数据进行主成分分析(PCA)时,是否必须从列中减去平均值?

对,是这样。PCA需要均值为零的数据。通常,这是通过减去平均值作为第一步来强制执行的。如果平均值已被减去,则不需要该步骤。但是,执行两次“减去平均值”操作并没有什么坏处。因为第二次均值将为零,所以什么都不会改变。从形式上讲,我们可以说标准化是幂等的。

票数 1
EN

Stack Overflow用户

发布于 2014-07-14 05:01:59

从这篇文章来看,我的理解是你会减去该特征的平均值。这将为您提供描述相同数据布局但已标准化的功能的一组数据。

假设您为一个新功能添加了数据。您可能希望原始功能的数据保持不变,并且不受新功能的影响。

我猜如果你减去整个数据集的平均值,你仍然会得到一个“标准化”的值范围,但那将是不同的-你可能更感兴趣的是单个特征的数据是如何围绕它的平均值的。

你也可以在math.stackexchange.com上看看(或提问)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24729447

复制
相关文章
BI是什么意思?在企业应用中有哪些好处?
百度百科中的BI是指业务智能或智能业务(Business Intelligence的缩写),其用途是指使用现代数据仓库技术,在线分析处理技术,数据挖掘和数据展示技术进行数据分析以实现业务价值。老实说,解释很专业,但是什么是商业智能?我想很少有人能说清楚。如果要了解BI,则必须从其来源和目的开始。
数据前沿
2020/06/15
2.7K0
BI是什么意思?在企业应用中有哪些好处?
xin域名是什么意思 网络应用中有什么表现
在国内可供注册的域名非常多,类似com、.cn、.cn等等就不必提了,都是大家熟悉的不能在熟悉的了,相信各位肯定都知道诸多地域名,xin是汉字信的拼音,也是一款域名产品。下面xin域名是什么意思以及在应用中有什么表现的问题为大家做一下展示。
用户8715145
2021/08/17
2.2K0
a b在java中的意思是什么意思_java中”a=”+a “b=”+b是什么意思?
1、在JAVA程序中由String和“+”参与的运算变量都会被转为字符类型,可以理解为先把32313133353236313431303231363533e4b893e5b19e31333335313237变量转为字符型然后在进行字符拼接。
全栈程序员站长
2022/09/08
17.1K0
a b在java中的意思是什么意思_java中”a=”+a “b=”+b是什么意思?
“//”在python中是什么意思?
要在 Python 中进行楼层划分,请使用双斜杠 // 运算符。此 // 运算符将第一个数字除以第二个数字,并将结果舍入到最接近的整数(或整数)。
很酷的站长
2023/02/21
5.4K0
“//”在python中是什么意思?
baq在聊天中啥意思_BAQ是什么意思
1. In this method, the raw data of I and Q channels is divided into blocks at first, then each block is transformed into time-frequency domain by 2D-RDGT (Two-Dimensional Real valued Discrete Gabor Transform) and the desired bits are allocated to each frequency plane, finally each frequency plane is quantized with BAQ.
全栈程序员站长
2022/07/02
4.9K0
流数据_数据回流是什么意思
https://www.liaoxuefeng.com/wiki/897692888725344/923030465280480
全栈程序员站长
2022/09/20
1.2K0
流数据_数据回流是什么意思
openid是什么意思?token是什么意思?
普通用户的一个唯一的标识,只针对当前的公众号有效。也就是说他是唯一的。独一无二的。
贵哥的编程之路
2022/06/26
10.7K0
void loop在c语言中什么意思,C语言中的loop是什么意思,在C语言中loop是什么意思?…[通俗易懂]
另附上goto,break, continue和return用法:=========================================== 程序中的语句通常总是按顺序方向, 或按语句功能所定义的方向执行的。
全栈程序员站长
2022/08/30
2.6K0
uniqueidentifier什么意思_数据类型int是什么意思
uniqueidentifier数据类型可存储16字节的二进制值,其作用与全局唯一标记符(GUID)一样。GUID是唯一的二进制数:世界上的任何两台计算机都不会生成重复的GUID值。GUID主要用于在用于多个节点,多台计算机的网络中,分配必须具有唯一性的标识符。 在SQL中 ROWGUIDCOL表示新列是行的全局唯一标识列。对于每个表只能指派一个uniqueidentifier 列作为ROWGUIDCO列。ROWGUIDCOL属性只能指派给uniqueidentifier列 ;
全栈程序员站长
2022/10/03
1.4K0
是什么意思
发现一个问题,{ctx}与{pageContext.request.contextPath},由于是新手,没什么经验,但知道{pageContext.request.contextPath},是获取当前根目录,而{ctx}通过观察可以知道也是这一个意思,但是不明白为什么这么写,通过问过一个有经验的同事之后才知道,这两个为一个意思,都是获取当前根目录,不同的是{ctx}为{pageContext.request.contextPath}的简写版,经查证之后果真如此,发现在项目的一个文件内有这样一段话的配置,<c:setvar="ctx" value="{pageContext.request.contextPath}"/>,新手朋友在此值得注意的是,在使用
MickyInvQ
2020/09/27
29.3K0
<c:set var="ctx" value="${pageContext.request.contextPath}"/>是什么意思
发现一个问题,${ctx}与${pageContext.request.contextPath},由于是新手,没什么经验,但知道${pageContext.request.contextPath},是获取当前根目录,而${ctx}通过观察可以知道也是这一个意思,但是不明白为什么这么写,通过问过一个有经验的同事之后才知道,这两个为一个意思,都是获取当前根目录,不同的是${ctx}为${pageContext.request.contextPath}的简写版,经查证之后果真如此,发现在项目的一个文件内有这样一段话的配置,<c:setvar="ctx" value="${pageContext.request.contextPath}"/>,新手朋友在此值得注意的是,在使用${ctx}的时候一定不要忘记把带有该配置的<c:setvar="ctx" value="${pageContext.request.contextPath}"/>的文件引入到当前页面来。
MickyInvQ
2022/09/26
7.8K0
enctype='multipart/form-data'在HTML中是什么意思?
使用 enctype 属性指定浏览器在将数据发送到服务器之前如何对数据进行编码。可能的值为 -
很酷的站长
2022/12/04
2.1K0
enctype='multipart/form-data'在HTML中是什么意思?
高基数数据特性是什么意思
在 SQL 中,基数(cardinality)的定义为一个数据列中独一无二数据的数量。
HoneyMoose
2021/07/25
1.9K0
高基数数据特性是什么意思
数据结构中ElemType是什么意思
ElemType是数据结构的书上为了说明问题而用的一个词。它是element type(“元素的类型”)的简化体。 因为数据结构是讨论抽象的数据结构和算法的,一种结构中元素的类型不一定是整型、字符型、浮点型或者用户自定义类型,为了不重复说明,使用过程中用“elemtype”代表所有可能的数据类型,简单明了的概括了整体。在算法中,除特别说明外,规定ElemType的默认是int型。
全栈程序员站长
2022/07/21
9490
PKM是什么意思?
这三个字母代表着:Personal Knowledge Management,个人知识管理系统。简单地说,就是构建一个系统,把你重要的信息都放在里面管理起来。
葆宁
2022/01/06
12.5K0
PKM是什么意思?
OA是什么意思?
以前大家在谈到OA时,都只说是办公自动化,但是办公自动化的含义太泛了。其实OA你可以简单的把它理解为:公司内部各部门、各分公司、各分支机构合作做完某件事情。大部分的公司没有做信息化之前都是通过QQ、msn、或其他远程沟通工具来完成某项需要合作的工作。但是上述工具无法使企业领导,对事件的整个过程进行进行管控、也不善于原理还容易造成一定程度的泄密。OA的作用就是使各部门、各分公司、各分支机构做到完美合作,并且让领导可以看到他们的工作过程、做到可以审批可以管控、避免工作的失败。
informat低代码
2022/10/13
12.1K0
数据湖是什么意思?数据湖有哪些价值?
现在社会处于互联网飞速发展的时代,互联网技术的不断发展也让现在社会中信息传播速度越来越快,每个人随时随地都可以使用手机或者电脑访问互联网,在互联网上面会接触到各种各样的数据,无论是对于个人还是企业来说数据量都是非常庞大的,庞大的数据保存就是非常麻烦的问题,数据除了可以保存在各种存储硬件上面之外,现在还引入了数据湖的概念,那么数据湖是什么意思?数据湖有哪些价值?
用户8715145
2021/10/19
8350
JavaScript是什么意思?
JavaScript是一种动态计算机编程语言。它是轻量级的,最常用作网页的一部分,其实现允许客户端脚本与用户交互并生成动态页面。它是一种具有面向对象功能的解释型编程语言。
用户8671053
2021/09/19
10.9K0
西格玛是什么意思
西格玛是一个希腊字母σ的中文译音,统计学用来表示标准偏差,即数据的离散程度。对连续可计量的质量特性:用“σ”表示质量特性总体上对目标值的偏离程度。
用户9972271
2022/12/14
8.9K0
VMM是什么?_兮是什么意思
虚拟机监视器(VMM)是一个系统软件,可以维护多个高效的、隔离的程序环境,该环境支持用户直接去访问真实硬件,而这样的程序环境就称为虚拟机。虚拟机是一个真实存在的计算机系统的硬软件副本,其中部分虚拟处理器指令子集以本地(native)方式执行在宿主(host)处理机上,其他部分指令以仿真方式执行。从以上定义可以看出,VMM管理计算机系统的真实资源,为虚拟机提供接口。使用VMM 有以下优点:
全栈程序员站长
2022/08/02
9.2K0

相似问题

在戈朗,零是什么意思?

97

前导零是什么意思?

20

“零延伸”是什么意思?

11

在方法中有花括号是什么意思?

35

“被零终止”是什么意思?

72
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文