腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用于
数据
清理
的
VarianceThreshold
函数
、
我有以下
函数
,我想使用它来查看基于方差
的
不同阈值选择了多少个特征。导入org.apache.spark.ml.feature.VarianceThresholdSelector def
varianceThreshold
(df: DataFrame, thresholds我有一个看起来像这样
的
DataFrame: ? 现在我
的
问题是,如果col2是预测变量,也就是我试图预测
的
值,那么我如何对所有其他列进行分组,以便将其作为特征进行传递。with variance lower
浏览 80
提问于2021-11-11
得票数 0
回答已采纳
3
回答
在消除低方差之前对
数据
进行规范化,会产生错误。
、
、
、
我正在用scikit测试iris
数据
集(可以从sklearn.datasets加载
函数
load_iris() )--学习
函数
normalize和
VarianceThreshold
。看来,如果我使用MinMaxScaler,然后运行
VarianceThreshold
,就没有剩下
的
特性了。width (cm) Mean: 0.4580555555555556 var = 0.10019668209876545 var/mean: 0.2187435145879658 我
浏览 10
提问于2020-04-11
得票数 3
1
回答
ValueError: X中没有任何特性满足方差阈值
、
我正在尝试使用
VarianceThreshold
,但是我得到了错误:我
的
代码: sel =
VarianceThreshold
(threshold=(
浏览 1
提问于2020-04-11
得票数 2
2
回答
通过误差
的
方差阈值形状
、
、
、
、
我有这样
的
特性,我正试图根据方差阈值来减少这些特性:RangeIndex: 120 entries,intelectual / 1kmgeomemory usage: 5.6 MBdef
VarianceThreshold
_selector(data): colu
浏览 3
提问于2017-10-23
得票数 1
1
回答
使用TPOT分级机
的
形状或石灰
、
、
、
例如,以下是shap库
的
一些代码,但您不能将TPOT管道传递给它。你会把什么东西放进去?
浏览 3
提问于2021-05-05
得票数 0
1
回答
VarianceThreshold
()不返回预期输出
、
、
我正在从我
的
数据
中
清理
分类变量。更具体地说,我现在移除准常量
的
范畴变量。我搜索了一下,发现来自sklearn.feature_selection
的
sklearn.feature_selection可以胜任这项工作。然而,我得到了意想不到
的
结果。, columns=train_df_cat.columns) var_thr =
VarianceThreshold</e
浏览 5
提问于2022-08-24
得票数 0
回答已采纳
1
回答
scickit学习流水线类中
的
拟合方法
、
假设我有以下python代码: from imblearn.pipeline import Pipeline from sklearn.decomposition import PCA selector =
VarianceThreshold
sampler', ros), ('pca', pca), ('kN
浏览 12
提问于2019-12-14
得票数 2
6
回答
在Scikit特性选择之后保留特征名
、
、
、
、
在运行了Scikit中
的
方差阈值之后--学习一组
数据
,它删除了几个特性。我觉得我在做一些简单而又愚蠢
的
事情,但我想保留剩下
的
特性
的
名称。以下代码: selector =
VarianceThreshold
(.5) selector = (pd.DataFrame(selector.transform(data))) retu
浏览 6
提问于2016-10-02
得票数 19
回答已采纳
2
回答
fit_transform后阵列大小
的
不同
、
我对fit_transform
函数
有问题。有人能解释为什么数组大小不同吗?X.shape, test.shape features = sel.fit_transform(X)In [7]: features.shape,
浏览 0
提问于2015-08-31
得票数 3
回答已采纳
4
回答
使用scikit-learn删除低方差
的
特性
、
、
from sklearn.feature_selection import
VarianceThreshold
sel =
VarianceThreshold
(threshold=(.8 * (1 - .8))) sel.fit_transform“code (6,2)",但在我
的
示例中,我有一个形状为(行51,列9000)
的
巨大
数据
浏览 1
提问于2015-03-27
得票数 14
回答已采纳
2
回答
方差阈值与VIF之差
我在sklearn中遇到了一个叫做
VarianceThreshold
()
的
函数
。这与状态模型中
的
variance_inflation_factor()
函数
有关吗?如果它们是不同
的
,那么这两种功能到底有什么区别呢?
浏览 0
提问于2022-07-06
得票数 1
1
回答
保留已删除列
的
索引
、
、
我希望删除
数据
数组中方差低
的
特性。通过使用scikit-learn,代码如下所示。>>> from sklearn.feature_selection import
VarianceThreshold
>>> selector =
VarianceThreshold
()array([[2,
浏览 3
提问于2016-05-02
得票数 1
回答已采纳
1
回答
在scikit学习管道中是否存在“或”-functionality
、
我使用
的
是scikit学习库
的
管道和GridSearchCV。 [('kbest', SelectKBest()), (
浏览 0
提问于2016-08-05
得票数 1
1
回答
在样条线中使用特征选择和ML模型时,如何确定滑雪板样条采用fit_transform方法?
、
、
、
load_breast_cancerfrom sklearn.feature_selection import
VarianceThreshold
y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0) X_new = fs_pipeli
浏览 6
提问于2022-07-25
得票数 1
回答已采纳
2
回答
用于
清理
所有
数据
的
PHP
函数
、
、
清理
所有可能被sqlinjected注入
的
数据
是一个好主意,还是一个愚蠢
的
主意?我写了一个
函数
来做这件事,但是我从来没有见过这样做,我想知道这是不是一个糟糕
的
想法。我写
的
函数
:{ $_SERVER['HTTP_USER_AGENT'] = mysql_real_escape_string($_SERVER[
浏览 0
提问于2010-09-14
得票数 1
回答已采纳
2
回答
用于
清理
数据
的
自定义
函数
、
我正在尝试做一个定制
的
R脚本来帮助我
清理
数据
,然后再做一些有趣
的
事情。我当前
数据
集中
的
许多列都有yes/no值,我认为如果将它们设置为二进制1/0值,将更容易查看。对于这个特定
的
项目,它是可行
的
,但是如果您有一个包含100列需要转换
的
数据
集,则必须有一种方法来完成它。我不能只看它有多少级别,因为还有其他列,它们有两个级别,但作为二进制没有多大意义。这就是我尝试过
的
: #Get s
浏览 0
提问于2017-12-24
得票数 0
回答已采纳
1
回答
python中
的
特征选择
、
、
我试图应用
的
第一种技术是仅使用这些特性
的
差异来选择特性。sel =
VarianceThreshold
(threshold=(0.00010 * (1 - .15))) new_test = model1.transform(test) 实际上,我希望使用列车
数据
集计算选定
的
特性,然后将其应
用于
测试
浏览 0
提问于2017-07-06
得票数 1
回答已采纳
1
回答
Sklearn单变量选择:特征是恒定
的
、
、
当我尝试对sklearn中
的
一些
数据
使用特征选择和f_classif (方差分析测试)时,我得到了以下警告信息:警告消息指出
的
特征是恒定
的
,显然p值为0。我找不到任何有关导致此警告
的
信息。此特定
函数
浏览 0
提问于2016-01-31
得票数 4
2
回答
方差作为特征选择
的
标准
、
我在研究一个无监督
的
聚类问题。我多次读到,可以选择一个方差较高
的
变量,而不是一个方差较低
的
变量。例如,scikit-learn实现了一个
函数
,该
函数
删除方差低于阈值
的
特性。(sklearn.feature_selection.
VarianceThreshold
) 然而,方差不完全依赖于规模/度量单位吗?如果我将我
的
特性标准化,所有这些特性
的
方差都是1。
浏览 0
提问于2020-06-01
得票数 1
回答已采纳
5
回答
用于
清理
Mysql
数据
库输入
的
函数
、
、
、
我正在尝试将一个通用
函数
放在一起,它将
清理
Mysql
数据
库
的
输入。到目前为止,我得到
的
是: if(get_magic_quotes_qpc($input)){ return $input;} 如果我理解了get_magic_quotes_qpc()
的<
浏览 0
提问于2012-02-05
得票数 16
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
3个用于时间序列数据整理的Pandas函数
24个用于数据分析任务的常用SQL函数
手机数据清理重要吗?怎样快速清理手机中的数据?
用于链接数据的模版
如何清理Klocwork 项目或者build的残留数据
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券