腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
用于
绑定
r
中
整数
数据
的
分类
变量
r
我想创建一个
分类
变量
,将每个值分配给一个bin。因此,对于像这样
的
数据
: x <- floor(runif(50,0,40)) 这些类别包括: g1 <- (x >= 0) & (x<= 10)g3 <- (x >= 21) & (x<= 30) g4 <- (x>= 31) 然后,
变量
应该检查类别的x,并将每个观察值分配给一个bin。有没有办法在单个
浏览 19
提问于2020-09-10
得票数 0
回答已采纳
2
回答
用scikit对连续
变量
和范畴
变量
(整型)进行特征预处理-学习
python
、
pandas
、
machine-learning
、
scikit-learn
、
categorical-data
主要目标如下: 另一方面,StandardScaler会缩放基于
整数
的
分类
变量
,这也不是我们想要
的
。由
浏览 4
提问于2017-04-22
得票数 18
2
回答
为什么这是我
的
线性模型
的
输出,我如何修复它?
r
我试图使用
R
建立一个多
变量
线性规划模型,但该模型不断地在输出
中
创建新
的
变量
。 本质上,我试图找到空气质量与不同因素之间
的
相关性,例如人口,一天
中
的
时间,天气读数,以及其他一些因素。在本例
中
,我在几个月
的
时间内查看了多个不同
的
传感器位置。我有关于实际AQI
的
数据
,天气
数据
,并假设传感器周围的人口不会随着时间
的
推移而变化(这可能是我
浏览 34
提问于2019-11-11
得票数 0
回答已采纳
1
回答
R
中
的
randomForest与因子
变量
r
、
classification
、
random-forest
、
categorical-data
我有一个
数据
集,有一些连续
变量
,一些序数
变量
和一些
分类
定性
变量
。 我想使用一个随机森林
分类
器(我有一个
分类
结果),但我不知道如何处理序号和
分类
特性,它们目前都编码为factor。我希望序数
变量
被视为数字,而定性
变量
则将每个级别作为单独
的
虚拟
变量
。
R
的
randomForest通常如何处理factor特性?我是否应该将定性
变量
转换为
浏览 1
提问于2022-06-24
得票数 0
回答已采纳
3
回答
对非常庞大
的
数据
集进行评分
database
、
r
、
hadoop
、
bigdata
、
scoring
我使用
R
/Python在1-2%
的
样本
数据
上建立了一个合适
的
机器学习
分类
器,我对准确率指标(精确度、召回率和F_score)相当满意。现在我想给一个有7000万行/实例
的
大型
数据
库打分,这个
数据
库驻留在Hadoop/Hive环境
中
,
分类
器是用
R
编写
的
。有关
数据
集
的
信息: 7000万X 40个
变量
(列
浏览 3
提问于2015-04-25
得票数 3
1
回答
在
R
中
运行HLM中介
r
、
glm
、
lme4
: med.fit <- glmer(M ~ treat + control + (1|subject_id) ,family = binomial(link = "logit"), data =
R
1out.fit <- glmer(Y ~ M+ treat + control+ (1 + M|subject_id),family = binomial(link = "logit"), data =
R
1out.fit, treat = "treat", mediator = &qu
浏览 0
提问于2018-09-23
得票数 0
1
回答
Scikit学习
中
的
分类
数据
转换
python
、
numpy
、
machine-learning
、
scikit-learn
我有一个4000万×22
的
整数
数据
数组,
用于
分类
任务。大多数功能都是
分类
数据
,使用不同
的
整数
值来表示不同
的
类别。例如,在列“Color”
中
,0表示蓝色,1表示红色,依此类推。我已经使用LabelEncoder对
数据
进行了预处理。 是否有必要将这些
数据
纳入SK-learn
中
的
任何
分类
模型?我试图将
数据
浏览 5
提问于2015-01-09
得票数 2
回答已采纳
2
回答
R
中
具有
整数
值
的
光栅
r
、
spatial
、
raster
部分原因是我想限制内存
的
使用,所以我想要创建一个带有
整数
值
的
光栅。我正在使用
R
中
的
包光栅,虽然我似乎能够创建一个带有
整数
值
的
栅格,但提取
的
值是数字
的
。下面是一个简单
的
例子。library(raster)
r
<- raster(nrow=10,ncol=10)<em
浏览 0
提问于2014-02-19
得票数 1
回答已采纳
1
回答
LabelEncoding a Dataframe
dataframe
我有一个包含
整数
变量
和
分类
变量
的
数据
。是对所有
变量
(
整数
变量
和范畴
变量
)进行标记编码,还是只对
分类
功能进行编码?
浏览 0
提问于2019-01-31
得票数 -1
回答已采纳
1
回答
生成序数
数据
python
、
dataset
、
statistics
、
sampling
我想要生成
的
合成
数据
是顺序
的
,即有序
的
,在Python
中
。但我该怎么做呢?在生成序数
数据
和
分类
数据
方面有什么不同?我正在阅读Valera和Ghahramani
的
论文“
数据
集中
变量
的
统计类型
的
自动发现”。在这篇文章
中
,他们写道:“我们通过抽样一个带有$
R
$类别的多项
变量
来解释
分类
数据</
浏览 0
提问于2018-06-18
得票数 0
回答已采纳
1
回答
随机林
的
混合预测类型
machine-learning
、
classification
、
random-forest
、
feature-selection
我试图建立一个使用随机森林
的
分类
模型,
用于
一个包含5个预测
变量
的
数据
集。两个预测
变量
是连续型
的
,一个可以是[0, 1000]区间中
的
实值,另一个可以是[-10, 10]
的
实值;一个预测
变量
是[10000, 15000]
的
整数
值。另外,剩下
的
两个预测
变量
具有
分类
值,即{ A, B, C, D, E F}和{NY,
浏览 1
提问于2014-08-18
得票数 1
回答已采纳
1
回答
如何处理其中包含大量层次
的
分类
特征
r
、
categorical-data
我正在研究一个具有维数
的
R
中
的
数据
集[1] 15844717 11一个特点是在15844717
中
有273596(随机
整数
用作id)唯一值。第二个特征是在15844717
中
有884353(随机
整数
用作id)唯一值。 我
的
困惑是,是否将它们转化为因素,因为具有大量水平
的
分类
变量
在建模时会产生问
浏览 4
提问于2017-08-09
得票数 1
1
回答
使用ggplot2创建多个条形图时缺少分组
变量
r
、
ggplot2
、
bar-chart
我是
R
和ggplot2
的
新手,我正努力思考如何在彼此之间创建多个条形文字。我有一个包含5个不同
变量
的
数据
集: "DepressionSymptoms",
分类
:无、怀疑、轻、
中
、重度<代码>H 119<//代码>变异级别:无、怀疑、轻、
中
、重度<代码>H 214/代码><代码>
变量
5:“SomaticSymptoms”,
分类<
浏览 2
提问于2020-05-24
得票数 0
回答已采纳
2
回答
缺失值的确定与范畴值
的
处理
python
、
scikit-learn
、
pandas
、
categorical-data
、
data-imputation
我有一个
数据
集(1000万行,55列),其中有许多缺失
的
值。我需要使用其他不缺失
的
值来预测这些值,即用不属于NaN
的
东西替换它们。平均值和中位数不是解决办法。我试图对其他方法进行研究,但这些方法都不起作用,因为我有很多
分类
变量
。我还尝试使用一个热编码将
分类
变量
转换为
整数
,但我不确定这在我
的
情况下是否是一个解决方案,因为只有一个
分类
列,我将得到600个新列。如果我对其他
分类
专栏也这么
浏览 0
提问于2017-05-23
得票数 4
3
回答
包含
分类
变量
和连续
变量
的
数据
集
的
类PCA分析
dataset
、
statistics
我有一个包含一个
分类
变量
和多个连续
变量
的
数据
集。
分类
变量
被编码为离散
整数
,而连续
变量
只是浮动
的
范围。我相信,我
的
数据
集中
的
方差几乎完全可以用单一
的
范畴
变量
和许多连续
变量
中
的
一个来描述。为了证明这一点,我有兴趣使用PCA,但我不确定在考虑
分类
数据</e
浏览 0
提问于2018-09-19
得票数 1
1
回答
用scikit进行平均降低精度
的
精度评分
python
、
machine-learning
、
statistics
、
scikit-learn
、
classification
我一直在运行‘平均下降精度’度量,这个显示了这个度量:如果我换不换的话这里有人吗。谢谢你
的
帮助!以下是网站
的
代码,以防您懒得点击:) from sklearn
浏览 4
提问于2015-07-10
得票数 3
回答已采纳
2
回答
如何对
数据
挖掘过程
中
的
数据
进行
分类
?
r
、
apriori
、
categorical-data
我正在使用apriori函数执行
数据
挖掘过程。此函数仅适
用于
分类
数据
,没有值,但仅适
用于
文本。我
的
数据
集满足了这些要求,因为我有五个类别
变量
,没有数值,只有文本(因此
变量
‘性别’被
分类
为‘女性’和‘男性’)apriori(data) column(s) 1, 2, 3, 4,
浏览 2
提问于2013-11-23
得票数 4
2
回答
基于MATLAB
R
2015a
的
支持向量机多
分类
matlab
、
classification
、
svm
、
matlab-guide
我尝试使用MATLAB
R
2015a
分类
工具箱对我
的
4个类进行
分类
。我导入了
数据
集,并选择了一个高斯核来训练
分类
器。;54.49 2;48.82 2;52.00 2;49.79 2;22.46 3;30.38 3;然后,我将它导出到我
的
工作区
中
,以便与我
的
新测试
数据
一起使用它,但是当我想在工作空间中使用它时,会出现以下错误: 已经在基本工作区
中
浏览 1
提问于2015-09-24
得票数 0
1
回答
如何处理预测
变量
,这些
变量
都是绝对
的
,但目标
变量
是
整数
?
predictive-modeling
我有时间(小时、日等)
的
历史
数据
。和以
整数
格式链接到事件数
的
区域代码。我开始在
R
中
建立一个模型来预测给定时间和区域
的
事件数。我在
R
中
探索了支持向量机( SVM ),但似乎它是不可能有
分类
变量
的
。在这里可能有用
的
任何其他方法。谢谢你
的
回应。
浏览 0
提问于2016-05-07
得票数 0
1
回答
如何为
R
中
的
分类
数据
生成自举置信区间?
r
、
confidence-interval
我正在尝试为
分类
数据
的
R
中
的
正态分布
数据
建立简单
的
95% bootrapped置信区间。常规
的
Bootstrap Confidence Intervals in Rboot.ci似乎不适
用于
分类
变量
df <- data.frame( dose = rep(c("10","20","30
浏览 12
提问于2020-10-21
得票数 0
回答已采纳
点击加载更多
相关
资讯
R语言逻辑回归分析连续变量和分类变量之间的“相关性“
中电信量子申请用于数据分类的量子-经典混合网络及任务处理方法专利,提高分类任务的处理精度
Python中的变量、数据类型、运算符
如何在标签软件中只显示完整数据中的部分内容
如何按照 Excel 中的目录,从多个工作表中查找出完整数据?
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券