腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
是否
可以
在
PySpark
中
使用
带有
OneVsRest
的
LinearSVC
模型
?
、
我正在尝试
在
PySpark
的
OneVsRest
中
使用
LinearSVC
模型
,但似乎还不支持。我
的
错误消息
LinearSVC
only supports binary classification. 1 classes detected in
LinearSVC
_43a50b0b70d60a8cbdb1__labelCol 为了
在
PySpark
中
实现它,我需要做哪
浏览 53
提问于2019-10-10
得票数 0
1
回答
运行
pyspark
svm
模型
时CPU
使用
率较低
、
、
我正在尝试
在
非常非常大
的
数据集上运行svm,而我无法
使用
sklearn来运行它。
使用
sklearn需要无尽
的
时间。所以我决定
使用
pyspark
这里是我
的
spark配置 [('spark.app.id', 'local-1606562652917'), .ap
浏览 80
提问于2020-11-28
得票数 0
2
回答
PySpark
ML:
LinearSVC
的
OnevsRest
策略
、
、
、
、
我是
PySpark
的
新手。我
在
Windows10上安装了Spark 2.3.0。我想
使用
线性支持向量机分类器进行交叉验证
的
训练,但对于有3个类
的
数据集。因此,我正在尝试应用Spark ML
的
一种vs Rest策略。但是似乎我
的
代码中有一些错误,因为我得到了一个错误,表明
LinearSVC
是用于二进制分类
的
。以下是我
在
调试时尝试执行"crossval.fit“行时出现
的
错误
浏览 2
提问于2018-05-15
得票数 2
1
回答
Pyspark
使用
窗口函数和我自己
的
函数
、
、
、
我有一个Pandas
的
代码,它计算出x窗口上线性回归
的
R2。参见我
的
代码: def lr_r2_Sklearn(data): X = pd.Series(list(range(0,len(data),1return(regressor.score(X,Y)) r2_rolling = df[['value']].rolling(300).agg([lr_r2_Sklearn]) 我做了一个大小为300
的
滚动,并计算每个窗口
的
浏览 29
提问于2020-06-26
得票数 0
回答已采纳
1
回答
如何
使用
Spark上
的
交叉验证对SVM和DT进行数据分割
、
、
我
在
我
的
项目中
使用
Spark MLlib。我
使用
了支持向量机,决策树和随机森林。我已经将数据集分为训练和测试(60%
的
训练,40%
的
测试),并得到了我
的
结果。我想重复我
的
工作,但
使用
交叉验证来分割数据,而不是
使用
SVM、DT和RF
的
百分比分割。 我怎么能在Spark上做到这一点呢?我找到了几个
使用
logistic回归和管道进行拆分
的
代码,这些代码不适用于SVM。
浏览 48
提问于2019-01-01
得票数 1
1
回答
科学知识学习
在
多类分类
中
默认
使用
1-VS-Rest吗?
、
、
、
我看到我有三个选择: 分类器= sv.
LinearSVC
(random_state=123) classifier.fit(Xtrain,ytrain) classifier.score(Xtest,ytest) 分类器= OneVsRestClassifier“封装”
在
OneVsOne对象
中
,生成用于培训和测
浏览 2
提问于2018-08-28
得票数 5
回答已采纳
1
回答
PySpark
MLlib: AssertionError:分类器不是从HasRawPredictionCol扩展
的
、
、
、
、
我是星火公司
的
新手。我想在
PySpark
MLlib
中
对支持向量机进行多类分类。我
在
Windows上安装了Spark2.3.0。但是,我搜索发现支持向量机只
在
星火库
中
实现了二进制分类,所以我们必须
使用
一种-vs-all策略。这给了我一个错误,当我试图
使用
一个-vs-所有的支持向量机。我寻找错误,但没有找到解决办法。我
使用
了来自这个链接
的
one-vs-all代码。这是我
的
代码: fro
浏览 1
提问于2018-04-29
得票数 1
回答已采纳
2
回答
AttributeError:'str‘对象没有'fit’属性-
Pyspark
、
我尝试
在
PySpark
3
中
运行下面的脚本,并收到下面的错误消息。我正在
使用
这与格式化有关,但我不确定如何去做。任何帮助都将不胜感激。
浏览 18
提问于2019-07-08
得票数 0
回答已采纳
1
回答
平衡线性支持向量机赢得除一比一外
的
每一类
、
、
、
我正在训练一个正常
的
和平衡
的
线性支持向量机
使用
不平衡
的
数据,并测试两者
使用
F1评分。- scores: 0.565 vs 0.540作为数据集,我在这里
使用
了酵母菌 (UCI)
浏览 0
提问于2016-03-14
得票数 3
回答已采纳
2
回答
支持向量机
的
Spark MLLib交叉验证
、
、
、
我
使用
Spark对LabeledPoints
的
MLLib进行分类。我想交叉验证它。哪种方法是最好
的
?有没有人有示例代码?我找到了依赖于DataFrame
的
CrossValidator类。我
的
目标是获得F-score。
浏览 3
提问于2016-03-09
得票数 2
1
回答
在
火花放电
中
读取svm
模型
时
的
问题
、
、
我刚开始
使用
pyspark
,我刚刚将我
的
LinearSVC
模型
保存在一个名为"svm.model“
的
文件夹
中
。我有两个文件夹:数据和元数据。# Spark environmentfrom
pyspark
.ml.classification impor
浏览 0
提问于2020-11-19
得票数 0
回答已采纳
2
回答
火花ML错误:不正确
的
否。
使用
线性SVC时检测到
的
类
的
、
、
、
、
我正在研究一个二进制分类问题,并
使用
SparkML,我
使用
随机森林和Logistic回归
模型
训练和评估我
的
数据,现在我想检查支持向量机如何对我
的
数据进行分类。trainingData.select('label').distinct().show()|label|| 0.0|+-----+
pyspark<
浏览 1
提问于2018-09-04
得票数 2
1
回答
需求失败: OneHotEncoderModel期望输入列标签
的
x分类值,但是输入列有指定n个值
的
元数据
、
在
使用
Pyspark
(版本2.4.5)培训MultilayerPerceptronClassifier时,我得到了以下例外: requirement failed: OneHotEncoderModel但是,对于相同
的
数据集,代码
在
RandomForestClassifier、DecisionTreeClassifier、GBTClassifier和
LinearSVC
中
运行得很好。
浏览 0
提问于2021-07-10
得票数 2
回答已采纳
2
回答
Spark/
Pyspark
: SVM -如何获得曲线下面积?
、
、
我最近一直
在
处理随机森林和朴素贝叶斯。现在我想
使用
支持向量机。from
pyspark
.ml.classification import
LinearSVC
svm =
LinearSVC
(maxIter=5, regParamBinaryClassificationMet
浏览 2
提问于2018-01-25
得票数 1
回答已采纳
1
回答
我
是否
可以
修改Logistic回归分类器,以便根据概率输出多个类?
、
、
我正在训练一个关于文本数据
的
Logistic回归分类器。我发现我
的
许多数据点有多个目标类。
是否
可以
根据数据修改我
的
模型
以输出多个类。我计划将我培训集中
的
多类数据点分割成不同
的
类(也就是说,如果一个x有3个类,我将将该文本分割为3个,这样每个不同
的
文本都有一个与其关联
的
惟一类)。+Probabilty(Class_n)>0.95 为此,我将
使用
prdict_proba方法LogisticRegr
浏览 0
提问于2021-05-24
得票数 0
3
回答
在
ml
中
调用fit()之后,经过训练
的
数据存储在哪里?
、
、
、
我是刚开始机器学习
的
,对python没有太多经验。 在下面的代码
中
,经过训练
的
数据
在
我们调用fit()之后存储在哪里,以及
在
调用predict()方法之后它如何知道数据
是否
经过了训练。我知道这可能是个愚蠢
的
问题,但我们会非常感谢你
的
帮助。
浏览 3
提问于2020-01-16
得票数 2
回答已采纳
1
回答
从
LinearSVC
模型
中
检索变量(分类参数)
的
方法
sklearn
的
svm
LinearSVC
使用
以下
模型
:我一直
在
查看文档,找不到找到这些值
的
任何方法。
LinearSVC
类似乎有一个get_params方法,但返回
的
参数都与分类参数不匹配。 有人有检索这些值
的
经验吗?甚至
可以
使用
sklearn
的
LinearSVC</e
浏览 0
提问于2018-06-18
得票数 0
回答已采纳
5
回答
属性错误:‘
LinearSVC
’对象没有属性'predict_proba‘
、
、
我正在尝试
使用
LinearSVC
分类器。import word_tokenizefrom sklearn.svm import
LinearSVC
, SVC
LinearSVC
_classifier.train(featuresets)但当我试图用概率分类
的<
浏览 8
提问于2017-11-15
得票数 12
回答已采纳
3
回答
在
非星火环境中加载
pyspark
模型
、
、
、
我对
在
python中部署机器学习
模型
感兴趣,因此
可以
通过对服务器
的
请求进行预测。 我将创建一个Cloudera集群,并利用Spark开发这些
模型
,
使用
这个库
pyspark
。我想知道如何保存
模型
以便在服务器上
使用
它。我已经看到不同
的
算法都有.save函数(就像本文中
的
所回答
的
那样),但是由于服务器将位于不同
的
机器上,而不是
在
Cloudera集群<e
浏览 11
提问于2016-11-21
得票数 14
回答已采纳
1
回答
如何处理分类器
中
的
不平衡类?
、
我正在
使用
LinearSVM将我
的
文档分类为类别。然而,我
的
数据集是不平衡
的
,有些类别有48,000个文档,有些甚至小到100。当我训练我
的
模型
时,即使
使用
分层
的
KFold,我也看到,与其他文档相比,拥有48 000个文档
的
类别获得了更多
的
文档(3300)。在这种情况下,它肯定会给我有偏见
的
预测。labels[train_index],labels[test_index] 然后,我将这些(X_tr
浏览 2
提问于2016-03-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Bootstrap方法在Python中绘制带有置信带的ROC曲线
在员工培训中可以使用技术的方法
三维模型、BIM、OSGB在ArcGIS中的使用
在Scratch中也可以使用列表?教你如何创建一个好用的列表!
您现在可以在iOS 12中将Apple地图与Apple的CarPlay捆绑使用
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券