腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
pyspark流媒体是否适合机器
学习
/科学计算?
、
、
、
我是
spark
的新手,不得不写一个流媒体应用程序,它必须执行一些任务,比如快速傅立叶变换和一些机器
学习
的东西,比如使用svms进行分类/回归等。据我所知,
spark
使用dstream。这些流是否可以转换为numpy数组之类的内容,或者可以作为python函数的输入的类似内容? Thx
浏览 0
提问于2017-09-25
得票数 0
2
回答
Apache
Spark
处理能力和资格
、
、
、
我是Apache
Spark
的新手,不知道它是否适合我的特定场景。在我的例子中,我正在抓取小的数据集(作为MongoDB的JSON文件)。我正在尝试的是对这些数据文件运行机器
学习
(分类/回归)算法,并从中获取信息。 当你考虑这种情况时,你认为
Spark
有资格在集群环境中通过并行处理来加速吗?或者你认为我应该收敛到一些其他的选择?
浏览 5
提问于2017-06-11
得票数 0
1
回答
分组、聚类、分类和预测
、
、
例如,像机器
学习
一样,给它一些样本,然后它就可以理解其他数据的趋势。 谢谢
浏览 1
提问于2015-10-21
得票数 0
1
回答
火花放电MLlib还保持开发吗?
、
、
我2017年出版的“
学习
火种”一书可以读到: 所以我想知道是否有任何关于情况的最新情况。MLlib还在维护吗?
浏览 0
提问于2020-05-29
得票数 0
回答已采纳
2
回答
Flex Builder 3或Flex 4 (Flash Builder 4,又名Gumbo)
、
、
、
作为一个初学者,为了
学习
flex,我应该选择哪个版本或者从哪个版本开始,比如Flex 3还是Flex 4?请详细告知。
浏览 1
提问于2010-06-15
得票数 2
1
回答
Scikit-
学习
KNN(K近邻)使用Apache
Spark
并行化
、
、
、
、
我一直在使用Python和Python的Scikit- learning机器
学习
API研究机器
学习
KNN (K近邻)算法。我已经搜索了许多选项、帮助和代码示例,它们将使用
spark
和Scikit-learn API并行分发我的机器
学习
处理,但我没有找到任何适当的解决方案和示例。您能让我知道如何使用Apache
Spark
和Scikit-learn API的K近邻来实现和提高性能吗? 提前感谢!!
浏览 0
提问于2016-06-12
得票数 1
1
回答
Spark
Machine Learning在一台机器上运行:它是分布式的还是非分布式的?
、
最近我正在
学习
可伸缩的机器
学习
,
Spark
MLlib是我
学习
使用的第一个工具。我已经成功地使用
Spark
MLlib实现了一些简单的机器
学习
任务,比如线性回归,它们在我的笔记本电脑上都运行得很流畅。有人能告诉我为什么
Spark
MLlib让可伸缩的机器
学习
实现更容易吗?
浏览 3
提问于2019-01-03
得票数 0
1
回答
异步算法使用什么框架?
我对一个非常大的数据集有一个问题(谁不呢?)它存储在块中,因此各块之间的差异很小(例如,这些块具有一定的代表性)。我想用算法来进行异步分类,但我想自己编写代码。start a masterwhile some criterion is not met classify the data inexactly using some kind of iterative algorithm and return to master master waits fo
浏览 0
提问于2015-07-09
得票数 2
1
回答
为什么有人要在Tez上运行
Spark
/ Flink?
、
、
、
、
在Saha等人的中,显示了具有Tez的Hadoop2的以下模块化体系结构:为什么有人要在Tez上运行
Spark
/Flink? 其优势是什么?更好地利用纱线?
浏览 0
提问于2016-09-09
得票数 8
3
回答
在同一个大规模数据集上对数百个模型进行评分的最佳实践?
我有预测各种事物的500+模型,以及一个由400m+个人和大约5,000个可能的自变量组成的大型数据库。这个过程耗时太长,容易出错(更多的是它变成的复杂代码网络的一个指标),代价很高(需要大量的云实例),并且只允许在R中构建模型(我想基本上不知道模型来自哪种语言,但我主要想启用Python和R--这是一个不
浏览 0
提问于2020-01-21
得票数 2
2
回答
org.apache.
spark
.ml.classification与org.apache.
spark
.mllib.classification的区别
、
、
例如,LogisticRegression在org.apache.
spark
.ml.classification中有一个,在org.apache.
spark
.mllib.classification中也有一个我唯一能找到的区别是,org.apache.
spark
.ml中的那个是从Estimator继承的,可以用于交叉验证。我很困惑,因为它们被放在不同的包裹里。有人知道原因吗?谢谢!
浏览 8
提问于2015-05-14
得票数 17
回答已采纳
1
回答
如何在pyspark机器
学习
中使用Dataframe?
、
、
、
我已经简单地
学习
了如何使用RDDs来构建ML模型,但在过去,我通常使用数据帧来构建ML模型。我知道
spark
.ml是用于
spark
机器
学习
的DataFrame应用程序接口,但我还没有找到如何使用它的示例。我的问题是,您能否提供一个示例,说明如何使用Dataframe来构建
spark
机器
学习
模型? 另外,如果这个问题不合适的话,很抱歉,我不知道在哪里发布这个问题。
浏览 1
提问于2017-03-09
得票数 1
1
回答
星星之火SQL:使用SQL设置选项
、
、
、
、
我正在尝试使用SQL从
Spark
中读取Avro数据。示例:USING com.databricks.
spark
.avro
spark
.format("com.databricks.
spark
.avro") .option("avroSchema", new Schema.Parser().
浏览 1
提问于2017-06-23
得票数 1
1
回答
sparkML和systemML有什么不同?
、
spark
ML和system ML有什么区别?IBM上的apache
spark
engine中的system ml和
spark
ml都解决了问题,想知道主要区别是什么吗?
浏览 44
提问于2020-04-21
得票数 1
1
回答
在
spark
standalone中使用
spark
- SparkContext时初始化
spark
时出错
此外,
spark
、java和Hadoop的所有环境变量都已设置。 运行
spark
-shell命令时仍收到此错误。请有人help....google它很多,但没有找到任何东西。
浏览 7
提问于2018-08-25
得票数 0
3
回答
如何在R中的大型数据集(15 in )上运行监督ML模型?
、
、
、
、
我有一个数据集(15 GB):7200万条记录和26个特征。我想比较7个监督ML模型(分类问题):支持向量机,随机森林,决策树,朴素贝叶斯,神经网络,KNN和XGBoosting。我创建了一个包含720万条记录的样本集(占整个集的10%)。在样本集上运行模型(甚至是特征选择)已经是一个问题。它有很长的处理时间。目前我只使用RStudio。我正在寻找一个无成本的解决方案来解决我的问题。有人能帮帮我吗?
浏览 25
提问于2019-11-10
得票数 0
1
回答
如何在一台机器上设置全功能(包括集群)星火
学习
发展?
、
我想开始
学习
Spark
2.0,所以我尝试设置我的dev (Scalav2.11)环境。如何设置一个开发环境来
学习
和开发星火应用程序,而不必访问多台机器,但仍然能够
学习
和编写基于
Spark
的全功能环境的代码?
浏览 3
提问于2016-08-13
得票数 0
回答已采纳
1
回答
可以使用
Spark
ML管道加载和测试使用
Spark
MLLib构建的ML模型吗?
、
、
我知道
Spark
有两个用于机器
学习
的库。一个是
spark
.ml,另一个是
spark
.mllib。我只想知道使用
spark
.ml构建的
spark
程序是否可以使用和测试(预测)使用
spark
.mllib pachages构建的模型,反之亦然?
浏览 4
提问于2017-04-24
得票数 0
1
回答
有没有办法在PySpark中设置pandas_udf的最小批处理大小?
、
、
、
、
我正在使用pandas_udf在我的
spark
集群上应用机器
学习
模型,并且对预定义通过箭头发送到UDF的最小记录数很感兴趣。我按照databricks教程
学习
了大部分的UDF...https://docs.databricks.com/applications/deep-learning/inference/resnet-model-inference-tensorflow.html在本教程中,我将
spark
会议设置为具有最大批量大小和启用箭头。
spark
浏览 14
提问于2019-05-22
得票数 3
1
回答
在2018年
学习
Hadoop有什么意义吗?
、
我想扩展我的工具箱并
学习
一个分布式计算框架。 在2013-2014年左右,Hadoop制造了很多麻烦。根据我在这个问题上的有限知识,Apache在各个方面都改进了Hadoop的多种功能。
浏览 0
提问于2018-12-23
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark 学习笔记
Spark基础学习笔记-Spark执行原理分析
如何学习spark大数据
Spark中有哪些机器学习库?
基于Spark的机器学习经验
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券