腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3688)
视频
沙龙
1
回答
如何
内省
并
预
加载
MongoDB
中
的
所有
集
合到
Spark
SQL
目录
中
?
、
、
、
在学习
Spark
SQL
时,我一直使用以下方法将集合注册到
Spark
SQL
目录
中
并
对其进行查询。MongoPerson] = Seq(MongoPerson("John", "Doe")) .write .format("com.
mongodb
.
spark
.
sql
.DefaultSourc
浏览 25
提问于2021-07-02
得票数 2
回答已采纳
1
回答
在scala中将dataframe转换为json
、
、
、
假设我有一个wordcount示例,其中我在一列
中
以word
的
形式获得数据,而在另一列
中
获得wordcount,则希望收集相同
的
数据,并将其存储为mongo集合
中
的
json数组。word:"abc",count:1},{word:"xyz",count:23}]} 当我在dataframe上尝试.toJSON并将值收集为list并将其添加到dataframe时,存储在mongo
中
的
结果是字符串
的
浏览 2
提问于2018-04-13
得票数 3
1
回答
在
spark
executors上找不到Apache Phoenix JDBC驱动程序
、
、
我正在通过胖客户端连接到apache phoenix,并且已经提供了phoenix-client.jar to --files,但是executor仍然无法找到驱动程序。
浏览 19
提问于2019-08-04
得票数 0
1
回答
MongoDB
&
Spark
: mongo-hadoop和mongo-
spark
的
区别
、
、
、
mongo-hadoop和mongo-
spark
连接器有什么不同,pymongo只能和mango-hadoop一起使用吗? pymongo只与mongo-hadoop一起使用吗?
浏览 2
提问于2018-07-10
得票数 0
2
回答
如何
使用来自
MongoDB
的
过滤记录来构建星火数据帧?
、
、
、
我
的
应用程序是使用
MongoDB
作为平台构建
的
。DB
中
的
一个集合具有大量
的
数据量,并且选择了apache通过计算来检索和生成分析数据。我已经将配置为与
MongoDB
通信。我需要使用
MongoDB
吡火花查询来查询集合,
并
构建一个由
mongodb
查询结果
集
组成
的
数据
集
。请给我一个适当
的
解决办法。
浏览 5
提问于2016-08-09
得票数 3
回答已采纳
4
回答
如何
有效地从
mongodb
读取数据并将其转换为
spark
的
数据?
、
、
我在这里能找到
的
最接近
的
问题是。connection_string = '
mongodb
://%s:%s/randdb.我还尝试了代码中注释掉
的
变体。但一切都同样缓慢。对于一个大小为2GB
的
集合(100000行和1000列)
浏览 9
提问于2016-04-20
得票数 3
回答已采纳
1
回答
如何
从拼花地板的当前日期开始读取最近N天
的
最后天数
、
我已经用partition by date类型列将数据以拼图文件格式保存在仓库
中
。文件数据保存方式与仓库路径类似。Tespath/filename/dt=2020-02-28 如果我读取
所有
的数据,它
的
数据量是非常大
的
。
浏览 14
提问于2020-02-24
得票数 1
回答已采纳
1
回答
访问网页时IIS宿主应用程序停止
、
我有一个
Spark
.Release,其中配置了指向本地C:\驱动器上一个
目录
的
站点。池自动启动,但当访问时,应用程序池将更改为“停止”状态。返回
的
错误消息是:“”。工作进程将被标记为不健康
并
被关闭。数据字段包含错误代码。在Windows Logs > System中有5种情况发生: 为应用程序池“
Spark
.Release”服务
的
进程报告了应用程序
预
加载
或服务
加载
期间
的
故障。过程id为
浏览 1
提问于2018-04-27
得票数 0
回答已采纳
2
回答
使用jQuery
预
加载
目录
中
的
所有
图像
、
、
、
我希望
预
加载
一个名为img
的
目录
中
的
所有
图像,该
目录
还包含一个名为ui_images
的
子
目录
。我知道
如何
通过将特定图像
的
名称放入数组
并
执行
预
加载
工作来
预
加载
特定图像,但我想知道
如何
告诉脚本动态搜索img和img/ui_images
目录
中</
浏览 1
提问于2012-09-10
得票数 2
回答已采纳
4
回答
通过com.databricks.
spark
.csv
加载
RStudio
、
我还安装了它
的
R软件包SparkR,我可以使用它通过火花-壳牌和通过RStudio,然而,有一个区别,我无法解决。./bin/sparkR --master local[7] --packages com.databricks:
spark
-csv_2.10:1.0.3flights<- read.df(sqlContext, "data/nycflights13.csv", "com.databricks.
spark
浏览 0
提问于2015-06-16
得票数 4
回答已采纳
1
回答
如何
使用Pyspark从
mongodb
中
仅提取特定行?
、
、
、
我正在从
mongodb
集合中提取数据,
并
使用
Spark
python代码将其写入bigquery表。下面是我
的
代码片段: .format("com.
mongodb
.
spark
.
sql
.DefaultSource")\ .option("uri","
mongodb
_url但我只想提取满足条件
的
文档(如
sql</e
浏览 1
提问于2021-02-18
得票数 0
2
回答
解析
spark
中
架构较少
的
mongo集合时出现问题
、
、
我使用
Spark
将数据从一个集合移动到其他集群
中
的
另一个集合。数据
的
模式是不一致
的
(我
的
意思是在一个集合中有很少
的
模式,具有不同
的
数据类型,变化很小)。当我尝试从
spark
读取数据时,采样无法获得数据
的
所有
模式,
并
抛出下面的错误。(我有一个复杂
的
模式,我不能明确地提到它,而不是通过采样来获取
spark
。)com.
mongodb
.
浏览 0
提问于2018-06-21
得票数 5
2
回答
如何
验证CDC数据管道?
、
、
我们有一个使用自定义python代码消费CDC流
的
MongoDB
。CDC流被转储为文件,由
spark
进一步使用,它对文件运行
SQL
并将结果
集
转储到Kafka
中
。问题:这些是
如何
处理
的
?什么是行业标准?
浏览 10
提问于2022-06-28
得票数 0
1
回答
Spark
vector UDF
的
Apache Ignite类比与一般
的
分布式计算
我使用
Spark
已经有一段时间了,在Python
中
取得了成功,但是我们有一个用C#编写
的
产品,它将从分布式和并行执行
中
受益良多。我做了一些研究,
并
尝试了新
的
C#应用程序接口,但目前这有点限制。然而,我想知道在我们
的
用例
中
,它是否真的可以用来取代
Spark
--我们需要
的
是一种执行数据帧类型操作
的
分布式方式。特别是,我们在Python
中
的
许多代码都是使用Pandas
浏览 14
提问于2019-11-08
得票数 0
回答已采纳
3
回答
Apache Drill vs
Spark
、
、
、
我有一些使用Apache
Spark
和
Spark
-
SQL
的
经验。最近我发现了Apache Drill项目。你能描述一下它们之间最重要
的
优势/区别是什么吗?我已经读过了,但这个话题对我来说还不清楚。
浏览 0
提问于2015-04-22
得票数 15
回答已采纳
1
回答
预
加载
实体框架4树
我想在我
的
web应用程序
中
预先
加载
我
的
目录
。我正在使用EF4,
并
希望
预
取我
所有
的
目录
数据。有没有简单
的
方法可以用EF4做到这一点呢?数据库结构: Catalog ->类别->类别->产品->选项谢谢
浏览 0
提问于2011-06-01
得票数 1
回答已采纳
1
回答
使用.saveAsTable()将表保存到配置单元元存储,
如何
重新
加载
?
、
、
我在我
的
DataFrame上使用了.saveAsTable,现在它存储在我
的
HDFS hive仓库元存储
中
。
如何
将其重新
加载
到
Spark
SQL
中
?我已经删除了我
的
集群(Azure HDInsight),
并
创建了一个新
的
集群,确认了我
的
Hive元存储位置是相同
的
,并且
目录
仍然在那里。我需要再次将其作为持久表
加载
,而不是像使用Po
浏览 0
提问于2018-03-19
得票数 1
1
回答
如何
在已安装应用程序
的
bin
目录
中
创建和运行ASP.NET网站
、
、
要创建使用EXAMPLE...to
的
新控制台应用程序,您必须引用该程序
集
,并将控制台应用程序
的
输出
目录
设置为已安装应用程序
的
BIN
目录
。(由于使用反射等,
所有
东西都必须留在应用程序
的
BIN
目录
中
并
输出到该
目录
,您不能只复制一个程序
集
的
本地,否则什么都不能工作) 我
的
问题是,在创建ASP.NET web forms应用程序时(与控
浏览 0
提问于2013-06-25
得票数 1
回答已采纳
1
回答
从
SQL
数据库源写入
MongoDB
的
最佳方式是什么?
、
、
我正在尝试将MySQL数据库迁移到
MongoDB
数据库,方法是遍历各行,获取数据,然后从相应
的
MongoDB
行插入正确
的
MySQL信息。我想知道访问原始.
SQL
文件(在Ruby语言中)
的
最佳方式,这样我就可以将其放入哈希表
中
。
浏览 0
提问于2011-06-29
得票数 0
回答已采纳
1
回答
错误:无法
加载
文件或程序
集
“Oracle.ManagedDataAccessDTC”或其依赖项之一
、
、
、
、
背景 控制台应用程序执行得非常好。我应该注意到,我知道这是Oracle.ManagedDataAccess DLL 32&64位版本之间
的
一个比特问题。但是,为什么针对同一
浏览 4
提问于2013-02-21
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark SQL,DataFrames 以及 Datasets 编程指南
教程:Apache Spark SQL入门及实践指南!
如何在万亿级别规模的数据量上使用 Spark?
一文读懂Apache Spark
Spark之SparkSQL
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券