腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用雅典娜
的
多个
S3
桶
的
清单
、
、
、
我正在尝试使用雅典娜
查询
AWS
S3
。如果我只有一个源桶,我就能做到这一点。我不知道如何将其
配置
为与
多个
源存储桶一起工作。因此,如果我想
查询
多个
源桶
的
库存数据,似乎必须为每个“源桶”创建一个
浏览 0
提问于2019-04-23
得票数 3
回答已采纳
2
回答
无法下载或读取亚马逊
S3
存储桶
中
的
配置
单元
输出
、
、
、
我是AWS和Hive
的
新手,我正在尝试使用Hive来分析Google Ngram数据。我尝试将表保存为
S3
存储桶
中
以制表符分隔
的
CSV,但现在我不知道如何查看它或下载它来查看我
的
作业是否正确执行。我用来创建表
的
查询
是 gram string, occurrences bigint, pages bigintROW FORMAT DELIMITED FIELDS TERMI
浏览 2
提问于2013-04-21
得票数 1
1
回答
在
S3
中
生成
多个
文件
的
配置
单元
查询
、
、
name, gender, action, month, F.idINNER JOIN D ON F.id = D.id表D只有5个不同
的
I,我只是想从F中提取我列出
的
变量,其中F和D
的
id相等。
查询
可以工作,但我
在
我
的
S3
存储桶
中
获得了大约700个
文件
,其中大部分是完全空
的
,也就是0字节。为什么会发生这种情况,有什么原因吗?
浏览 3
提问于2017-01-13
得票数 0
回答已采纳
1
回答
将数据从未分区
的
hive表
的
子
文件
夹
中
获取到spark
中
的
dataframe
中
、
、
配置
单元
中有一个外部表指向未分区
的
s3
位置。该表指向
s3
中
的
一个
文件
夹,但数据位于该
文件
夹内
的
多个
子
文件
夹
中
。即使没有对表进行分区,也可以通过
在
配置
单元
中
设置一些属性来
查询
该表,如下所示:set hive.input.dir.recursive=true; set hive.
浏览 2
提问于2017-10-16
得票数 1
1
回答
在
Amazon EMR
中
查找
配置
单元
UDF
的
控制台输出
的
位置
、
、
、
我
在
java
中
创建了一个可以
在
配置
单元
查询
中
调用
的
UDF,
在
我放在System.out.prinln(msg)
中
的
UDF
中
,希望
在
控制台中输出一些东西。它在我本地
的
工作环境
中
可以正常工作,但是当部署到amazon EMR时,stderr日志
文件
不会显示来自我
的
UDF函数
的
任何
浏览 19
提问于2013-09-04
得票数 2
3
回答
在
S3
上压缩
文件
、
、
、
、
我
在
S3
上有一个17.7
S3
的
文件
。它是作为
配置
单元
查询
的
输出
生成
的
,并且没有压缩。我还没有找到任何直接
的
方法来
在
S3
上压缩
文件
,或者
在
s3cmd、boto或相
浏览 0
提问于2013-01-24
得票数 29
回答已采纳
1
回答
配置
单元
脚本-将
文件
名指定为
S3
位置
、
我正在使用以下脚本将数据从DynamoDB导出到
S3
:STORED BY 'EXTERNAL TABLE TableS3(col1 String, col2 String)LOCATION '
s3
://myBucket/DataFiles/MyData.txt
浏览 1
提问于2012-07-26
得票数 3
回答已采纳
2
回答
加载或指向
多个
拼板路径,用于用蜂巢或预存储程序进行数据分析
、
、
、
、
我有几个火花作业,
在
AWS
S3
中
产生拼花
文件
。每隔一段时间,我需要对这个数据
的
给定日期范围运行一些临时
查询
。我不想在火花中这样做,因为我希望我们
的
QA团队没有知识或火花能够做到这一点。我喜欢做
的
是拆分一个AWS EMR集群,并将拼板
文件
加载到HDFS
中
,并对其运行我
的
查询
。我已经知道了如何用蜂巢创建表,并将其指向一个
s3
路径。但这就限制了我
的
数
浏览 5
提问于2016-04-14
得票数 2
2
回答
amazon EMR
配置
单元
执行错误
、
我正在尝试使用amazon EMR控制台运行一个简单
的
配置
单元
作业。每次我收到一个错误,指出"Error missing argument base-path“,
配置
单元
作业失败。我已将输入
文件
插入到
s3
:// bucket / input位置,脚本位于
s3
://bucket/ script,我
的
配置
单元
查询
如下
浏览 0
提问于2015-04-09
得票数 0
2
回答
如何将数据数组导入
配置
单元
表
中
的
单独行?
、
、
、
、
我正在尝试将以下格式
的
数据导入到
配置
单元
表
中
{ "dataA" : "dataA#1" {"identifier" : "id#2", }我有
多个
这样
的
浏览 2
提问于2017-11-28
得票数 2
1
回答
亚马逊
S3
上
的
403 AccessDenied删除受保护
的
文件
夹
、
、
、
、
我
在
amazon
s3
中
有一个
文件
夹,我限制了删除任何
文件
夹
的
权限。但是,现在发生
的
情况是我不能使用hive脚本创建任何
文件
夹。此
配置
单元
查询
在
_tmp.customerlevel名称下创建一个临时
文件
夹。一旦它完成了map reduce任务,它就会尝试删除它。但是,由于删除
配置
单元
的
限制,
查询</em
浏览 0
提问于2013-07-26
得票数 2
1
回答
在
S3
中
同时存储内部表和外部表
的
区别
、
我
在
S3
中
有一个内部表和一个外部表。
在
HDFS和
S3
中
使用内部表有什么区别?存储
在
S3
中
的
内部表和外部表有什么区别?如果我
在
S3
中
删除外部表,主节点中
的
元数据将被删除,而数据将在
S3
中
,那么由于元数据被删除,我如何访问
S3
中
的
数据?
浏览 4
提问于2017-09-19
得票数 2
2
回答
S3
上
的
Hive多用户和Spark
、
、
案例1:我
的
spark应用程序
在
EMR集群上运行,spark应用程序从
s3
上
的
配置
单元
读取表,并将其写入
s3
上
的
配置
单元
表。
在
本例
中
,
S3
存储桶属于同一个用户usera,因此我将fs.s3.awsAccessKeyId和fs.s3.awsSecretAccessKey添加到一个
配置
文件
中
。
在
我
浏览 0
提问于2017-03-28
得票数 1
2
回答
空字符串
在
配置
单元
中
不被视为null
、
、
我对以下语句
的
理解是,如果在hive列
中
插入空白或空字符串,它将被视为null。TBLPROPERTIES('serialization.null.format'='' 为了测试该功能,我创建了一个表,并将'‘插入到字段3
中
。当我
在
field3上
查询
空值时,没有符合该条件
的
行。我把空字符串变成null
的
理解正确吗??但我希望返回所有行,因为field3
中
有空字符串。
浏览 1
提问于2017-04-07
得票数 3
回答已采纳
1
回答
记录
中
的
配置
单元
"\n“值
、
、
、
、
我正在使用hive处理一个120 GB
的
大
文件
。数据首先以csv
文件
(制表符分隔)
的
形式从sql server表加载到aws
s3
,然后在此
文件
的
顶部创建
配置
单元
外部表。从
配置
单元
外部表
中
查询
数据时遇到问题。我注意到csv
在
许多列字段
中
包含\n (
在
sql server
中
实际上是“null”)
浏览 2
提问于2016-11-08
得票数 1
1
回答
配置
单元
:同时执行select和drop partiton
配置
单元
查询
时出错
、
、
、
、
在
同一时间运行两个
查询
时出现错误。我正在使用AWS EMR,下面是我
的
配置
单元
表架构。mybucket/'第一个
查询
: SELECT count( distinct STATE ) FROM
浏览 3
提问于2018-12-07
得票数 1
1
回答
在
S3
中
对现有的ORC
文件
使用Presto
、
、
、
、
我想
配置
Presto
在
亚马逊网络服务
S3
中
查询
ORC
文件
。根据文档,必须
配置
配置
单元
元存储区。这个元存储区将收集所有表
的
模式。由于我有现有的ORC
文件
,有没有办法用应该嵌入到ORC
文件
中
的
现有表
的
方案自动填充此元存储? 提前感谢您
的
帮助!
浏览 20
提问于2021-05-05
得票数 0
3
回答
使用AMAZON datapipeline运行具有
多个
复杂
查询
的
SQL脚本
文件
、
、
我刚刚在Amazon上创建了一个帐户,我将使用DATAPIPELINE来调度我
的
查询
。是否可以使用数据管道
的
SQLACTIVITY从.sql
文件
运行
多个
复杂
的
SQL
查询
?我
的
总体目标是使用数据管道
中
的
sql
查询
处理REDSHIFT/
s3
中
的
原始数据,并将其保存到
s3
中
。这是可行
的
方法
浏览 0
提问于2015-06-30
得票数 0
回答已采纳
1
回答
S3
和spark。
S3
上有
多个
蜂窝目标。对某些表使用
s3
:sse,对某些
配置
单元
表不使用
s3
:sse。
、
我想编写一个spark应用程序,在其中我可以从
多个
hive表
中
读取数据,并向
多个
hive表
中
写入数据。然而,这里有一个奇怪
的
地方。据我所知,我只能在全局级别设置属性fs.s3a.server-side-encryption algorithm
浏览 2
提问于2017-04-06
得票数 0
2
回答
用于用户存储
的
S3
还是DynamoDb?
、
、
、
、
我想在无服务器架构中使用AWS Lambda和Cognito,并且好奇人们
的
想法是使用
S3
存储桶作为用户数据存储,而不是像DynamoDb这样
的
东西?优点/缺点是什么?
浏览 2
提问于2017-08-30
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何快速在多个单元格中输入相同的数据或文字
配置指南:信息类型IT2011的字段在InfoSetQuery中不能作为查询选择条件,为什么?
充分利用VBA,一键完成在多个EXCEL工作表中的批量大数据查询
朴朴基于AWS EMR的数据沙盒平台演变
ClickHouse如何实现存算分离?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券