腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
关于
dynamodb
表
的
胶水
转换
逻辑
、
、
我使用aws glue来
转换
dynamodb
表
中
的
数据。我能够获取数据并使用pyspark
逻辑
进行
转换
。但是当我尝试将文件写入json格式时,我得到了一个无效
的
json格式.。在
转换
这个json文件时需要帮助。
浏览 10
提问于2020-05-19
得票数 0
2
回答
将数组中
的
结构删除,但保留数据并保存到
dynamodb
中
、
、
、
一个
dynamodb
表
被导出到s3,aws
胶水
爬虫会爬行s3数据。Aws
胶水
作业从爬行数据中获取源代码,下面是由MergeLineItems
转换
的
模式: rec["lineItems1"] = {}[ "M": "expec
浏览 1
提问于2021-09-15
得票数 1
回答已采纳
2
回答
在AWS
胶水
中运行
的
基于规则
的
引擎和作为Dynamo
的
规则存储库中
的
基于规则
的
引擎能有什么有效
的
设计?
、
、
、
从中选择数据并进行数据标准化(有些标准化使布尔字段统一,如有值0或1,将所有数据格式列
转换
成一个非格式
的
标准,如dd/mm/yyyy :mi:ss,对某些列数据
的
裁剪空间等)。数据移动使用
胶水
作业、电火花代码、用于编排
的
Step函数和用于存储作业配置
的
Dynamodb
以及用于存储元数据
的
glue目录来完成。需要在
Dynamodb
中以这种方式存储标准化规则,这样
胶水
作业就可以从
DynamoD
浏览 0
提问于2020-09-07
得票数 0
1
回答
aws
胶水
从另一个aws帐户访问/爬行
dynamodb
(交叉帐户访问)
、
我编写了一个
胶水
作业,它导出
DynamoDb
表
并以csv格式存储在S3上。
胶水
作业和
表
位于同一个aws帐户中,但是S3桶位于不同
的
aws帐户中。我已经能够从
胶水
作业中访问跨帐户
的
S3桶,方法是将下面的桶策略附加到它。"arn:aws:s3:::<BUCKET-NAME>/*" }} 现在,我还想从另一个AWS帐户读取/访问
DynamoD
浏览 1
提问于2019-05-21
得票数 1
2
回答
使用AWS作业从另一个帐户中
的
DynamoDB
中提取数据
、
、
、
我使用AWS将数据从
DynamoDB
复制到S3。我编写了下面的代码,以便将DyanmoDB
表
复制到同一个帐户中
的
S3。它
的
工作很好,复制我
的
六亿张记录,没有任何问题。大约要花20分钟。": read_percentage, "
dynamodb
.splitstransformation_ctx="datasink"
浏览 1
提问于2020-03-21
得票数 2
2
回答
AWS胶能写到
DynamoDB
吗?
、
、
我需要从Source
DynamoDB
表
中完成一些分组工作,然后将每个结果项写入另一个目标
DynamoDB
表
(或源
表
的
辅助索引)。注意:必须将每个生成
的
分组项写入一个单独
的
DynamoDB
项(即,如果分组产生了X个对象,则必须将X项写入目标
DynamoDB
<em
浏览 7
提问于2020-04-13
得票数 5
回答已采纳
2
回答
如何使用AWS Glue在发电机中编写字符串集?
、
、
、
我需要将数据从一个生成器
表
复制到另一个生成器
表
,并在此过程中进行一些
转换
。为此,我将数据从源
表
导出到s3,并在其上运行crawler。在我
的
胶水
作业中,我使用了以下代码: mapped = apply_mapping.ApplyMapping.apply( mappings=[", "
dynamodb
.region": &qu
浏览 18
提问于2021-02-12
得票数 3
回答已采纳
1
回答
运行在EMR上
的
PySpark中通过Glue数据目录访问PySpark
的
绝对URI异常
的
相对路径
、
、
、
、
我正在执行一个在AWS EMR上
的
吡火花应用程序,该应用程序被配置为使用AWS Glue数据目录作为亚稳态。我在AWS中设置了一个指向
DynamoDB
表
的
表
。现在,在我
的
pyspark脚本中,我试图访问Glue
表
。我可以做show tables,并能看到
胶水
表。但是当我试图查询
表
时,我得到
的
是异常, pyspark.sql.utils.AnalysisException: u'java.lang.Illeg
浏览 2
提问于2019-04-25
得票数 4
回答已采纳
3
回答
在AWS Quicksight中可视化
DynamoDB
数据
、
、
我正在寻找一个以亚马逊网络服务为中心
的
解决方案(如果可能的话,避免第三方
的
东西)来可视化一个非常简单
的
DynamoDB
表
中
的
数据。我们使用AWS Quicksight为我们
的
客户提供许多其他报告和仪表板,因此我们
的
目标是在那里提供可视化。我非常惊讶地发现,尽管有许多其他
的
东西,比如S3,雅典娜,红移,RDS等,
DynamoDB
却不是Quicksight
的
支持源码。 有人有为此创建解决方案
的<
浏览 3
提问于2019-09-04
得票数 25
2
回答
胶水
作业模式推理问题
、
、
、
、
请求:我需要一个
胶水
作业将aws(嵌套结构-映射和列表
的
组合)数据导入s3。 "
dynamodb
.input.tableName": table_name, "
dynamodb
.throughput.read.percent": read_percent
浏览 3
提问于2020-08-24
得票数 0
回答已采纳
1
回答
AWS胶-
DynamoDB
随需应变能力超慢
、
、
我们有一个AWS Glue作业,它从按需容量设置
的
dynamodb
表
中提取。但是,一旦我们将
表
更改为按需操作,
胶水
作业就需要很长时间才能完成。据推测,
胶水
作业试图使用一部分可用
的
read capacity...but,这在新
的
容量模型中是没有意义
的
。 我们希望把我们所有的桌子都移到新
的
按需容量设置,但这对我们来说将是一个障碍。
浏览 1
提问于2019-06-05
得票数 2
回答已采纳
1
回答
在不使用Boto
的
情况下执行AWS
胶水
脚本时,有条件地写入
DynamoDB
?
、
、
我已经用python编写了一个AWS
胶水
作业ETL脚本,我正在寻找一种适当
的
方法来执行对作为目标的
DynamoDb
表
的
条件写入。# Write to
DynamoDB
frame=SelectFromCollection_node1665510217343,
浏览 18
提问于2022-12-01
得票数 0
回答已采纳
1
回答
从
DynamoDB
读取时Crawler超出读取容量
、
、
我正在尝试使用AWS Glue将我
的
DynamoDB
表
导出到S3。对于glue作业,我需要在glue数据目录中创建一个
表
。为了将我
的
DynamoDB
表列在data catalog中,我需要运行一个爬虫(我想是为了确定
表
模式)。当运行爬虫程序时,它开始从
DynamoDB
读取超过我尝试提供
的
任何读取容量单位
的
大量数据。不幸
的
是,我找不到一种方法,既不能在控制台上,也不能在API中,在确定模式时更改给定爬
浏览 14
提问于2018-08-08
得票数 0
回答已采纳
1
回答
如何等待导出使用ExportTableToPointInTimeRequest完成?
、
、
、
我使用Java将
dynamodb
表
导出到ExportTableToPointInTimeRequest中
的
S3。我只想在导出完成后才处理接下来
的
步骤,因为还有一个与
胶水
作业相关
的
任务,它将从s3导出中读取数据。在处理下一个步骤之前,我能做什么使代码等待一定
的
时间?.withTableArn(tableArn) .withExportFormat(ExportFormat.
DYNAMO
浏览 4
提问于2022-06-09
得票数 0
1
回答
如何从CloudFormation模板中相同
的
AWS角色中承担AWS角色?
、
、
我使用IAM角色来完成一些数据处理
的
胶水
作业,为了完成这个任务,我需要承担执行
胶水
角色
的
角色。例如,在下面的cloudformation模板中,IAM::Policy拥有从Dynamo
表
查询和从s3桶获取对象
的
权限。Resource: - Effect: Allow - '
dynamodb</em
浏览 0
提问于2020-10-17
得票数 0
2
回答
如何将5000条记录写入
DynamoDB
表
?
、
我有一个用例,我必须一次将5000条记录写入
dynamoDB
表
。我正在使用batchSave api
的
DynamoDBMapper库。它可以一次写多达25张唱片。我是否可以将5000条记录
的
列表传递给它,它将在内部将它们
转换
为25条记录并写入
dynamodb
表
,或者我必须使用条件
逻辑
在代码中处理这件事,并且只将25条记录传递给batchSave?
浏览 13
提问于2020-07-01
得票数 2
2
回答
共享库与REST服务。优点和缺点是什么?
、
、
、
有: 现在我已经考虑为这个目的创建一个共享库了。库将实现<
浏览 1
提问于2019-08-12
得票数 1
回答已采纳
1
回答
将100个新文件添加到s3后
的
AWS触发器
、
、
、
我想要一个触发器启动一个
胶水
作业,一旦100个新
的
文件(自从上次触发器被触发)被添加到s3之后。如何才能做到这一点?
浏览 12
提问于2022-01-31
得票数 0
回答已采纳
1
回答
是否可以为辅助索引键
的
创建提供自定义
逻辑
?
对于我
的
辅助索引,我希望有一个键列,它是基
表
中两个列
的
分号分隔
的
数据。 是否可以创建一个自定义
逻辑
来为辅助索引中
的
键列生成这样
的
值?
浏览 0
提问于2018-11-12
得票数 0
回答已采纳
1
回答
将AWS
表
模式映射到
DynamoDB
表
、
、
、
我创建了一个
胶水
爬虫,以便从s3桶中压缩
的
json文件中获得一个
表
模式。并使用
胶水
作业读取压缩文件,
转换
数据并写入
DynamoDB
。在将一些数据写入
表
后,它会抛出"AmazonDynamoDBException:提供
的
键元素与模式不匹配“。我想这可能是键映射
的
问题。爬虫获取
的
表
模式如下所示: "item": { "clockID":
浏览 2
提问于2022-09-20
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
逻辑门的种类以及符号表
关于时间转换的思考
关于注册表向后兼容的悲伤故事
关于终止《300种逻辑谬误》栏目翻译推送的说明
MySQL数据库有关于表结构的操作
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券