腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
不同
帐户
中
的
Data
Fusion
Dataproc
计算
教授
、
、
我正在尝试通过部署
Data
Fusion
实例
的
另一个项目中
的
Data
Proc集群来执行管道,但我遇到了一些问题。数据过程实例似乎已正确创建,但作业启动失败。有没有办法解决这个问题?这里是错误
的
堆栈跟踪谢谢
浏览 10
提问于2020-07-29
得票数 1
回答已采纳
2
回答
谷歌数据:每天加载多个小表
当然,它会启动
DataProc
,连接到SQL server,并将数据导入Google BigQuery。当我们必须按顺序运行时,需要700分钟吗?当我们尝试在流水线
中
并行运行时,我们受到网络范围
的
限制,可能是256/3.1。1流水线启动3个虚拟机
的
1个主机2个从机。我们试过了,但当我们并行启动10个以上
的
管道时,性能会下降。问题。这是正确
的
方法吗?
浏览 42
提问于2020-07-01
得票数 1
2
回答
Data
Fusion
管道使用来自云NAT
的
外部IP,而不是将外部IP分配给
Dataproc
群集节点
我正在尝试从限制外部IP访问
的
客户端提取数据。我已经使用允许
的
IP配置并测试了云NAT。但是,当我部署我
的
Pipeline时,
Data
Fusion
创建了
Dataproc
集群,并将其他临时外部IP分配给节点。我不想分配这些IP,这样节点就可以使用云NAt上定义
的
IP。我尝试过通过
Data
Fusion
运行时参数将--no-address传递给
Dataproc
,但这不是正确
的
方式。此外,我还查找了一些
浏览 0
提问于2019-06-13
得票数 1
1
回答
云数据融合触发管道-重用已配置
的
Dataproc
集群
、
、
有没有办法避免后续触发
的
出站管道
的
配置步骤?看起来,当管道触发出站管道时,它会重新进行配置。我们可以简单地在第一个配置
的
集群上执行触发流水线吗? 谢谢。
浏览 0
提问于2021-02-25
得票数 2
1
回答
关于google数据融合
的
几个问题
我正在发现这个工具,我有一些问题: FTP您所说
的
文件类型(Source,Sink),-is是否也可以将流水线
的
结果直接发送到-what服务器 我查看了文档,但没有找到此信息 谢谢
浏览 9
提问于2019-06-25
得票数 1
回答已采纳
1
回答
云数据融合
中
拼图文件
的
读取与转换
尝试在云数据融合
中
摄取和转换拼图文件。我可以看到我可以使用GCS插件来摄取拼图文件。但是,当我想要使用wrangler插件来转换它时,我看不到有任何功能可以这样做。顺便说一句,我刚刚部署了我
的
管道,看看我是否能够从GCS摄取拼图文件,但我在日志中看到了这个错误: ... 4
浏览 24
提问于2021-02-25
得票数 1
1
回答
在运行简单数据融合管道从Bigquery导出数据并写入GCS时,获取连接超时错误
我尝试使用谷歌数据融合服务,我创建了一个简单
的
管道,它将从BigQuery中提取数据并以json格式将数据加载回GCS,但是当我运行该管道时,我会得到以下错误。(DefaultSSHSession.java:82)
的
java.io.IOException: com.jcraft.jsch.JSchException: java.net.ConnectExceptionio.cdap.cdap.internal.app.runtime.distributed.remote.RemoteExecutionTwillPreparer.lambda$start$0(
浏览 5
提问于2019-04-26
得票数 3
2
回答
Google Cloud
Data
Fusion
的
权限问题
、
、
我正在按照Cloud
Data
Fusion
sample tutorial
中
的
说明进行操作,一切似乎都很正常,直到我尝试在最后运行管道。根据说明为Google托管服务
帐户
设置云数据融合服务API权限。管道预览功能工作正常,没有任何问题。 但是,当我部署和运行管道时,它在几分钟后失败。storage.buckets.create access to project X." } xxxxxxxxxxx-compute@developer.gserviceaccount.com是我
的
浏览 44
提问于2019-06-28
得票数 4
回答已采纳
1
回答
如何使用数据融合/Cloud Composer在GCP上调度数据处理PySpark作业
、
、
、
、
我最近开始学习GCP,我正在做一个POC,它要求我创建一个能够调度用PySpark编写
的
Dataproc
作业
的
管道。目前,我已经在我
的
Dataproc
集群上创建了一个Jupiter笔记本,它从GCS读取数据并将其写入BigQuery,它在Jupyter上工作得很好,但我想在流水线中使用该笔记本。我
的
目标是调度多个
Dataproc
作业
的
运行。
浏览 33
提问于2021-08-16
得票数 2
回答已采纳
1
回答
创建GCP
Dataproc
群集时出错:拒绝“compute.projects.get”
的
权限
、
、
我试图通过cloud创建带有服务
帐户
的
Dataproc
集群。它抛出了一个compute.projects.get被拒绝
的
错误。服务
帐户
具有
计算
查看器访问、
计算
实例管理、
dataproc
编辑器访问。在IAM策略疑难解答程序
中
,我检查了将
dataproc
.cluster.create分配给服务
帐户
。) PERMISSION_DENIED:“projects/xxxxxx”所需
的</em
浏览 2
提问于2020-01-25
得票数 1
回答已采纳
1
回答
我对GCP
的
数据融合
的
内部工作流程很好奇
、
、
我在开发人员和企业模式下使用了Google Cloud platform
的
DataFusion产品。 对于开发人员模式,没有数据过程设置(主节点、工作节点)。对于企业模式,有一个
dataproc
设置值。(主节点、工作节点) 我好奇
的
是企业模式
的
情况。 我能够设置Master节点和Worker节点
的
值。详述 Enterprise - Master.- Master Cores: 2vcpu - Master Memor
浏览 14
提问于2020-10-26
得票数 0
回答已采纳
2
回答
访问云数据融合实例
的
CDAP
如何访问云数据融合实例
的
CDAP?我想使用Composer来编排我
的
管道。 我有一个启用私有IP
的
Enterprise实例,但我无法找到任何关于如何访问REST
的
文档。实例详细信息页仅显示一个/22 IP地址范围-它没有指定特定
的
IP。我是否使用UI
的
IAP受保护
的
URL访问?
浏览 4
提问于2019-11-19
得票数 3
回答已采纳
2
回答
在GCP数据融合
的
pythonEvaluator变换
中
运行pip install py4j
、
、
我正尝试在py4j
计算
器
的
本机模式下运行"pip install Python“。我找不到可以运行此命令来安装依赖项
的
位置。在web上
的
任何位置都找不到解决方案。请指导我在数据融合
中
执行此命令。
浏览 2
提问于2020-02-05
得票数 1
1
回答
使用服务
帐户
和IAM角色管理
dataproc
群集访问
、
、
、
、
我是云领域
的
初学者,希望将我
的
dataproc
cluster访问限制在项目中给定
的
gcs buckets上。让我们说我已经创建了一个名为service account
的
'
data
-proc-service-account@my-cloud-project.iam.gserviceaccount.com',然后我创建了一个
dataproc
集群并将服务
帐户
分配给它。这里
的
问题是:(很可能是与SRE资源相关
的<
浏览 6
提问于2020-07-29
得票数 3
回答已采纳
2
回答
如何在GCP
中
执行数据沿袭?
、
、
当我们使用GCP云存储实现数据湖,并使用
Dataproc
、Dataflow等云服务进行数据处理时,我们如何在GCP中生成数据沿袭报告?
浏览 41
提问于2019-03-05
得票数 5
1
回答
无法从另一个
帐户
插入到
Fusion
表
中
?
、
因此,我试图从位于google脚本上
的
脚本插入到我
的
Fusion
Table
中
,但是来自
不同
的
帐户
和
不同
的
计算
机。该
帐户
不知道
Fusion
Table,并且当它尝试运行需要插入值
的
脚本时,它会返回一个“禁止”错误function registration(tableId) {+ " (Email) VALUES (\
浏览 8
提问于2016-10-25
得票数 0
1
回答
无法使用服务
帐户
创建
Dataproc
群集
、
我是Google云和评估
Dataproc
集群
的
新手,其核心需求之一是动态创建集群并处理作业。对于各种文档读取和,我尝试创建一个服务
帐户
并添加以"
Dataproc
“开头
的
角色。",} 仍然无法创建集群。我不太确定我错过了什么。不幸
的
是,我也无法从伐木
中
浏览 4
提问于2020-05-07
得票数 2
回答已采纳
1
回答
无法将
Dataproc
群集用于具有受限用户访问权限
的
GCS
的
多用户
、
由于
Dataproc
集群
的
计算
引擎使用默认
的
服务或自定义服务
帐户
凭据来使用--properties core:fs.gs.auth.service.account.json.keyfile连接到存储桶,这与提交作业
的
用户主体没有任何关系,或者我找不到控制它
的
选项,这使得
dataproc
集群不安全,并造成了一个问题,它在多用户环境
中
引入了另一层间接方向,当使用
的
密钥文件与不对应时。在我
的
例子
中
浏览 2
提问于2018-10-29
得票数 3
1
回答
如何通过Composer为设置CPUS配额?
、
、
在免费试用
帐户
中
尝试,工作流DAG
的
第一个任务运行以下操作符: task_id='create_
dataproc
_cluster', cluster_name='quickstart-cluster-{{ ds_nodash }},而n1-standard-1已经是最小
的
浏览 0
提问于2019-05-25
得票数 3
回答已采纳
1
回答
使用默认服务
帐户
时身份验证作用域不足
、
、
我从google工作区API
中
检索数据。我从
Dataproc
集群使用Service对那些API进行身份验证。 我有两种使用服务
帐户
进行身份验证
的
方法。我要么使用JSON密钥文件对我
的
SA SA-with-keyfile进行身份验证,要么使用我
的
Dataproc
集群
的
默认SA:SA-default。这两个SA都被授权访问数据,我为它们提供了相同
的
范围。,我检索我
的
数据。)会出现这个错误,因为我在这两种情况下都使用相同<
浏览 12
提问于2022-04-11
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
犹他大学计算机系终身教授承恒达:人工智能中不确定性的研究
我们为什么放弃了TiDB,选择自研NewSQL
22个免费的数据可视化和分析工具推荐!
如何将孩子的画打印成 3D 玩具
计算机视觉系统学习书籍/综述(免费领取啦~)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券