腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
云
数据
融合
中
加载
多个
表
失败
,并
出现
DAG
错误
我有一个包含大约1000个
表
的MS SQL Server
数据
源,我需要将其放入BigQuery
中
。我希望使用
数据
融合
将它们全部
加载
到BigQuery
中
的临时
表
中
,然后对它们执行转换。然而,一旦我创建了一个带有两个“岛”的管道,它就会给出一个
DAG
错误
。这是一个特性还是仅仅是我做错了什么?我
在
文档里找不到任何东西。我的管道看起来像这样: ? 当我尝试部署时,我得到的
错误
浏览 10
提问于2019-06-28
得票数 2
回答已采纳
1
回答
Google Cloud Data Fusion,如何在一个管道中将
多个
表
加载
到bigquery
、
我想使用
云
数据
融合
加载
aws rds mysql服务器
中
的许多表。每个
表
的存储大小约为1 1gb。我还找到了一个名为“多
数据
库
表
”的插件来
加载
多表。但我
失败
了。而且,基本上当我使用
数据
库源时,我可以检查我的
表
的模式。然而,
在
多个
数据
库
表
中
,我找不到如何检查表模式。我如何使用此插件?或者在<em
浏览 7
提问于2021-07-13
得票数 0
2
回答
GCP
中
合成器(气流)
DAG
RunID冲突
、
、
、
、
我们有一个
云
功能,它是基于
云
存储的。一旦文件
加载
到桶
中
,此
云
函数将触发。当文件
加载
时,该函数将调用/触发气流
DAG
。这个
DAG
将处理该文件。问题是,当
多个
文件
在
一秒钟内同一时间放置时,函数调用
失败
,
出现
以下
错误
, b‘{“
错误
”:“运行id pl_imaoc_trigger_
dag
_2020-07-31T17:48:
浏览 4
提问于2020-08-01
得票数 0
1
回答
通过
云
数据
融合
从Mysql到Bigquery的
数据
(使用
多个
联接的查询)
、
、
我要在MySQL
中
运行一个具有
多个
表
联接的复杂查询,并将输出
数据
导入BigQuery
表
。 我想为此使用
云
数据
融合
。我是GCP的新手,不知道如何实现这一目标。我知道可以使用
数据
融合
将MySQL
表
引入到BigQuery
表
中
,但这是一种直接的拉动。如果我想要运行一个具有
多个
表
联接的查询,
并
使用
云
<e
浏览 10
提问于2022-10-11
得票数 0
1
回答
是否可以使用
云
数据
融合
FTP -> GCS GCS -> BQ
、
我是全新的GCP和
云
数据
融合
。我看到您可以使用此服务将跨
数据
源的
数据
集成到
数据
池中。最终,我希望这些
数据
可以
在
BQ
中
获得。sftp站点将有
多个
文件表示
多个
表
。/r
浏览 1
提问于2020-10-28
得票数 0
回答已采纳
1
回答
当从单个python源代码生成数百个
DAG
时,气流会减慢。
、
、
在
我们的大
数据
项目中,有3000个
表
需要
加载
,所有这些
表
都应该由气流
中
的一个单独的
DAG
来处理。
在
我们的解决方案
中
,单个python文件生成每种类型的
表
加载
器,因此它们可以通过基于事件的REST通过
云
函数单独触发。因此,我们使用以下方法生成我们的
DAG
: 用于
DAG
生成器逻辑scd2的气流变量生成
表
类型的
表
名列
浏览 3
提问于2021-11-06
得票数 1
回答已采纳
2
回答
如何在
云
函数
中
实现文件的串行处理?
、
、
、
我写了一个基于
云
函数的
云
存储触发器。我有10-15个文件
在
云
存储桶
中
以5秒的间隔登陆,它将
数据
加载
到bigquery
表
中
(截断
并
加载
)。当存储桶中有10个文件时,我希望
云
函数以顺序的方式处理它们,即一次处理一个文件,因为所有文件都访问相同的
表
进行操作。目前
云
函数一次触发
多个
文件,BIgquery操作
失败
,因为<
浏览 1
提问于2020-07-15
得票数 0
1
回答
如何从具有动态参数的气流
中
触发
云
数据
融合
、
、
、
、
我试图
在
气流2+
中
创建一个
DAG
,它将使用CloudDqtaFusionStartPipeline操作符触发
多个
数据
融合
管道,它们将并行运行。我正在尝试的流程如下所示。开始- read_bq - df_1,.df_n 这里,read_bq是一个BigQuery任务,它将从BigQuery
表
中
读取值作为列表
浏览 8
提问于2022-10-16
得票数 0
2
回答
无法从
数据
融合
连接Cloud / postgreSQL实例
、
、
、
目标是使用
云
数据
融合
连接Cloud或postgreSQL实例。用MySQL和postgreSQL创建Cloud实例
在
添加连接中使用jd
浏览 2
提问于2019-08-01
得票数 0
1
回答
bigquery
表
加载
后触发的自动调度
、
、
、
它将在bigquery
表
加载
后自动触发。我不想使用每周调度查询,这是手动任务,我希望这使它在将
表
加载
到Bigquery
表
时自动触发调度。
浏览 10
提问于2022-11-12
得票数 0
1
回答
BigQuery执行
失败
,
在
云
数据
融合
方面没有有意义的
错误
、
我正在尝试使用
云
数据
融合
( BigQuery )
中
的执行函数。该组件验证良好,SQL签出,但每次执行时都会得到这个没有意义的
错误
:02/11所讨论的SQL是dataset.table
中
的简单删除,其中ds = CURRENT_DATE()这是管道 "name": "
浏览 15
提问于2022-02-11
得票数 0
回答已采纳
1
回答
无法使用Google
数据
融合
连接到
我正在尝试使用
云
数据
融合
来测试连接到。我们的GCP项目不使用默认网络,而是使用自定义VPC。我使用角色
云
数据
融合
API服务代理复制
并
添加了生成的
数据
融合
服务帐户
浏览 0
提问于2019-09-27
得票数 2
2
回答
Data Fusion管道使用来自
云
NAT的外部IP,而不是将外部IP分配给Dataproc群集节点
我正在尝试从限制外部IP访问的客户端提取
数据
。我已经使用允许的IP配置
并
测试了
云
NAT。我不想分配这些IP,这样节点就可以使用
云
NAt上定义的IP。 我尝试过通过Data Fusion运行时参数将--no-address传递给Dataproc,但这不是正确的方式。此外,我还查找了一些
在
我的Data Fusion实例上配置计算配置文件的方法,这在基础版或企业版中都找不到。我希望获得一个
云
数据
融合
管道,使用我的
云
NAT外部IP连接到我的客
浏览 0
提问于2019-06-13
得票数 1
2
回答
如果
表
中
已存在内容,则避免
在
Bigquery
中
重新
加载
数据
、
、
我需要编写
dag
,这样它就可以将csv文件的内容
加载
到Bigquery
表
中
,但是如果
表
中
已经存在该内容,它就会丢弃该文件。我知道我们可以
在
正常的编程中计算文件的哈希,但不知道如何处理Airflow和Bigquery。有人知道怎么做吗?
浏览 0
提问于2021-09-13
得票数 0
2
回答
Google
数据
融合
无法访问来自另一个项目的
数据
,即使授予了访问权限
、
、
、
我已经启用了
云
数据
融合
API,并在BigQuery
中
的项目A
中
创建了一个实例。项目A将包含我们的
数据
仓库,并从BigQuery上的其他项目中
加载
和转换
数据
。当我试图从
表
B.X上的项目B创建一个具有源BigQuery的管道时,我会得到关于BigQuery
表
的详细信息:访问被拒绝:
表
B.X。
在
表
B.X上拒绝的权限bigquery.tables.get (或者它可能不存
浏览 5
提问于2021-10-06
得票数 0
回答已采纳
1
回答
如何使用两个Google
融合
表
中
的
数据
?
、
我试图
在
美国和加拿大创建一个“服务区域”的谷歌地图,无意中发现了这种
融合
表层的东西&认为它会产生很好的效果,但我有问题。我不能创建一个
融合
表
&
在
不向google付费的情况下将其公之于众,没有办法,我将使用现有的公共
表
。我需要将样式应用到
融合
表层,但我正在
加载
2个
融合
表
(层)& API只允许将样式添加到一个层。}], suppressInfo
浏览 0
提问于2018-04-06
得票数 0
回答已采纳
2
回答
Google Data Fusion从存储桶
中
的
多个
子文件夹
中
读取文件,并需要将其放入侧子文件夹
中
的另一个文件夹
中
/student/land/压缩文件sameer/student/pro/未压缩文件在上面的例子
中
,我需要从存在于不同子目录
中
的所有LAND文件夹
中
读取文件,并需要处理它们,并将它们放在与其相同的子文件夹
中
的PRO文件夹
中
。
在
GCS源代码
中
,我提供了
浏览 2
提问于2020-11-05
得票数 0
1
回答
无法确定GCP Composer (气流)
DAG
任务
失败
的问题
、
、
、
我的守护进程的一些操作符有一个
失败
的状态。我正在努力理解
错误
的根源。 filename="/home/airflow/gcs/d
浏览 4
提问于2020-04-07
得票数 1
1
回答
事件驱动DAGs的气流可选算子模式
、
我知道,
在
dag
_a的末尾,我可以添加一个触发器来启动
dag
_b。然而,从抽象的角度来看,这种哲学上是
错误
的:
dag
_a不需要理解或知道
dag
_b的存在,但是这种模式将强制执行在
dag
_a上调用
dag
_b的责任。更具体地说,我设想了一个用例,其中
多个
DAG
每天运行(因此它们共享相同的运行日期),并且每个
DAG
的输出都是某个
表
中
的一个日期分区。现在,我在下游dags
浏览 7
提问于2022-03-31
得票数 1
1
回答
气流
DAG
-如何首先检查BQ (必要时删除),然后运行
数据
流作业?
、
、
、
、
我有一个
云
函数,它在文件到达时触发进程,
云
函数将文件名/位置传递给
DAG
。
在
我的
DAG
中
,我有两个任务: 1)使用DataflowPythonOperator运行
数据
流作业,该作业读取GCS
中
的文本
中
的
数据
,并将其转换为BQ,2)根据作业
失败
或成功与否将文件移动到
失败
/成功桶我查看了其他气流操作符,但在运行
数据
流作业之前,我希望
在</e
浏览 0
提问于2019-01-09
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
大规模运行Apache Airflow的经验和教训
如何高效构建多线程POST信息批量发布系统?
数据湖和SQL并不矛盾
教你数分钟内创建并运行一个 DolphinScheduler Workflow
一团乱!新系统上线第一天就“罢工”?你申报成功了吗?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券