腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Airflow
-
Bigquery
运算符
未按预期工作
sql
、
google-bigquery
、
airflow
我对
Airflow
是个新手,目前我被
Bigquery
操作符的问题所困扰。我正在尝试对给定数据集中的一个表执行一个简单的
查询
,然后将
结果
复制到同一数据集中的一个新表上。我
使用
bigquery
运算符
来做这件事,因为根据文档,'destination_dataset_table‘参数应该做我正在寻找的事情(来源:https://
airflow
.apache.org/docs编辑:我在一个小得多的表(从10 Kb到几Kb
浏览 7
提问于2020-09-11
得票数 0
1
回答
用于在Salesforce表
中
运行
查询
的自定义
airflow
操作符
salesforce
、
airflow
、
custom-operator
我是
airflow
的新手,我想安排一个
任务
,让来自不同数据库记录计数的两个表必须检查它是否匹配。一个来源是GCP,
另一个
是Salesforce。所以我找到了BigQueryOperator来点击GCP端的
查询
并返回计数
结果
,但是我找不到任何看起来像SalesforceQueryOperator的
运算符
,我可以在气流
任务
中分配它。所以基本上,我说的是这个,我们可以用它来得到计数
结果
: task
浏览 7
提问于2021-02-12
得票数 1
1
回答
如何利用局部bq算子从气流
中
实现python
任务
google-bigquery
、
airflow
、
bq
在进行项目时,遇到了这样一种情况:我们希望
使用
气流来执行很少的
任务
,但是不允许
使用
python操作符,而是被指示
使用
本地的
BigQuery
操作符。谁能帮我这样的代码,
如
设置气流变量,或如何编写条件代码,这将执行by操作。有可能吗?如果没有,那么我的下一个问题是,是否有可能
使用
BQ操作符从BQ表
中
获取
结果
,并将其分配给一个python变量,所以想同时
使用
BQ和python操作符,有什么方法吗?
浏览 6
提问于2021-11-28
得票数 1
回答已采纳
1
回答
如
何在
另一个
任务
airflow
中
使用
查询
结果
(
bigquery
运算符
airflow
、
google-cloud-composer
} || bq mk {}'.format( >> delete_bq_table export_audits_to_gcs >> download_file >> email_summary
使用
此代码然后,我将.
浏览 18
提问于2021-08-19
得票数 0
回答已采纳
2
回答
添加带有gdrive作用域的
BigQuery
连接?
google-cloud-composer
我有一个外部Sheets表,我想通过
Airflow
中
的BigQueryOperator
查询
它。Conn Id:
bigquery
_with_gdrive_scopeProject,https://www.googleapis.com/auth/cloud-platfor
浏览 4
提问于2018-08-09
得票数 2
回答已采纳
1
回答
是否可以
使用
BigqueryOperator在一次调用中将数据
结果
存储到多个分区
中
?
airflow
query_to_table_x.sql SELECT column_a, column_b, column_cWHERE _PARTITIONTIME = {{ execution_date }} 我有
airflow
_dag.py示例:今天是2020-04-06,所以我将
使用
filter _PARTITIONTIME = '2020-04-06'运行run query_to_table_x.sql,然后将
结果
存储到project.dataset.result_table_x$20200406
浏览 11
提问于2020-04-07
得票数 0
1
回答
GCP数据摄取体系结构
google-cloud-platform
、
google-cloud-dataflow
我将开始研究从CSV和数据湖
中
获取到
BigQuery
的GCP数据,我正在寻求您的建议,我可以
使用
哪些技术或架构。 我是GCP的新手,但我对数据工程技术有很好的理解,因为我正在为认证做准备。我尝试
使用
转换成管道的数据流简单地加载
BigQuery
,然后调度器在特定的时间运行管道。我遇到的问题是如何将已处理的CSV文件移动到其他桶
中
?我可以调用函数来移动文件吗?
浏览 4
提问于2022-10-21
得票数 1
1
回答
google-cloud-composer
BigQuery
交叉数据集加载
google-bigquery
、
google-cloud-composer
、
airflow
我正在尝试运行一个简单的select
查询
(从biqquery),并
使用
Composer将
结果
集加载到
另一个
bq表
中
。然而,我在代码的最后一行得到了一个错误。from
airflow
import DAGfrom
airflow
.contrib.operatorsimport
bigquery
_operator from
浏览 1
提问于2021-04-09
得票数 0
2
回答
如果表
中
已存在内容,则避免在
Bigquery
中
重新加载数据
google-bigquery
、
airflow
、
etl
我需要编写dag,这样它就可以将csv文件的内容加载到
Bigquery
表
中
,但是如果表
中
已经存在该内容,它就会丢弃该文件。我知道我们可以在正常的编程中计算文件的哈希,但不知道如何处理
Airflow
和
Bigquery
。有人知道怎么做吗?
浏览 0
提问于2021-09-13
得票数 0
2
回答
AssertionError: INTERNAL:未指定默认项目
python-2.7
、
airflow
、
apache-airflow
不熟悉
airflow
。尝试运行sql并将
结果
存储在
BigQuery
表
中
。请帮帮我。/contrib/operators/
bigquery
_operator.py", line 82, in execute File "/usr/
浏览 12
提问于2017-08-11
得票数 4
回答已采纳
2
回答
是否有基于作业输出发送通知的api?
qubole
但是,假设我运行一个hive
查询
来计算表
中
的行数,会发生什么呢?如果返回的
结果
是零,我想发送电子邮件给有关方面。我该怎么做呢? 谢谢。
浏览 5
提问于2016-01-29
得票数 0
5
回答
使用
Airflow
在数据库之间移动和转换数据
airflow
使用
airflow
,我从MySQL数据库中提取数据,
使用
python进行转换,并将其加载到Redshift集群
中
。编辑:这是一个关于气流的问题,是选择
任务
粒度以及如
何在
它们之间传递数据的最佳实践。这不是一个关于数据迁移或ETL的一般性问题。在本问题中,ETL仅用作气流
任务</
浏览 36
提问于2017-01-10
得票数 13
1
回答
我们能在通过Google
BigQuery
运行的
查询
上实现数据谱系吗?
google-cloud-platform
、
google-bigquery
、
airflow
、
google-cloud-composer
谁能帮我提供一些建议,告诉我如
何在
基于谷歌
BigQuery
的DW类型解决方案上实现数据谱系,
使用
谷歌云存储作为源,
使用
谷歌云组合器作为工作流管理器来实现一系列SQL。
浏览 0
提问于2018-10-15
得票数 0
5
回答
从气流
中
的BigQueryOperator中提取
结果
python
、
google-bigquery
、
airflow
我试着用气流从BigQueryOperator
中
获取
结果
,但是我找不到方法去做。我尝试在next()成员(在1.10
中
可用)
中
调用bq_cursor方法,但是它返回None。我就是这么做的import logging from
airflow
.contrib.operators import
bigquery
_operator from
airflow
.operat
浏览 0
提问于2018-11-30
得票数 5
回答已采纳
1
回答
在气流中进行数据库请求时出现的问题
airflow
我正在尝试基于数据库调用的响应动态创建
任务
。但是当我这样做时,run选项就不能进入气流,所以我不能运行。task_id = "materialize_" + vname, google_cloud_storage_conn_id="google
浏览 0
提问于2019-08-29
得票数 0
3
回答
Airflow
:有没有办法在dag之外将操作员分组在一起?
python
、
airflow
、
google-cloud-composer
然后尝试在Big Query中加载原始表
中
的数据,然后根据加载
结果
将文件分派到存档或拒绝的文件夹
中
。 做一次很容易,如果需要做1000次呢?我正在试图弄清楚如何优化工程时间。可以考虑
使用
SubDag,但它在performances方面存在局限性,将被弃用anyway。
任务
组需要是dag的一部分才能实现https://github.com/apache/
airflow
/blob/1be3ef635fab635f741b775c52
浏览 39
提问于2021-09-06
得票数 1
回答已采纳
4
回答
气流BigQueryOperator:如
何在
分区表中保存
查询
结果
?
google-bigquery
、
airflow
我有一个简单的DAGfrom
airflow
.contrib.operators.
bigquery
_operator import BigQueryOperatorCREATE_IF_NEEDED', start >> bq_query >> end 执行bq_query
任务
时,SQL
查询
将保存在切分表
中
。将
浏览 2
提问于2018-05-24
得票数 6
1
回答
使用
Airflow
调度数千个
任务
airflow
、
airflow-scheduler
我们正在考虑将
Airflow
用于一个项目,该项目每天需要对外部API进行数千次调用以下载外部数据,每次调用可能需要几分钟的时间。我们正在考虑的一个选择是为每个不同的API调用创建一个
任务
,但是这将导致数千个
任务
。在UI
中
渲染所有这些
任务
将是一个挑战。我们还担心调度器,它可能会处理如此多的
任务
。另一种选择是只有几个并行的长时间运行的
任务
,然后在这些
任务
中
实现我们自己的调度程序。我们可以在PythonOperator
中
添
浏览 6
提问于2020-03-07
得票数 1
1
回答
如何
使用
JDBC操作符在
airflow
中
获取sql
查询
结果
jdbc
、
airflow
我已经在
Airflow
connections
中
配置了JDBC连接。我的DAG的
任务
部分如下所示,其中包含一条select语句。当触发DAG成功时,
查询
结果
不会打印在日志
中
。如何
使用
JDBC
运算符
获取
查询
结果
。
浏览 41
提问于2021-01-05
得票数 0
2
回答
如何使
BigQuery
SQL管道自动化
google-cloud-platform
、
google-bigquery
、
google-cloud-dataflow
我
使用
BigQuery
SQL创建了一个数据管道。首先从云存储中导入CSV文件,然后进行不同的分析,包括利用BigQueryML地理函数进行预测建模和利用解析函数进行KPI计算。我能够成功地手动运行不同的
查询
,现在我想要自动化数据管道。 我的第一个选择是DataFlow SQL,但事实证明Dataflow SQL
查询
语法不支持地理函数。
浏览 3
提问于2020-04-21
得票数 2
回答已采纳
点击加载更多
相关
资讯
谷歌BigQuery ML正式上岗,只会用SQL也能玩转机器学习!
自学14天后,我毁掉了自己的数据工程师面试
分析GitHub:最流行的许可证是什么?
大规模运行Apache Airflow的经验和教训
使用Kafka,如何成功迁移SQL数据库中超过20亿条记录?
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券