我在Apache上工作非常新,在这里我尝试编写一个管道,从Google BigQuery中提取数据,并使用Python格式将数据写入GCS。使用beam.io.read(beam.io.BigQuerySource()),我可以从BigQuery读取数据,但不确定如何以CSV格式将其写入GCS。import logging
f
我正在尝试从pandas数据帧获取输入到apachebeam管道,并将其写入GCS。在不使用dataflow/apachebeam的情况下,我能够在GCS中写入数据帧数据。def database_to_gcs(self, type='full'): with open(self.tablemetada
at org.apache.beam.runners.dataflow.util.DataflowTemplateJob.getJobId(DataflowTemplateJob.java:41)at org.apache.beam.runners.dataflow.DataflowPipelineJob.getJobWithRetries(DataflowPipelineJob.java:559)
at org.apache.beam.runners.dataflow.Data