腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(1246)
视频
沙龙
1
回答
如何
跳过
Apache
Beam
big
查询
api
中
的
无效
行
和
忽略
UnknowValues
、
在
Apache
引擎
中
,我可以使用以下代码
跳过
无效
行
和
未知值现在我正在迁移到dataflow有没有办法
跳过
上面的
无效
行
和
未知值? 谢谢,Damodar Allareddy
浏览 17
提问于2018-01-11
得票数 0
1
回答
作为单例视图访问多个元素
的
大小为2
的
WriteToBigQuery - PCollection
的
侧输入
、
、
、
、
我有一个流
apache
管道,它对数据进行操作并写入大
查询
,该数据
的
表名
和
模式在数据本身之内,因此我使用侧输入来提供表名
和
使用side_inputs
的
模式。所以我
的
管道代码看起来是这样
的
- schema=lambda row[while runnin
浏览 17
提问于2022-11-27
得票数 2
2
回答
在
apache
beam
中
处理列?主要是正向填充
、
、
我正在尝试对表
的
值进行插值(前向填充)。输入:一个包含n+1列
的
BigQuery表,其中n是一组读数,+1是时间列(进行读数
的
时间)。这些列
中
的
大多数都是空
的
。输出:具有相同n+1列
的
BigQuery表,这样空值就会被最新
的
已知读数替换。(
忽略
时间开始处
的
空值)。 这相当于pandas方法(df.fillna=‘pad’)。我想通过
apache
-
beam
使用googles数据流服务
浏览 2
提问于2019-05-21
得票数 0
1
回答
在python Google Cloud数据流
中
通过bigquery阅读器读取行时
的
AssertError
、
我有一个看似简单
的
场景,在这个场景
中
,我使用python数据流使用
big
-query
查询
数据。from
apache
_
beam
.io import WriteToText
浏览 3
提问于2017-06-28
得票数 3
1
回答
我在
Apache
中使用ReadFromSpanner超过了504个截止日期
、
、
我正在用
Apache
和
Python构建一个运行在Google DataFlow
中
的
应用程序。这适用于我
的
大多数扳手表,但大于16m
行
的
大表往往会因为以下错误而失败: File "/usr/local/lib/python3.8为了解决这个问题,我尝试了以下几点: 更改了num_workers
和
disk_size_gb,并添加了
浏览 17
提问于2021-03-09
得票数 1
回答已采纳
1
回答
谷歌数据流: javax.net.ssl.SSLHandshakeException:收到致命警报: handshake_failure
、
、
我有一个数据流,它向
API
发出请求以检索一些数据。最近
API
中
的
密码有了更新,数据流突然开始失败。我使用
的
是java 1.8
和
beam
SDK 2.19.0。同样
的
代码在本地运行时也可以正常运行。我尝试升级到java 11
和
same SDK 2.24.0,以防我使用
的
版本不支持新
的
密码,但我得到了相同
的
结果,它在本地运行,但我在数据流
中
得到了相同
的</em
浏览 0
提问于2020-11-05
得票数 0
1
回答
当从BigQuery采购时,
beam
管道是否在源
查询
中保持顺序?
、
它非常简单,它将一个SQL
查询
作为一个PipelineOption,针对BigQuery
和
返回数据集中
的
每一
行
进行SQL
查询
,构造一条消息并将其放到一个公共主题上。;import org.
apache
.
beam
.sdk.PipelineResult; import org.
apache
.
beam
.sdk.io.gcp.big
浏览 3
提问于2022-03-01
得票数 0
回答已采纳
1
回答
阿帕奇光束/闪烁ExceptionInChainedStubException
、
我使用
的
是
Apache
Beam
2.0.0
和
相同版本
的
FlinkRunner (Scala2.10)。当存在“用户异常”时,找出真正出错
的
地方
的
最好方法是什么?这不是关于我这次做错了什么
的
问题;而是
如何
-通常情况下-
如何
从光束或Flink
中
获得更多信息。我下载了每个链接jars
的
源代码,并进入了ChainedFlatMapDriver,它在第82
行
抛出了一个异常,
浏览 9
提问于2017-08-10
得票数 1
回答已采纳
1
回答
如何
获取
Apache
Beam
SQL
查询
的
输出模式?
、
、
我一直在使用and DSL,如果不提供一个能够手动识别输出模式
的
编码器,我就无法使用
查询
的
输出。我可以推断输出模式而不是硬编码它吗?这里有一个例子说明了我
的
意思。给定一个输入模式inSchema
和
一些映射到Row
的
数据源,如下所示:(在
浏览 1
提问于2018-09-05
得票数 1
回答已采纳
2
回答
创建DAG数据流(
apache
梁)
、
我正在数据流(
Apache
)上创建一条管道来读取
和
写入Google BigQuery上
的
数据,但是我在创建DAG时遇到了问题,就像我对气流所做
的
那样。这是我
的
代码
中
的
一个示例:p =
beam
.Pipeline(argv=pipeline_args)query_result_gps我
如何
让他们按顺序执行?
浏览 0
提问于2019-04-26
得票数 3
回答已采纳
1
回答
Google上模块
中
的
无效
ELF头
、
、
、
as
beam
File "lib/
apache
_
beam
/__init__.py", line 88, in <module> from
apache
_
beam
import coders我已经将它安装到项目文件夹
中
的
lib文件夹
中
,并在appengine_config.py中使用了
行
appengine_config.py。另外,这是我
的
app.y
浏览 2
提问于2018-10-05
得票数 1
回答已采纳
2
回答
删除
Apache
Beam
2.2.0
中
的
Bigtable
行
、
、
在Dataflow 1.x版本
中
,我们可以使用CloudBigtableIO.writeToTable(TABLE_ID)来创建、更新和删除Bigtable
行
。新
的
Beam
2.2.0
API
似乎使用了BigtableIO.write()函数,该函数与KV<RowID, Iterable<Mutation>>一起工作,其中Iterable包含一组
行
级操作。我已经找到了
如何
使用它来处理单元格级数据,所以创建新
行
和
浏览 7
提问于2018-01-03
得票数 1
回答已采纳
3
回答
google cloud测试实验室
中
的
设备不兼容
、
、
我正在云测试实验室测试我
的
应用程序apk。它在一些设备上工作得很好,但其他设备显示:我不明白问题出在哪里。
如何
解决这些问题?
浏览 1
提问于2016-03-10
得票数 4
2
回答
apache
波束数据流
中
的
外部
api
调用
、
、
、
我有一个用例,在这里,我读取存储在google云存储
中
的
新
行
json元素,并开始处理每个json。在处理每个json时,我必须调用一个外部
API
来执行去复制操作,不管之前是否发现了json元素。我还没有看到任何在线教程提到
如何
从
apache
DoFn数据流调用外部
API
端点。 我使用
的
是
Beam
的
JAVA SDK。我学习
的
一些教程解释了使用startBundle
和
FinishBun
浏览 6
提问于2019-11-17
得票数 4
回答已采纳
1
回答
在不存在
的
表
中
插入唯一
行
、
、
我用
的
是postgres 8.4。我要把几张桌子合并成一个。表内
和
表之间都有重复。新表将具有唯一
的
约束。我已经将第一个表插入到新
的
大表
中
,没有问题,但是当试图添加第二个表时,会出现一个错误。我试过: SELECT DISTINCT ON (id) col1,WHERE(
big
_table.id = table2.id)) 表&q
浏览 0
提问于2017-09-04
得票数 0
1
回答
如何
在
Apache
Beam
中
动态跟踪状态?
、
、
、
、
我正在用
Apache
光束编写一个数据验证脚本。无论何时将新文件上传到Google Cloud Storage,此脚本都会收到来自PubSub
的
消息,下载该文件,并对该文件运行一系列预定义
的
测试。在这些测试结束时,我需要通过电子邮件发送所有未通过测试
的
行
的
日志。 为了不多次发送电子邮件,我做了一些阅读,并相信我可以使用光束
中
的
状态
和
计时器构造发送一次电子邮件。然而,每个文件都有不同
的
错误数量,那么我
如何</em
浏览 19
提问于2019-05-23
得票数 0
回答已采纳
1
回答
如何
处理Bigtable中二进制
行
键
和
列限定符上
的
regex过滤器?
、
、
在我当前
的
Bigtable设计
中
,我
的
所有
行
键、列限定符
和
值都是二进制值。我正在使用Go客户端,简单地将[]byte键转换为string允许我编写数据(似乎)而不存在任何问题。但是,当使用Bigtable
API
涉及键/值
的
正则表达式时,这会带来一些问题,例如Go客户端 bigtable.ColumnFilter、bigtable.ValueFilter
和
bigtable.RowKeyFilter在扩展
中
,为了在这些二进制值
浏览 3
提问于2020-01-24
得票数 1
2
回答
数据流作业
中
的
ModuleNotFoundError
、
、
、
、
],)import math from对querying.Print表
的
查询
。使用显示在utils文件夹
中
的
自定义日志模块计算从BigQuery获取
的
总记录。"utils“文件夹是可用
的
,在使用"DirectRunner”执行时,相同
浏览 1
提问于2021-09-17
得票数 1
回答已采纳
1
回答
使用本机节流
的
Apache
束Java
中
的
大容量操作
、
、
每个表都有2到4个描述实体
的
表。表1
中
的
行
映射到表2
中
的
行
,以此类推。 可以使用
APACHE
读取这些文件并将其映射到我
的
POPJO。我试过使用Open,但它支持CSV,而不是POI作为读者?此外,在处理这些数据时,需要调用带有附件
的
API
。我们计划使用
Apache
束流直流器,并且能够进行POC。唯一
的
问题是,不知道
如何
节流过程。所以每分钟只处理一
浏览 4
提问于2022-07-14
得票数 1
1
回答
在Chrome Dev工具中有没有一种方法可以不
跳过
其他JavaScript文件?
、
、
我想说
的
是,我正在尝试查看特定文件
中
的
所有内容是
如何
工作
的
。我
的
问题甚至是
跳过
特定
的
一
行
或者跳出一个函数,它仍然会把我带到我拥有的一个单独
的
Javascript文件(比如jQuery,特定
的
API
,等等)
中
的
一个函数,而我并不关心它是
如何
工作
的
,因为我知道问题出在我
的
有没有什么方法可以禁止<e
浏览 10
提问于2020-08-20
得票数 3
回答已采纳
点击加载更多
相关
资讯
Java近期新闻: JReleaser 1.2、Spring Batch、PrimeFaces、Quarkus、JobRunr与Apache Beam
Kafka落选!InfoWorld最佳开源数据平台奖公布
想成为大数据开发工程师,你必须掌握的开发流程图是这样的
Apache Calcite 动态数据管理框架入门介绍
Apache Flink 1.10.0 重磅发布,年度最大规模版本升级
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券