腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
GCP
Bigquery
,
我
希望
在
一列
中
按
目录
值
聚合
一些
值
、
、
、
我
想要的是计算每个5分钟的总份额、交易
值
、交易计数和平均价格(VWAP= dollarTraded / totalVolume)。>0 ROUND(UNIX_SECONDS(Date_Time) / 300), interval_alias1 ORDER BY interval_alias1 然而,
我
想进一步推进
我
的分析,
我
想要的不仅仅是交易的总摘要,
我
希望
根据限定符和tradeCatogary的不同组合进行更具体的
浏览 17
提问于2021-10-26
得票数 0
1
回答
在
GCP
中
执行数据映射
、
我
有来自多家酒店的数据。这些酒店没有使用相同的命名约定来存储订单信息。
我
在
bigquery
中
创建了一个预定义的数据集(称为hotel_order)。
我
希望
将来自不同酒店的数据映射到
GCP
中
的单个数据集,因此
在
bigquery
中进行比较就更容易了。如果列名(来自hotel1)与
bigquery
列名匹配,那么
bigquery
应该加载列
中
的数据,如果列
浏览 2
提问于2022-02-24
得票数 0
2
回答
google
bigquery
基于表列的个性化警报
、
我
在
google
bigquery
中有一个表,
我
在其中计算
一列
(将其视为异常检测列),
在
GCP
中
,是否有方法发送基于规则的警报(例如,一旦列
中
的
值
为1),如果不是,您会建议如何处理此问题。谢谢
浏览 20
提问于2021-04-11
得票数 1
1
回答
如何从
按
年份/月/日分区的桶中加载数据到
bigquery
我们有一个数据存储
在
gcp
桶
中
,格式如下- gs:/gcptest/Year=2020/Month=06/day=18/test1.parquet和day=18文件夹下的这么多文件。
我
希望
在
bigquery
中
创建一个表,其中的列存在于文件
中
,并按文件路径上的年份、月份和日期进行分区。这样,当我将数据加载到表
中
时,
我
可以从
gcp
桶中选
浏览 3
提问于2020-06-18
得票数 1
回答已采纳
2
回答
如何处理未在
中
聚合
的端口
、
、
在其中一个映射中,有几个端口/列,例如A和B,它们
在
聚合
器转换
中
没有被分组,也没有应用任何像sum、avg等
聚合
函数。根据我的组织
中
的高级devs,
在
Informatica
中
,我们将在
聚合
器之后得到这些端口/列的最后
值
。
我
的问题是,如何在
BigQuery
SQL中转换这种行为?因为不能使用select语句中的列,而select语句中的列不存在于Group子句中,因此我们不
浏览 9
提问于2022-08-28
得票数 0
2
回答
BigQuery
-事实表更新逻辑
我
正致力于
在
性能和成本分析的大查询上构建原型,为销售业务(激励措施、领导、权利、预测、市场营销、领导等)建立一个DW (星型模式)数据,用于报告和高级分析目的。每天从客户关系管理和其他上游销售/营销系统
中
批量装载数据。每天的数据量约为5 TB数据,90%的附加数据和10%的数据具有更新的旧指标(直到前7天)。创建
聚合
表,用于报告和其他重复查询/仪表板,以限制扫描量和降低成本。 上游ETL和cron作业,
在
Google存储
中</
浏览 0
提问于2016-10-05
得票数 4
1
回答
气流-选择
bigquery
表数据到数据
中
、
、
我
试图
在
google上的空气流编写器
中
执行以下DAG,并且一直得到相同的错误:未定义conn_id hard_coded_project_namefrom airflow.contrib.hooks.
bigquery
_hookdefault_args = { 'start_date
浏览 2
提问于2021-11-29
得票数 0
回答已采纳
2
回答
Zeppelin配置属性文件:无法加载
BigQuery
解释器配置
、
我
试图通过
我
的zeppelin-site.xml设置
我
的zeppelin.
bigquery
.project_id (或任何
bigquery
配置属性),但是当我启动齐柏林飞艇时,
我
的更改没有加载。
我
可以更改其他配置属性(例如zeppelin.notebook.storage)。
我
使用的是的齐柏林飞艇0.7.3。zeppelin-site.xml (
在
启动齐柏林之前创建,
在
interpreter.json文件存在之前创建
浏览 0
提问于2018-04-06
得票数 0
2
回答
如何在
聚合
表达式中使用每个“当前行”
值
作为条件参数
我
希望
通过
按
和条件
聚合
我
的表生成一个相应的
值
(
在
新的最后
一列
中
),在此条件和计算中使用每个对应的行
值
中
的
一些
: 所有“秒”之和,如果“第一”等于当前第一
值
(A),“第二”等于当前第二
值
(5)
在
Excel
中
,我们通过轻松使用当前行的地址和通过拖动扩展公式来解决当前行。
在
pow
浏览 1
提问于2020-03-31
得票数 0
回答已采纳
1
回答
bigquery
: GROUP BY列表
中
不存在表达式'f0_‘
、
我
想计算出现在
一些
经纬点上的
一些
字段
值
的实例。Lat/Lon是字符串,所以我将它们转换为float,然后将它们四舍五入为1m (5个小数位)。ROUND(FLOAT(lon), 5)),FROMGROUP BY lon,
我
希望
有,作为结果,对于每个经度/经度连接,
一些
值
出现在“字段”的
值
中</e
浏览 0
提问于2017-12-09
得票数 0
回答已采纳
1
回答
是否有一种方法可以创建星星之火中所有列的列表
、
、
我
有一个dataSet:
我
尝试groupBy的第
一列
,
我
想
聚合
所有的列。这就是
我
使用以下代码
按
第二列进行
聚合
时得到的结果: 其思想是为
浏览 3
提问于2020-06-05
得票数 1
回答已采纳
1
回答
中
按
问题分组
我
是Google Big Query (和堆栈溢出)的新手,主要测试Big Query处理巧尽心思构建和巧尽心思构建的查询的速度。GROUP BY只返回每个术语/lincat对的联接计算的最低
值
。
我
得到的错误是: (L1:62):
按
列表表示'phrases.nonstops.id‘
在
组
中
浏览 6
提问于2015-06-06
得票数 5
1
回答
ValueError:必须用beam.io.
gcp
.
bigquery
.ReadFromBigQuery指定
BigQuery
表或查询
、
、
、
、
我
试图传递一个
BigQuery
表名作为apache管道模板的
值
提供程序。根据和这个,可以将
值
提供程序传递给apache_beam.io.
gcp
.
bigquery
.ReadFromBigQuery。( ) 当我
在
本地运行代码时,命令行传递user_options.input的
值
为--input projectid.dataset_id.table但是,
我
犯
浏览 3
提问于2021-07-14
得票数 1
1
回答
如何在
GCP
BigQuery
联邦查询中使用查询参数
、
我
有一个基于
gcp
的环境。
我
在
gcp
BigQuery
中使用标准SQL脚本,并对cloudsql MySql使用联邦查询。联邦查询从cloudsql mysql数据库中选择数据。
我
需要根据依赖于
BigQuery
中
数据的条件从cloudsql mysql数据库中选择数据。
我
在
gcp
bigquery
中使用标准sql脚本
中
的变量来存储从
big
浏览 75
提问于2021-02-01
得票数 1
回答已采纳
2
回答
Bigquery
软件
中
的Tensorflow预测
、
、
我
有一个多类分类TensorFlow模型导入到
GCP
BigQuery
中
。
在
进行预测时,输出是概率,它是类型浮点数(概率)和重复模式。使用
BigQuery
中
的SQL获取最大
值
索引的最佳方法是什么?
浏览 12
提问于2022-06-08
得票数 0
回答已采纳
1
回答
动态访问
BigQuery
数据集上的设置
、
我
需要在运行时创建
BigQuery
数据集,并在运行时分配所需的角色。使用Python脚本实现此目的。
我
在
谷歌上搜索了有关如何在创建数据集后更新访问设置的帮助,并找到了以下: role='READER',"access": [ {"role": "OWNER","groupByEmail": &
浏览 1
提问于2018-05-07
得票数 0
1
回答
返回键值对而不是两个单独列的
BigQuery
SQL选择
、
、
、
我
试图
在
bigquery
上的select语句中合并两列,这样
我
就有
一列
具有键值对,而不是有两列(
一列
具有键,另
一列
具有
值
)。
我
曾尝试使用array_agg(),但每次这样做都会导致语句的第一行出现错误:“一个表达式引用了既不分组也不
聚合
的列colName”。任何关于如何做到这一点或什么可能导致
我
的array_agg错误的建议都将不胜感激。
浏览 6
提问于2018-06-25
得票数 0
6
回答
需要帮助创建将CSV加载到
BigQuery
的架构
、
、
我
正在尝试从将
一些
CSV文件加载到
BigQuery
中
,并与模式生成进行斗争。有一个自动生成选项,但它的文档很少。问题是,如果
我
选择让
BigQuery
生成模式,它在猜测数据类型方面做得不错,但有时它才会将数据的第一行识别为标题行,而有时则不会(将第一行视为数据,并生成类似于string_field_N的列名)。
我
的数据的第一行总是头行。有些表有许多列(超过30列),
我
不想乱搞模式语法,因为当模式有问题(
我
不知道是什么)时,
Big
浏览 0
提问于2019-01-22
得票数 2
1
回答
在
谷歌
BigQuery
上按时间窗口划分时间块
、
我
有一个
在
BigQuery
上运行的查询,
我
希望
能够通过特定的时间框架来组合行,并对其他行的
值
进行平均。,这样
我
就可以
按
小时显示结果。如何在
BigQuery
中
编写查询,以便
按
小时块或甚至天块对其进行分组。
我
希望
查询的结果是这样的: timestamp | value ______________________________
浏览 31
提问于2019-01-29
得票数 0
回答已采纳
1
回答
监控WriteToBigQuery
、
、
、
在
我
的管道
中
,
我
使用WriteToBigQuery,如下所示: 'thijs:thijsset.thijstable',然后
我
得到:AttributeError: 'dict' object has no attribute 'pipeline
浏览 0
提问于2019-11-29
得票数 4
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券