Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >在BigQuery中按组计算百分位数

在BigQuery中按组计算百分位数
EN

Stack Overflow用户
提问于 2020-10-06 03:23:02
回答 1查看 227关注 0票数 0

在四处寻找之后,我找不到一个解决方案。下面是一个例子:

代码语言:javascript
运行
AI代码解释
复制
with
  my_data as (
    select 1 as num, 'a' as letter union all
    select 2 as num, 'a' as letter union all
    select 3 as num, 'a' as letter union all
    select 4 as num, 'a' as letter union all
    select 5 as num, 'a' as letter union all
    select 6 as num, 'b' as letter union all
    select 7 as num, 'b' as letter union all
    select 8 as num, 'b' as letter union all
    select 9 as num, 'b' as letter union all
    select 10 as num, 'b' as letter
  )

select
  letter,
  approx_quantiles(num, 100) as value
from my_data
group by letter

我们希望为按letter分组的num列计算0- 100个分位数。当前查询只返回2行,因为value列看起来像一个数组。我们需要的是上面的查询返回202行,结构如下:

代码语言:javascript
运行
AI代码解释
复制
letter value pctile
     a     1      0
     a     1      1
     a     1      2
     a     1      3
     a     1      4
...
     b     1      0
     b     1      1
     b     1      2
     b     1      3
     b     1      4

...where pctile列是0- 100,value列是与pctile列中的百分位数关联的值。这不是最好的示例,因为我们试图计算0- 100百分位数,并且示例数据只有10行,但我认为这足以反映问题。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-10-06 05:06:33

下面是针对BigQuery标准SQL的说明

代码语言:javascript
运行
AI代码解释
复制
#standardSQL
SELECT letter, value, pctile
FROM (
  SELECT
    letter,
    APPROX_QUANTILES(num, 100) AS value
  FROM my_data
  GROUP BY letter
) t, t.value WITH OFFSET AS pctile
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64218911

复制
相关文章
用MongoDB Change Streams 在BigQuery中复制数据
Chang Stream(变更记录流) 是指collection(数据库集合)的变更事件流,应用程序通过db.collection.watch()这样的命令可以获得被监听对象的实时变更。BigQuery是Google推出的一项Web服务,该服务让开发者可以使用Google的架构来运行SQL语句对超级大的数据库进行操作。
MongoDB中文社区
2019/08/26
4.3K0
用MongoDB Change Streams 在BigQuery中复制数据
ElasticSearch 如何使用 TDigest 算法计算亿级数据的百分位数?
ElasticSearch 作为一个分布式的开源搜索和分析引擎,不仅能够进行全文匹配搜索,还可以进行聚合分析。
程序员历小冰
2021/04/19
3.8K0
ElasticSearch 如何使用 TDigest 算法计算亿级数据的百分位数?
ElasticSearch 如何使用 TDigest 算法计算亿级数据的百分位数?
今天,我们就来了解一下其聚合分析中较为常见的 percentiles 百分位数分析。n 个数据按数值大小排列,处于 p% 位置的值称第 p 百分位数。
程序员历小冰
2021/04/30
1.2K0
ElasticSearch 如何使用 TDigest 算法计算亿级数据的百分位数?
在Ubuntu中实现python按tab
    刚学习python,其实一切都很好接受,因为有过C语言的基础,感觉一切都来得那么自然,python极其精简的语法,让我真心是爱上这种语言!相信往后python一定会在我的IT生涯中大放光彩!
py3study
2020/01/09
1.6K0
排序及生成百分位数
值得一提的是 rank函数有多种给相同数值的观察值排序的方法,而默认的处理方法的结果如下;
宋彦
2019/07/03
6.3K0
排序及生成百分位数
(翻译)性能监控之百分位数监控
原文链接:https://www.adfpm.com/adf-performance-monitor-monitoring-with-percentiles/ 一、前言 在性能监控中什么是最好的度量—
高楼Zee
2021/05/11
1.8K0
(翻译)性能监控之百分位数监控
SQL 计算中位数
笔者在 HackerRank 上的 SQL 编程挑战看到这题,这题有 96% 的提交成功率。实际上,使用 SQL 求中位数远远没那么简单。
白日梦想家
2020/08/06
1.9K0
在Android Library的Module中按渠道依赖
Finally I found out how to do this, I will explain it here for others facing same problem:
全栈程序员站长
2021/06/21
1.2K0
在Android Library的Module中按渠道依赖
Python计算中位数_用频率直方图求中位数
output 8.416666666666666 8.0 ModeResult(mode=array([8]), count=array([6]))
全栈程序员站长
2022/09/27
8670
java计算百分比
用户9131103
2023/07/17
3840
怎样在textarea中按Ctrl+回车提交表单?
<script   language="JavaScript">     function   KeyDown(){     if(!(event.shiftKey||event.altKey)&&event.keyCode==13&&event.ctrlKey)  {     document.GroupSendForm.submit();     }     }     </script>     <form   name="GroupSendForm"   method="post">         <textarea   name="OtherPhone"   rows="15"   onKeyDown="return   KeyDown();"></textarea>         <input   type="submit"   name="Submit"   value="提交">     </form>  
Tony老师
2020/03/05
1.8K0
视频质量评估的新方式:VMAF百分位数
原文链接 / https://blog.twitter.com/engineering/en_us/topics/infrastructure/2020/introducing-vmaf-percentiles-for-video-quality-measurements.html
LiveVideoStack
2020/12/16
3.1K0
视频质量评估的新方式:VMAF百分位数
谷歌BigQuery ML VS StreamingPro MLSQL
今天看到了一篇 AI前线的文章谷歌BigQuery ML正式上岗,只会用SQL也能玩转机器学习!。正好自己也在力推 StreamingPro的MLSQL。 今天就来对比下这两款产品。
用户2936994
2018/08/27
1.5K0
BI技巧丨百分位计算
百分位数据计算,可以说是日常计算中比较常见的需求,通常会用于价格段位分析使用,而在PowerBI中,用于百分位计算的函数一共有四个。
PowerBI丨白茶
2022/11/05
8060
BI技巧丨百分位计算
python中按字母排序_在Python中按字母顺序排序文本文件的内容
我想在文件内部按字母顺序排序。我当前执行此操作的代码不起作用,文件保持不变。这个程序本身就是一个基本的调查问卷,用来实验读写文件。在import time
用户7886150
2021/01/27
5.2K0
Wikipedia pageview数据获取(bigquery)
维基百科pageview数据是Wikimedia技术团队所维护的访问量数据集。该数据集自2015年五月启用,其具体的pageview定义为对某个网页内容的请求,会对爬虫和人类的访问量进行区分,粒度为小时级别,如下图:
千灵域
2022/06/17
2.8K0
Wikipedia pageview数据获取(bigquery)
Getx在flutter中管理路由组
Get在这里接受任何东西,无论是一个字符串,一个Map,一个List,甚至一个类的实例。
徐建国
2021/11/30
2K0
Python计算中位数 numpy.median
numpy模块下的median作用为: 计算沿指定轴的中位数 返回数组元素的中位数
chaibubble
2022/05/07
1.5K0
数据统计在性能检测中的应用
本文根据 2022.05.28 日,《前端早早聊大会》 的“性能”专场分享整理而来。
政采云前端团队
2022/12/01
1.6K0
数据统计在性能检测中的应用
点击加载更多

相似问题

在BigQuery中计算百分位数

38

使用Numpy按组计算百分位数排名

20

在bigquery中按百分位分组

132

Sparklyr按组计算分位数

11

按百分位数计算

22
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档