腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
在
BigQuery
中
,
分区
需要
多少
行
才
能有
良好
的
性能
?
google-cloud-platform
、
google-bigquery
、
partitioning
我每天都会收到来自应用程序
的
100
行
数据。我公司
的
良好
实践建议按天对每个表进行
分区
。我不认为
在
我将创建
的
每天插入上百
行
的
新表上这样做是好
的
。我想按年对数据进行
分区
,这样好吗?每个
分区
需要
多少
行
才能获得最佳
性能
?
浏览 41
提问于2021-08-10
得票数 0
1
回答
日期分割或日期分割
google-cloud-platform
、
google-bigquery
我
在
BigQuery
中有很多表是分日期
的
,包括几年
的
数据。最近有人告诉我,这是一种旧
的
优化方法,而且日期
分区
要快得多。 这是正确
的
吗?我一直
在
寻找方法来提高对这些数据
的
查询速度,如果日期
分区
允许更快
的
查询,我应该重新构建所有的日期分割GA表作为日期
分区
吗?我应该两者都做吗?我可以期望看到什么样
的
性能
影响,这真的值得付出努力吗?
浏览 0
提问于2019-04-18
得票数 1
1
回答
BigQuery
:
在
自定义
分区
字段上运行时处理
的
数据
google-bigquery
我有一个表,该表按日使用模式
中
的
时间戳字段my_partition_field (而不是摄入时间_PARTITIONTIME)进行
分区
。执行以下查询时:
BigQuery
告诉我,“此查询将在运行时处理XX MB”。处理
的
数据量与该字段不是
分区
字段相同。但是,如果有相同
的
表按摄入时间进行
分区
,并且运行以下查询: SELECT _PARTITIONTIME FROM MY_T
浏览 2
提问于2021-10-27
得票数 0
回答已采纳
1
回答
我能否
在
BigQuery
中
按日期
分区
表进行有效分组?
google-bigquery
我
在
BigQuery
中有一个表
BigQuery
,它包含50亿
行
(~80 in ),并在dateTimeCreated列上进行
分区
,该列
的
时间戳类型是按日划分
的
。我想知道表
中
每天有
多少
行
,所以我构建了这个SQL查询:from `p.d.t` where datetimecreated> '2000
浏览 4
提问于2021-09-04
得票数 0
回答已采纳
1
回答
如何使用时间
分区
表与模板表和超过4000限制
的
BigQuery
?
google-bigquery
对于流插入,我想使用一个模板表(带有用户id后缀),它本身就是一个
分区
表。这样,我就可以使我
的
表比仅仅使用
分区
表更小,从而使我
的
查询更具成本效益。而且,无论我
的
系统中有
多少
用户,我
的
每个用户
的
查询成本都保持不变。根据
的
文档 若要按日期创建较小
的
数据集,请使用时间
分区
表.若要创建不基于日期
的
较小表,请使用模板表,
BigQuery
将为您创建这些表。,听起来它既可以是
浏览 0
提问于2018-07-24
得票数 3
回答已采纳
1
回答
RDD
中
的
分区
数和Spark
中
的
性能
performance
、
apache-spark
、
pyspark
、
rdd
在
Pyspark
中
,我可以从一个列表创建一个RDD,并决定有
多少
个
分区
:sc.parallelize(xrange(0, 10), 4) 我决定对RDD进行
分区
的
分区
数量对
性能有
何影响这如何依赖于我
的
机器拥有的内核数量?
浏览 21
提问于2016-03-05
得票数 43
回答已采纳
2
回答
Rails
中
仅附加数据库
的
软删除
ruby-on-rails
、
activerecord
、
google-bigquery
、
soft-delete
使用Rails和一个仅附加
的
数据库(Google
BigQuery
),软删除
的
最佳实践是什么?我考虑
的
模式是为每次更新/删除添加一个新
行
,并且只收集最近
的
记录。但我不确定有什么干净
的
方法能用活跃
的
记录。还有其他建议
的
模式/最佳做法吗?
浏览 4
提问于2016-04-04
得票数 0
回答已采纳
1
回答
BigQuery
表如何与
分区
和群集字段一起工作?
google-bigquery
当将TIMESTAMP列指定为
分区
时,
分区
将数据保存在磁盘上,允许每次访问。这意味着集群字段与记录保存在磁盘上
的
方式无关?
浏览 0
提问于2019-04-10
得票数 0
回答已采纳
5
回答
BigQuery
表
的
索引
cloud
、
google-bigquery
我有一个用例,其中我们
在
BigQuery
中有几个表。现在,我想在
BigQuery
表
中
的
一个列上实现一个索引。但我找不到足够
的
文件来做这件事。我发现一些博客和帖子提到
BigQuery
不支持索引。请帮我找到一个博客或帖子,可以帮助我
在
BigQuery
上实现索引。提前谢谢。
浏览 3
提问于2015-02-19
得票数 18
回答已采纳
1
回答
表MYSQL 5.6.10
中
的
最大
分区
数
mysql
、
mysql-5.6
我希望
在
我
的
一个表上做一个范围
分区
,这将是范围
分区
。我想知道表
中
的
最大
分区
数是
多少
。我正在运行MySQL5.6.10。谢谢
浏览 5
提问于2016-04-12
得票数 2
1
回答
火花聚合更多
的
分区
apache-spark
、
rdd
、
coalesce
在
处理过程
中
,我可
能有
超过5000个
分区
。
在
写入S3之前,我希望减少
分区
的
数量,因为每个
分区
都是作为文件写入
的
。从文档
中
可以看出,只有当输出
分区
的
数量小于输入时,
才
应
浏览 2
提问于2016-06-02
得票数 1
回答已采纳
2
回答
创造性地使用日期
分区
google-bigquery
我有一些数据,我想要按日期
分区
,也要按内部定义
的
客户端id
分区
。 目前,我们使用逐日表模型来存储此数据。它工作得很好,但查询单个客户端It
的
速度很慢,成本也很高。我们已经考虑为每个客户端id创建一个表,并在这些表中使用日期
分区
。这里唯一
的
问题是,这将迫使我们每天产生数千个加载作业,并提前按客户端id对数据进行
分区
。这是我想出
的
一个可能
的
解决方案:使用逐日表法(例如log_20170110) -Create一个我们用作
分区</e
浏览 0
提问于2017-01-10
得票数 1
1
回答
BigQuery
表设计最佳实践:结合日期划分和分片?
database-design
、
google-bigquery
、
partitioning
、
sharding
最大
的
项目是移动跟踪客户事务
的
事实表。 详细问题我不想在
BigQuery
中
复制表,因为我希望为
BigQuery
优化它。因此,我一直
在
研究
分区
、切分和集群。也研究了非正规化,
浏览 3
提问于2020-03-24
得票数 0
1
回答
当从多个分片表
中
查询超过4亿
行
时,
BigQuery
的
预期查询响应
性能
如何?
google-bigquery
我注意到,当从多个分片表查询超过4亿
行
时,
BigQuery
性能
一直很慢(
在
30秒到1分钟之间)。 我已经
在
一天
中
的
不同时间(下午、深夜和上午)运行了3次查询,通知响应时间一直很慢。该查询使用group-by字符串字段,该字段可
能有
许多唯一值,然后按另一个整数值
的
和降序排序,最后只返回前10个值。我已经
在
相同
的
模式和相同
的
查询上进行了
性能
计时测试,但是将所有数据存储
浏览 0
提问于2013-05-25
得票数 1
3
回答
Bigquery
:
分区
数据超过2000年限制(更新:现在4000限制)
google-bigquery
来自
分区
表上
的
BigQuery
页面: 每年创建一个不
浏览 3
提问于2017-05-22
得票数 6
回答已采纳
1
回答
谷歌BigTable
的
模式设计
google-cloud-platform
、
google-bigquery
、
bigtable
在
我
的
项目中,我使用
的
是谷歌
BigQuery
,它保存了大量
的
数据。
BigQuery
列是: account_id,session_id,transaction_id,用户名,事件,时间戳。
在
我
的
仪表板
中
,我根据时间戳(最后30天)获取整个数据。因为我有非常大
的
数据,所以
性能
非常慢(获取最后30天
的
数据
需要
13秒)。
在
我
的
测试<em
浏览 3
提问于2022-05-25
得票数 0
1
回答
创建由一个/多个列
分区
的
BigQuery
外部表
google-bigquery
、
google-cloud-storage
我正在将一个java应用程序从Hadoop/Hive移植到Google /
BigQuery
。应用程序将avro文件写入hdfs,然后
在
文件之上创建一个/多个
分区
的
Hive外部表。据我所知,Big目前只支持日期/时间戳
分区
,不支持嵌套
分区
。 我们现在处理hive
的
方式是生成ddl,然后使用rest调用执行它。我
在
BigQuery
docs
中
找不到对创建外部表
的
支
浏览 0
提问于2018-08-17
得票数 0
回答已采纳
2
回答
是否使用特定
的
时间戳列将CSV导入
BigQuery
上
的
已
分区
表?
google-bigquery
我想要将一个大型csv导入到一个
bigquery
分区
表
中
,该表具有一个timestamp类型
的
列,该列实际上是某个事务
的
日期,问题是当我加载数据时,它会将所有内容都导入到今天日期
的
一个
分区
中
。是否可以使用我自己
的
时间戳值对其进行
分区
?我怎么能做到这一点。
浏览 0
提问于2016-07-05
得票数 1
1
回答
MySQL -每个表
的
记录数和每个实例
的
表数
的
分片启发式是什么?
mysql
、
database-design
、
scalability
我们知道我们
需要
分片,并且正在寻找可扩展
的
通用启发式方法。感谢您
的
指点,并了解您使用
的
粗略
的
计算方法
浏览 0
提问于2011-05-27
得票数 1
回答已采纳
2
回答
BigQuery
-事实表更新逻辑
google-bigquery
我正致力于
在
性能
和成本分析
的
大查询上构建原型,为销售业务(激励措施、领导、权利、预测、市场营销、领导等)建立一个DW (星型模式)数据,用于报告和高级分析目的。摄食逻辑 旧日
的
新记录,附加到相应
的
日临时表
中</
浏览 0
提问于2016-10-05
得票数 4
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券