腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Bigquery
-
数据
是
如何
按
分区
键
分布
的
?
我有Teradata和Netezza在MPP技术
数据
仓库方面的背景。 我想问一下谷歌
BigQuery
是
如何
在一个简单
的
表上
按
分区
键
分发
数据
的
?我真的在尝试理解
BigQuery
引擎
如何
工作
的
逻辑,如果这有意义的话? Teradata和Netezza有一个记录良好
的
技术页面,它描述了所使用
的
过程(就像一步一步
的
演练
浏览 6
提问于2021-01-21
得票数 0
3
回答
Greenplum
数据
在
数据
段之间
的
分布
、
、
我有一个Greenplum
数据
库,其中有10个
数据
段反映了10个硬盘。我
的
表
按
日期分为主
分区
,
按
hash id分为次
分区
。因此一个月内将有30个主
分区
,每个
分区
包含100个子
分区
。根据hashid加载子
分区
中
的
数据
。现在
的
问题
是
这些
分区
是
如何
在段之间
分布
<e
浏览 0
提问于2011-10-13
得票数 1
1
回答
如何
避免热
分区
,同时仍然提供必要
的
访问模式
我在定义主键、
分区
键
和排序
键
以跨
分区
分发
数据
并允许查询时遇到了困难。 用户将只能访问其域中
的
帖子。一些域名会比其他域名有更多
的
帖子。由于所有查询都需要基于域限制结果,
如何
在
分区
之间均匀
分布
数据
(据我所知,您不能跨
分区
进行查询)?我最初
的
想法
是
使用复合
分区
键
和begins-with来查询: Domain | Po
浏览 26
提问于2019-10-02
得票数 0
回答已采纳
2
回答
Cassandra
如何
仅通过使用
分区
键
来检索行?
、
、
类似于BigTable
的
数据
库存储按键排序
的
行。Cassandra架构
是
如何
以这种方式工作
的
?例如,RocksDB中
的
一种解决方法
是
,您可以
按
分区
浏览 9
提问于2018-11-26
得票数 0
1
回答
区分Azure Cosmos DB中
的
分区
键
和
分区
键
范围
、
我很难理解Cosmos DB中
分区
键
和
分区
键
范围之间
的
区别。我一般认为cosmos db中
的
分区
键
是
每个文档中
的
JSON属性/路径,用于在多个
分区
之间均匀
分布
数据
,以避免任何不均匀
的
“热
分区
”--
分区
键
决定文档
的
物理位置。但是我不清楚
分区
键
浏览 19
提问于2019-07-09
得票数 4
回答已采纳
1
回答
Cassandra
数据
建模:选择
分区
键
和组合
键
、
、
、
、
我正在尝试使用Cassandra进行
数据
建模,但我不知道应该选择什么作为我
的
分区
键
和组合
键
。我面临
的
问题
是
列(A,B,C,D)
的
集合唯一地标识了
数据
,并且每当我执行插入操作时,我都想防止重复,并且使用列(A,B,C,D)
的
集合进行搜索可能代价很高,因为它不是我
的
主键
的
一部分。我随机生成id,我认为一种方法
是
散列4列,然后它将解决重复问题,但我怀疑如果我开始获取id
浏览 28
提问于2019-09-29
得票数 0
1
回答
单次请求查询Cassandra上
的
拆分
分区
在观看本系列课程中
的
一个时,我被介绍了拆分
分区
以管理
分区
大小
的
概念。 我目前
的
理解
是
,Cassandra
的
最大逻辑容量为每个
分区
2B个条目,但建议
的
最大容量为每个
分区
几个100s MB。视频课程讨论了
如何
引入额外
的
分区
键
,以便有目的地拆分
分区
,或者减少每个
分区
的
大小要求。视频指出,要么使用基于
浏览 1
提问于2015-11-02
得票数 1
1
回答
处理多个Pubsub
的
数据
流管道设计
、
我有一条管道,它从Pubsub主题(
按
分钟加窗口)读取,并将处理后
的
结果写入
BigQuery
。我希望按时间对表进行切分,并从
数据
本身中分出一些
键
。BigQueryIO确实提供了
按
窗口时间戳分割表
的
选项,但我认为它没有提供任何选项来通过输入集合本身
的
某个
键
分割表。如果我错过了一些替代方案,请告诉我。为了克服这个问题,(选项1)我选择用相同
的
键
分割源Pubsub本身,设置管道从多个源读取并沿着不同<em
浏览 1
提问于2015-09-18
得票数 4
回答已采纳
1
回答
在哪些情况下,散列
分区
比星火中
的
范围
分区
更可取?
、
、
、
我已经阅读了关于散列
分区
的
各种文章。但我仍然不明白在哪种情况下它比范围
分区
更有利。使用sortByKey,然后使用范围
分区
,可以使
数据
在集群中均匀
分布
。但在散列
分区
中可能不是这种情况。请考虑以下示例:partition 0: [8
浏览 4
提问于2017-11-12
得票数 11
回答已采纳
1
回答
卡桑德拉
分区
与NoSql
分区
、
、
我理解了不同
的
b/w Cassandra
分区
键
,复合
键
,聚类
键
。但是没有找到足够
的
信息来理解
如何
在cassandra中处理
分区
。在DB.中,每个
分区
键
是否有不同
的
文件(在系统级别)?如果
是<
浏览 2
提问于2018-04-10
得票数 1
回答已采纳
1
回答
如何
将
数据
附加到
BigQuery
表中
的
现有
分区
我们可以在
BigQuery
表上创建一个
分区
,同时创建一个
BigQuery
表。
如何
将
数据
截断并加载到
BigQuery
表中<
浏览 8
提问于2017-11-08
得票数 1
1
回答
基于
分区
键
的
记录数-是否存在最大/分钟
我们有大约2000万份文件需要插入到我们
的
宇宙
数据
库中。这些文档
的
分区
ID
是
基于Group_ID
的
。在这个Person_ID下可以有最大300个唯一
的
Group_ID。如果我考虑300个,那么我们大概可以得到66K
的
分区
。 GROUP_ID搜索将是我们最常用
的
ID。问题:有66k<
浏览 1
提问于2021-03-22
得票数 4
5
回答
BigQuery
表
的
索引
、
我有一个用例,其中我们在
BigQuery
中有几个表。现在,我想在
BigQuery
表中
的
一个列上实现一个索引。但我找不到足够
的
文件来做这件事。我发现一些博客和帖子提到
BigQuery
不支持索引。请帮我找到一个博客或帖子,可以帮助我在
BigQuery
上实现索引。提前谢谢。
浏览 3
提问于2015-02-19
得票数 18
回答已采纳
1
回答
在Cassandra中,一致散列和
分区
有什么区别?
我
是
卡桑德拉
的
新手,我被consistent hashing和partitioner搞混了。他们俩都一样吗?
分区
程序确定
数据
如何
分布
在集群中
的
节点(包括副本)。基本上,
分区
程序
是
一个函数,用于从其
分区
键
派生表示行
的
令牌,通常是通过散列。然后,通过令牌
的
值将每一行
数据
分布
在
浏览 4
提问于2020-04-12
得票数 1
回答已采纳
3
回答
为基于日期
的
全球PartitionKey应用程序选择正确
的
DocumentDB
、
、
、
、
我正在开发一个环球应用程序,其中大多数搜索
是
基于地理空间
数据
(最近
的
记录给定坐标)和日期范围。谢谢! UPDATE:就像我告诉Matias (见答案),我和我
的
朋友,我们正在考虑一些类似国家
的
事情。这个应用程序都是关于搜索
的
。另一件重要
的
事
是
我们
浏览 8
提问于2016-11-24
得票数 1
回答已采纳
1
回答
我们
如何
在Cassandra中为没有定义主键
的
表确定唯一
的
记录?
我有Cassandra
数据
库和其中
的
一些表。表没有定义主键/唯一
键
/组合
键
。我们
如何
在表中识别唯一
的
记录? 就像甲骨文有ROWID
的
概念一样,我们也有一些关于Cassandra
数据
库
的
东西。不适用
浏览 11
提问于2022-11-28
得票数 1
1
回答
BigQuery
表
如何
与
分区
和群集字段一起工作?
当将TIMESTAMP列指定为
分区
时,
分区
将
数据
保存在磁盘上,允许每次访问。这意味着集群字段与记录保存在磁盘上
的
方式无关?
浏览 0
提问于2019-04-10
得票数 0
回答已采纳
1
回答
如何
调查和解决Azure Data Lake Analytics中
的
节流时间问题?
、
在我
的
一个成功
的
ADLA工作中,我得到了以下警告:输入/输出表:
按
轮询方式
分布
,250个
分布
(每个
分区
浏览 1
提问于2017-05-19
得票数 0
2
回答
Cassandra
的
时间序列模式设计
、
、
、
、
所有, 我们计划把月份和年份作为
分区
密钥
浏览 1
提问于2015-12-17
得票数 1
回答已采纳
1
回答
BigQuery
中
的
单元
分区
布局表格式
、
、
、
下面
是
这样
的
:例如,文档中说:“文件遵循默认布局,
键
/值对布局为目录,分隔符为=符号,<em
浏览 10
提问于2020-04-07
得票数 1
点击加载更多
相关
资讯
ipfs网络的分布式数据是如何做到数据共享的?
分布式存储:IPFS/Filecoin是如何帮你存储数据的!
Kafka 客户端是如何找到 leader 分区的
分布式集群如何实现高效的数据分布
分布式数据库TiDB是如何结合OLTP和OLAP的?
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券