发布

ClickHouse

专栏成员
51
文章
61788
阅读量
18
订阅数
ByConity 端口详解
jasong
2024-12-19
700
ByConity build on Centos
个人走了一趟便便,发现centos 编译下最大的问题是。byconity依赖 llvm下clang,但clang 又不完全满足byconity 依赖包,一部分依赖来自于gcc lib,因此我们是在gcc基础上,进行llvm 的编译安装,并在byconity 编译时 设置cmake gcc_toolchain 指向gcc-10,如果官方有其他解决方案也可参考官方。
jasong
2024-12-19
1010
Iceberg
一个metadata 存放多个snapshot, snapshot:mainfest_list = 1:1
jasong
2024-11-26
1340
湖仓一体
我理解就是各类数据爆发的公司当前数据平台架构遇到了各类各样的问题,寻求一个适配公司、平台的数据架构,一站式解决,但是大家对湖、仓本质的理解可能都不太一样,那又怎么谈湖仓一体呢。
jasong
2024-11-22
1540
Impala 内存梳理1
Arena 别名参考LevelDB设计, BufferPool 我理解主要是进行按照不同Page大小,缓存不同PerSizeList连续空间..
jasong
2024-03-05
2270
ClickHouse opt 2 QueryPlan::buildQueryPipeline
参考https://bbs.huaweicloud.com/blogs/314808
jasong
2023-11-05
4581
离在线一体 引擎一体化 云原生
OLAP 是一个很卷的赛道,创业公司也众多。在本文中,笔者基于 10+ 年的大数据与数据仓库的工作经验,就目前的主流趋势:离在线一体化、引擎一体化、云原生化等写一些思考,抛砖引玉,希望能与各位共同探讨。
jasong
2023-09-09
3460
腾讯云数据仓库 全新更名TCHouse
欢迎体验试用 https://cloud.tencent.com/product/tchousex
jasong
2023-09-07
5340
ByConity(ByteHouse) CascadesOptimizer 初探 1
查询过程主要有 class InterpreterSelectQueryUseOptimizer : public IInterpreter 初始化和执行
jasong
2023-08-31
5590
MPP Join RuntimeFilter
RuntimeFIlter: 多用于两表Join 时, 通过减少大表返回行的,减少网络传输、减少数据量、 进而加速Join过程的一种方法
jasong
2023-08-30
2900
Spark RDD -> Stage Task
RDD分为两种: Transformation 转换算子, Action 动作算子
jasong
2023-07-21
2090
c++ string_view
https://www.geeksforgeeks.org/class-stdstring_view-in-cpp-17/
jasong
2023-06-26
3810
列存数据库 Code Generation & Vectorized Model
现在个人只是储备来看,向量化跟以上是都可以兼容的,所有引擎是可以简单都理解为是Valcano Model 的变种吧
jasong
2023-05-14
9670
ClickHouse 基础参数优化
靠谱 users.xml profile M(UInt64, replication_alter_partitions_sync, 1, "Wait for actions to manipulate the partitions. 0 - do not wait, 1 - wait for execution only of itself, 2 - wait for everyone.", 0) \M(Int64, replication_wait_for_inactive_replica_timeout
jasong
2023-04-24
1.3K0
ClickHouse Replicated 高效迁移方案
-config.xml 新增src zookeeper 'src_cluster'
jasong
2023-03-21
1.1K0
Bytes KB MB TB PB..
1KB = 1024 Bytes = 2^10 Bytes = (1L << 10) Bytes
jasong
2023-02-28
1.1K0
parquet 文件解析
首先parquet 分为数据区域和索引区域, 如图,至于 索引区域为何放到文件末尾大家可以思考下
jasong
2023-02-13
9440
mpp query optimization
声明:本文基本为多篇文章组合而成,仅供参考!(主要参考https://developer.aliyun.com/article/789901?spm=a2c6h.12873581.technical-
jasong
2022-11-24
1.5K0
impala be query plan 3 prepare->open->close
为特定查询创建的所有后端执行状态的中心类(例如:各个片段实例的FragmentInstanceStates)。此类包含或使可访问状态在片段实例之间共享;相反,片段实例特定的状态收集在FragmentInstanceState中。QueryState的生存期由引用计数决定。代表查询执行并访问其任何状态的任何线程都必须获取对相应QueryState的引用,并至少在该访问期间保持该引用。通过QueryExecMgr::Get-/ReleaseQueryState()或QueryState::ScopedRef(后者用于仅限于单个函数或块范围的引用)获取和发布引用。只要引用计数大于0,查询的所有控制结构(包含在该类中或可通过该类访问,如FragmentInstanceStates)都保证是活动的。
jasong
2022-09-28
5920
Impala be query plan2 - AdmissionController
AdmissionController 用于根据在一个或多个资源池中配置的可用集群资源限制请求(例如查询、DML)。请求将被允许立即执行、排队等待稍后执行或拒绝(立即或排队后)。资源池可以配置为具有最大并发查询数、最大集群范围内存、最大队列大小、每个查询的最大和最小每主机内存限制,并设置mem_limit查询选项是否会被前面提到的最大/最小每主机限制限制限制。如果执行的查询太多或可用内存不足,查询将排队。一旦队列达到最大队列大小,传入的查询将被拒绝。队列中的请求将在可配置的超时后超时。
jasong
2022-09-28
3530
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档