首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Greenplum生态工具

Greenplum生态工具 第一节Greenplum 生态介绍 1、Greenplum 发展历史 2005 年 1、Greenplum 数据库第一个版本发布 2、基于强大的开源数据库PostgreSQL...2015 年 1、Greenplum 开源,世界上第一款开源MPP数据库 2、开源版本基于Greenplum4.3 2017 年 1、Greenplum 5.0发布 2、PostgreSQL 内核由8.2...、申诉的PG内核合并工作,让GP越来越强大 3、MADLib zedstore等贡献,回馈PG 4、pxf/fdw 等组件,使数据集成更容易 2、商业版开源版的差异 商业版包含了开原版本的所有的功能,...第四节Greenplum BI/ETL 工具 1、商业BI--Tableau 1、Tableau 是一款数据分析可视化工具,他支持连接到各种数据库,不管是电子表格,还是数据库数据,都能进行无缝连接。...3、关系型数据库相关性比较大的有: TPC - H TPC - C TPC - DS 2、TPC-H/TPC-DSTPC-C比较 1、TPC-H 通常用于PLAP测试,在一些客户要求的TPC-H测试长江下

3.6K51
您找到你想要的搜索结果了吗?
是的
没有找到

Greenplum 监控运维

例行vacuumanalyze 2. 例行重建索引 3. 管理GP数据库日志文件 三、推荐的监控运维任务 1. 监控数据状态 2. 数据库警告日志监控 3. 硬件和操作系统监控 4....补丁升级 四、性能问题排查指南 一、监控 1....检查系统状态 (1)查看mastersegment的状态配置 # 概要信息 gpstate # 配置详细信息 gpstate -s (2)查看mirror段的状态配置 # mirror状态...补丁升级 (1)确保对Linux内核应用了任何错误修复或增强,至少每6个月执行一次。 (2)升级Greenplum数据库小版本,例如5.0.x。每季度执行一次。...升级Greenplum 6小版本过程参考: https://docs.greenplum.org/6-14/install_guide/upgrading.html 四、性能问题排查指南 1.

2.8K31

Greenplum备份安全高可用

Greenplum备份安全高可用 学习地址: https://www.bilibili.com/video/BV1s54y127ex 目录 Greenplum备份安全高可用 目录 1 Greenplum...高可用 1.1 管理节点 1.2 数据节点 1.3 交换机 1.4 服务器 1.5 Master高可用 1.6 Segment高可用 1.7 系统表高可用 1.8 系统视图高可用 2 Greenplum...高可用 Greenplum数据库软件自身具备多层次容错和冗余功能,同时对于底层硬件设备,Greenplum也提供了很多容错机制要求,以保证系统7*24不间断的运行处理: 1.1 管理节点 1、部署2台管理节点...Masterstandby master之间是通过WAL机制实现日志的实时更新。可以通过gpstate -f查看详细信息。 1.6 Segment高可用 ?...链接可用 pam: 使用操作系统提供的可插入认证模块服务(PAM)认证 redius:用RADIUS服务器认证 cert : 使用SSL客户端证书认证 Ident: 通过获取客户端的操作系统用户名,检查是否被访问的数据库用户名匹配

83120

Greenplum备份安全高可用

Greenplum备份安全高可用 目录 Greenplum备份安全高可用 1 目录 1 1 Greenplum高可用 2 1.1 管理节点 2 1.2 数据节点 2 1.3 交换机 2 1.4...服务器 2 1.5 Master高可用 3 1.6 Segment高可用 3 1.7 系统表高可用 4 1.8 系统视图高可用 4 2 Greenplum安全 4 2.1 身份认证 4 2.1.1 pg_hba.conf...高可用 Greenplum数据库软件自身具备多层次容错和冗余功能,同时对于底层硬件设备,Greenplum也提供了很多容错机制要求,以保证系统7*24不间断的运行处理: 1.1 管理节点 1、部署2台管理节点...1.5 Master高可用 Masterstandby master之间是通过WAL机制实现日志的实时更新。可以通过gpstate -f查看详细信息。...链接可用 pam: 使用操作系统提供的可插入认证模块服务(PAM)认证 redius:用RADIUS服务器认证 cert : 使用SSL客户端证书认证 Ident: 通过获取客户端的操作系统用户名,检查是否被访问的数据库用户名匹配

1.1K41

Greenplum 实时数据仓库实践(3)——Greenplum数据仓库

本篇最后简单对比Greenplum另一个流行的大数据处理框架Hadoop,进而阐述可以选择前者的理由。...3.1.1 历史现状 Greenplum最早出现在2002年,比大名鼎鼎的Hadoop(约2004年前后面世)还要早一些。...本节就以我个人的实践体验对比一下GreenplumSQL-on-Hadoop,并简述Greenplum的可行性和局限性。...3.4.1 Greenplum还是SQL-on-Hadoop GreenplumHadoop都是为了解决大数据并行计算而出现的技术,两种技术的相似点在于: 分布式存储数据在多个节点上。...Greenplum支持用“Hadoop外部表”方式来访问、加载HDFS的数据。虽然GreenplumHadoop外部表性能大幅低于MPP内部表,但比Hadoop自身的Hive要快很多。

3.9K20

Greenplum 实时数据仓库实践(9)——Greenplum监控运维

目录 9.1 权限角色管理 9.1.1 Greenplum中的角色权限 9.1.2 管理角色及其成员 9.1.3 管理对象权限 9.1.4 口令加密 9.2 数据导入导出 9.2.1 file协议及其外部表...9.1.1 Greenplum中的角色权限 Greenplum采用基于角色的访问控制机制。通过角色机制,简化了用户和权限的关联性。...例如,若不想区分空值空串,就可以指定空串表示NULL。使用Greenplum导出工具时,任何声明代表NULL的字符串相匹配的数据项都被认为是空值。 4....Greenplum选择每个查询相匹配的查询计划,查询计划定义了Greenplum在并行环境中如何运行查询。...9.6 推荐的监控维护任务 本节给出Greenplum为确保数据库集群的高可用和高性能而建议的监控维护任务。

3.4K32

Greenplum链接kafka导入导出数据

15 Greenplum 外接工具 1 15.1 安装kafka 1 15.1.1 安装kafka 1 15.1.2 准备kafka的环境 1 15.2 greenplum外表加载kafka数据 2 15.2.1...15.2.4 使用gpkafka命令插入数据 4 15.2.5 查看数据库保存的偏移量 5 15.2.6 测试复杂数据量的性能 5 15.2.6.1 测试数据 5 152.6.2 查看数据库数据 7 15.3 greenplum...kafka 7 15.3.1 在集群中安装kafka客户端 7 15.3.2 创建写入kafka的外部可写表 7 15.3.3 写入数据到kafka 7 15.3.4 查看kafka 集群中的数据 8 15 Greenplum...外表加载kafka数据 Kafak作为数据流是比较常用的,接下来就用greenplum对接一下kafka,参考官方资料: https://gpdb.docs.pivotal.io/5180/greenplum-kafka...37:58.456 gpkafkaload:gpadmin:gpdev152:164064-[INFO]:-Start batch 2 ***************** 在以上日志中可以看出列出了外表内表的映射字段

1.4K10

Greenplum 简单性能测试分析

二.目的 1.比较在同等资源条件下具有分布式属性的Greenplum单机版MySQL在进行TPC-H类测试的性能区别。 2.分析两种DB造成性能区别的原因。...三.测试环境配置信息 测试环境:腾讯云 测试对象:Greenplum、MySQL,两者的配置信息统计如下: [image.png] 指标 参数 文本1 文本2 操作系统 CentOS 6.7 64位...MySQL在执行该类SQL的性能差异原因。...[image.png] 图5 Q17语句 Q3不同的是Q17涉及到了子查询,依旧,我们在MySQL和Greenplum上explain下sql,得到的结果如图6、图7所示。...如果使用临时表lineitem表直接hash join,会产生50万左右的数据量,但Greenplum并没有这么做,而是利用part表来进行join,因为part表经过where过滤后数据量非常小,和

4.6K120

Hadoop | 海量数据Hadoop初识

HDFS HDFS(Hadoop Distributed File System,Hadoop分布式文件系统),它是一个高度容错性的系统,适合部署在廉价的机器上。...MapReduce的关键元素: Client:切分文件,访问HDFS,NameNode(JobTracker)交互获取文件位置,DataNode(TaskTracker)交互读写数据 JobTracker...:仅一个的master节点,分解并下派任务给TaskTracker,并监控 TaskTracker:常为多个,允许map任务和reduce任务,JobTracker交互、汇报任务状态 总结 Hadoop...大量的小文件 频繁修改文件(基本就是写1次) 最后 要知道,Hadoop的使用范围远小于SQL或Python之类的脚本语言,所以不要盲目使用Hadoop,看完这篇文章,要知道Hadoop是否适用于你的项目...另外,对于没有项目需求的童鞋们,小媛在面试时被问到了大量的大数据题目,主要都与MapReduce有关,有面试相关需求的童鞋记得重点关注MapReduce原理应用鸥!

79920

Greenplum常见问题的分析处理

之间数据同(file replication)的端口,这个端口有一定几率而被随机端口占用,导致primarymirror之间无法建立数据同步关系,结果就是启动后又mirror实例down掉了。...- primarymirror之间断链(如:gp_segment_connect_timeout超时,mirror空间满等),primary实例会向FTS进程汇报,FTS日志中会显示相关的信息。...- 常见集中原因: -- 因为mirror所在的服务器资源消耗过高,Workload过高,甚至服务器hang住无响应,导致primarymirror之间的通讯大量超时。...总和不要超过gp_vmem_protect_limit -- 为了提升效率减少workfile的输出,可调大statement_mem但不能滥用,以避免造成浪费 -- 内存配置计算指引:https://greenplum.org...打包core文件的工具 - packcore - gpmt 4)、SQL问题重现工具minirepro - 收集问题SQL设计表的元数据以及统计信息,方便在其他环境上分析和重现问题 - 参考社区文章<Greenplum

3.6K70

GreenPlum 简单性能测试分析(续)

之前对 GreenPlum Mysql 进行了 TPC-H 类的对比测试,发现同等资源配比条件下,GreenPlum 的性能远好于 Mysql ,有部分原因是得益于 GreenPlum 本身采用了更高效的算法...由于 GreenPlum 是由 PostgreSQL 演变而来,完全采用了 PostgreSQL 的优化算法,这次,我们将 GreenPlum PostgreSQL 进行对比测试,在同等资源配比条件下...一.目的 比较在同等资源条件下具有分布式属性的 GreenPlum PostgreSQ L在进行 TPC-H 类测试的性能区别。 分析和总结两种 DB 造成性能区别的原因。...二.测试环境配置信息 测试环境:腾讯云 测试对象:GreenPlum、PostgreSQL,两者的配置信息统计如下: 表1 GreenPlum集群服务器 Master Host Segment Host...Q7的结果 PostgreSQL不同的是,GreenPlum的耗时多了数据重分布部分。

4.7K60

Greenplum常见问题的分析处理

2、停止Master实例 3、启动Segment实例(开始打开),primary 和mirror的进程都启动,并且启动Primarymirror之间的同步进程,如果停库之间实例状态为down,启动时会忽略...之间数据同(file replication)的端口,这个端口有一定几率而被随机端口占用,导致primarymirror之间无法建立数据同步关系,结果就是启动后又mirror实例down掉了。...- primarymirror之间断链(如:gp_segment_connect_timeout超时,mirror空间满等),primary实例会向FTS进程汇报,FTS日志中会显示相关的信息。...- 常见集中原因: -- 因为mirror所在的服务器资源消耗过高,Workload过高,甚至服务器hang住无响应,导致primarymirror之间的通讯大量超时。...gp_vmem_protect_limit -- 为了提升效率减少workfile的输出,可调大statement_mem但不能滥用,以避免造成浪费 -- 内存配置计算指引:https://greenplum.org

2.7K30
领券