在我目前的项目中,我的任务是从一组带有E-R图的关系型数据库管理系统表中设计HBase表。1)通过查看HBase表,可以采用什么方法来设计RDBMS表?我正在尝试找出一些关于这方面的指导方针。
2)而且,在浏览HBase资料时,我遇到了面向行和面向列的概念。哪一个好呢?
3)列系列是HBase的必备项吗?如果是,那么在查看rdbms表之后,如何决定列族?我假设,不断变化的列应该是“值”,并且可以是列族的一部分,对吗?
向Shouvanik Big Data Developer致敬
Salting, Hashing, and reversing of key, are recognise as techniques to avoid region Hot-spotting in HBase。然而,当我尝试通过应用盐化和反转关键方法(在两个不同的场景中)来摄取8000个数据记录时,我仍然看到我的所有数据都被摄取到一个区域中。我想知道,当试图避免区域热点时,是否需要在表创建时进行HBase表的预拆分,以便从HBase中的加盐和反转关键字中受益。有没有一种技术可以在不执行manual region splitting in HBase tables的情况下将数据摄取到多个区域
我是hbase的新手。在hbase中创建了30个表。我想查看这些表结构。
我使用下面的命令查看这些表,但只有一个表。希望我需要连接到hbase中的正确数据库来列出表格。
hbase(main):017:0> list
TABLE
test
1 row(s) in 0.0140 seconds
现在,我想让命令知道hbase中存在(已经创建)的数据库是什么
我们在使用Thrift for HBase读取PHP中的数据时遇到了问题。加载数据,创建表都很好。问题是其余的数据操作。除了他们的主网站之外,没有太多关于这方面的文档,因此lost。我在网上看到的所有教程都涉及设置和插入数据,而不是其他数据操作。
在感兴趣的时间,我们正在寻找节俭的替代品,可以帮助PHP和HBase工作+有足够的文档。如果我们找不到替代品,那么我们的计划是使用Cassandra而不是HBase,直到有更好的使用HBase的文档发布为止。但是,任何关于深入教程或替代方案的建议,以使PHP和HBase适用于所有数据操作,都将是非常棒的。
我总共有10个节点。3个节点运行Zookeeper,其余7个节点运行HDFS和Hbase。而且Hbase已经存储了很多数据。我错误地初始化了Zookeeper节点的(I'm using Cloudera, by mistake clicked the Initialize Button)。我想知道这3个Zookeeper节点是否丢失了可能是Hbase mata数据的持久数据。或者说,Hbase将元数据存储在Hmaster中,而Zookeeper只存储一些内存数据。
我有一个HBase查询表,用来存储一些信息。我有一个MapReduce程序,它运行一些Pentaho KTR,并在MapReduce作业中捕获输出。从KTR的输出中的某些字段中,我检索了一些键,并使用它们在HBase中查找一些值。我的场景是:
1. The rowkey is of format <Table Code>-<CRC>, ex- DDVC-XXX
For each output of the KTRs:
2. If no result is found for a particular key(which I get from the Pent