首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

HBase客户端API-操作

上一篇博客说了使用 HBase 的客户端 API 来操作管理 HBase 中的,今天我们看看怎样通过 API 来操作中的数据。...介绍 在 HBase 中对数据中的数据的操做我们一般是通过 Table, Put, Get, Delete,Scan,Result等几个类来实现。...Table 是对象,对应数据库中的一张,我们可以在上执行添加,修改,删除和查询操作。 Put 主要是用了对数据中的记录执行写入/更新操作。 Get 主要是用了对数据中的记录执行查询操作。...Delete 主要是用了对数据中的记录执行查询操作。 Scan 用来在数据中执行查询操作。 Result 用来保存查询的结果记录。...数据填充完后,在上执行put操作。 最后,不要忘了关闭

2K70
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Hbase(二)Hbase常用操作

    Hbase(二):Hbase常用操作 常用shell命令 hbase shell命令 描述 alter 修改列族(column family)模式 count 统计中行的数量 create 创建 describe...使有效 exists 测试表是否存在 exit 退出hbase shell get 获取行或单元(cell)的值 incr 增加指定,行或列的值 list 列出hbase中存在的所有 put 向指向的表单元添加值...tools 列出hbase所支持的工具 scan 通过对表的扫描来获取对用的值 status 返回hbase集群的状态信息 shutdown 关闭hbase集群(与exit不同) truncate 重新创建指定...version 返回hbase版本信息 操作 创建 不指定版本信息 create ‘名’,‘列族’,’…’,’… 指定版本信息为3 create ‘名’,{NAME=>‘列族’,VERSIONS...让失效 disable ‘名’ 删除 drop ‘名’

    3.1K10

    HBase结构

    HBase 是一个NoSQL数据库,用于处理海量数据,可以支持10亿行百万列的大,下面就了解一下数据是如何存放在HBase中的 关系型数据库的结构 为了更好的理解HBase的思路,先回顾一下关系数据库中表的处理方式...HBase的处理方式 HBase结构 建时要指定的是:名、列族 建表语句 create 'user_info', 'base_info', 'ext_info' 意思是新建一个,名称是user_info...: row key base_info ext_info row1 name:a, tel:123 row2 name:b addr:bj HBase中还有一个重要概念:版本,每个字段的值都有版本信息...插入数据的过程可以看出 HBase 存储数据的特点了 和关系数据库一样,也是使用行和列的结构 建时,定义的是名和列族(字段的集合),而不是具体字段 列族中可以包含任意个字段,字段名不需要预定义,每一行中同一列族中的字段也可以不一致...多维结构,关系数据库的是二维的,通过指行、列定位一个数据,HBase中需要通过 行健、列族名、字段名、版本号才能定位到具体数据 插入数据时,一次插入一个字段的数据,不是像关系数据库那样一次插入多个字段

    1.5K130

    HBase数据操作

    # HBase数据操作 put delete 数据查询 get scan 数据统计 # put 语法 put '名','行键','列族:列限定符','单元格值',时间戳 描述 必须指定名、行键...只能插入单个数据 描述:如果指定的单元格已经存在,则put操作为更新数据; 单元格会保存指定VERSIONS=>n的多个版本数据 # delete 语法 delete '名','行键','列族...', 描述:必须指定名、行键和列族,列限定符和时间戳是可选参数; delete最小删除粒度为单元格,且不能跨列族删除 注意 delete操作并不会马上删除数据,只是将对应的数据打上删除标记...' hbase(main):004:0> count ‘student’ 3 row(s) in 0.0440 seconds 在关系型数据库中,有多少条记录就有多少行,中的行数很容易统计。...而在 HBase 里,计算逻辑行需要扫描全的内容,重复的行键是不纳入计数的,且标记为删除的数据也不纳入计数。

    1.8K30

    hbase数据备份策略

    (离线备份) 直接备份HDFS数据,备份前需要disable,在备份完成之前 服务不可用对在线服务类业务不友好 (二)CopyTable(热备) 执行命令前,需要创建,支持时间区间、row区间,改变名称...四,Replication(实时) 通过Hbase的replication机制实现Hbase集群的主从模式实时同步 五,Snapshot(备份实时,恢复需要disable) 个人觉得这里备份里面最经济划算的一个...,可以每天在固定时间点对hbase数据进行快照备份,然后如果出现问题了,可以直接恢复到某个时间点上的数据,适合修复指标计算错误的场景,然后从某个时间点上重新修复。...snapshot create -n test_snapshot -t test (4)查看快照 list_snapshots (5)导出到HDFS hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot...时间短,体积小,恢复快,最终还可以恢复数据到一张新中,不影响原来的

    2.2K40

    再谈|Rowkey设计_HBase设计

    HBase的rowkey设计可以说是使用HBase最为重要的事情,直接影响到HBase的性能,常见的RowKey的设计问题及对应访问为: Hotspotting 的行由行键按字典顺序排序,这样的设计优化了扫描...下面的例子说明了salting能在多个RegionServer间分散负载,同时也说明了它在读操作时候的负面影响。 假设行键的列表如下,按照每个字母对应一个region来分割。...从这个角度上看,salting增加了写操作的吞吐量,却也增大了读操作的开销。 Hashing 可用一个单向的 hash 散列来取代随机指派前缀。...因此,尽管有着连续的数据输入流,Put操作依旧能被分散在中的各个region中 简化行和列 在HBase中,值是作为一个单元(Cell)保存在系统的中的,要定位一个单元,需要行,列名和时间戳。...内[key]的最近的值可以用[key]进行Scan,找到并获取第一个记录。由于HBase行键是排序的,该键排在任何比它老的行键的前面,所以是第一个。

    1.2K21

    HBase学习—高与宽的选择

    utm_content=m_31236 hbase中的宽是指很多列较少行,即列多行少的,一行中的数据量较大,行数少;高是指很多行较少列,即行多列少,一行中的数据量较少,行数大。...据此,在HBase中使用宽、高的优劣总结如下: 查询性能:高更好,因为查询条件都在row key中, 是全局分布式索引的一部分。高一行中的数据较少。...分片能力:高分片粒度更细,各个分片的大小更均衡。因为高一行的数据较少,宽一行的数据较多。HBase按行来分片。 元数据开销:高元数据开销更大。...过大的元数据开销,可能引起HBase集群的不稳定、master更大的负担(这方面后续再好好总结)。 事务能力:宽事务性更好。...而且解压缩可以通过协处理器(coproesssor)在HBase服务器上做,而不是在业务应用的服务器上做,以充分应用HBase集群的CPU能力。

    2.4K50

    Hbase Python 操作准备

    网上的教程是Java操作hbase的实例,我这里使用python,所以之后的文章都是通过thrift API操作hbase 1、安装apache thrift(根据自己系统选择安装) http...验证thrift是否正确安装,输入命令:thrift –help查看帮助信息即可. 2、Thrift API 在网上很多人说在hbase根目录下存在Hbase.thrift文件,但是我没有找到,.../org/apache/hadoop/hbase/thrift/Hbase.thrif 然后把生成的gen-py文件夹下的hbase文件夹,拷贝到python的包路径下(site-packages)...后期修改:发现这个包生成的hbase包已经不能用了,需要使用pip安装hbase-thrift即可。...3、测试 1 开启thrift服务: hbase thrift start 2 编写python程序,操作数据库 # coding=utf-8 from thrift.transport.TSocket

    88320
    领券