HBase入门详解攻略
什么是HBase
Apache HBase是一个分布式、可伸缩、面向列的NoSQL数据库,基于Hadoop HDFS构建,拥有高可用性、高扩展性、高可靠性等优势。它主要面向海量、流式数据的实时读写访问,是一个可以存储海量半结构化数据的分布式数据库。
安装和配置HBase
安装HBase
- 下载并解压HBase压缩包
shell
wget https://mirror.bit.edu.cn/apache/hbase/2.4.5/hbase-2.4.5-bin.tar.gz
tar -zxvf hbase-2.4.5-bin.tar.gz
- 配置HBase环境变量
将HBase目录下/conf
目录中的hbase-env.sh
文件中的JAVA_HOME
设置为本地Java安装路径,例如:
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_301.jdk/Contents/Home
- 启动HBase
shell
cd hbase-2.4.5/bin
./start-hbase.sh
HBase基本命令
HBase基本命令可通过HBase Shell交互界面实现。
进入HBase Shell命令行界面:
hbase shell
常用命令:
- 查看帮助文档:
help
- 查看所有表:
list
- 创建表:
create 'table_name', 'column_family_name'
- 插入数据:
put 'table_name', 'row_key', 'column_family:column_name', 'value'
- 查看数据:
get 'table_name', 'row_key'
- 删除数据:
delete 'table_name', 'row_key', 'column_family:column_name'
- 删除表:
disable 'table_name'
和drop 'table_name'
使用HBase
在HBase中创建表
以创建一个名为my_table
的表为例,该表包含info
、language
和gender
三列族:
create 'my_table', 'info', 'language', 'gender'
向HBase表中插入数据
以my_table
表中插入一条数据为例,数据的row_key
是my_row_key
,包含info:name
、info:age
、language:java
和gender:sex
四个列:
put 'my_table', 'my_row_key', 'info:name', 'John'
put 'my_table', 'my_row_key', 'info:age', '21'
put 'my_table', 'my_row_key', 'language:java', 'proficient'
put 'my_table', 'my_row_key', 'gender:sex', 'male'
从HBase表中读取数据
以从my_table
表中读取一条数据为例,数据的row_key
是my_row_key
:
get 'my_table', 'my_row_key'
输出的结果为:
COLUMN CELL
gender:sex timestamp=1655904568766, value=male
info:age timestamp=1655904568766, value=21
info:name timestamp=1655904568766, value=John
language:java timestamp=1655904568766, value=proficient
4 row(s)
总结
HBase是一个强大的分布式、可伸缩、面向列的NoSQL数据库,具有高可用性、高扩展性、高可靠性等优势。通过本文的安装和配置HBase、使用HBase进行表的创建、数据插入和读取等基本操作可以了解HBase的使用方法和基本命令,为后续深入学习和应用打下坚实的基础。在实际应用中需要根据具体需求设计数据模型、优化读写性能等问题。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Hbase入门详解 - Python技术站