手把手教你在腾讯云上搭建hive3.1.2的方法
前言
Apache Hive是基于Hadoop的一个数据仓库工具,能够将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以大大简化数据查询/分析的流程。随着Big Data时代的到来,越来越多的企业开始使用Hive来扩展和加速数据查询和分析的工作。本文将介绍手把手在腾讯云上搭建Hive3.1.2的方法。
系统环境和安装要求
硬件要求
跟运行Hadoop的硬件要求差不多。主要是硬盘和内存大小的。可以参考Hadoop的运行要求。
软件要求
- Hadoop 2.x或者3.x
- JDK 8.x或者以上版本
搭建步骤
第一步:安装Hadoop
Hadoop的安装和配置请自行百度
第二步:安装JDK
在腾讯云的机器上安装JDK
sudo apt-get update && \
sudo apt-get install -y openjdk-8-jdk && \
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 && \
export PATH=$JAVA_HOME/bin:$PATH && \
echo 'export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64' >> ~/.bashrc && \
echo 'export PATH=$JAVA_HOME/bin:$PATH' >> ~/.bashrc && \
source ~/.bashrc
第三步:下载Hive
下载Hive的安装包
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz
第四步:解压Hive
解压Hive的安装包到指定目录
sudo tar zxvf apache-hive-3.1.2-bin.tar.gz -C /usr/local
第五步:配置环境变量
编辑~/.bashrc文件,添加以下内容:
export HIVE_HOME=/usr/local/apache-hive-3.1.2-bin
export PATH=$HIVE_HOME/bin:$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
第六步:启动Hive
启动Hive CLI
$HIVE_HOME/bin/hive
示例一:创建表和插入数据
CREATE TABLE IF NOT EXISTS employee (
eid int,
name String,
salary String,
destination String
)
COMMENT 'Employee details'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
LOAD DATA LOCAL INPATH '/home/hadoop/employee.txt' INTO TABLE employee;
示例二:执行SQL查询
SELECT * FROM employee WHERE salary > 1000;
结语
至此,Hive的搭建已经完成,你可以在腾讯云上愉快的使用Hive来进行大数据的分析和查询了。如果在安装过程中遇到任何问题,可以参考官方文档或者在社区进行提问。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:手把手教你在腾讯云上搭建hive3.1.2的方法 - Python技术站