Yum安装CDH5.5 Hive、Impala的过程详解
CDH是Cloudera公司提供的大数据解决方案,Hive与Impala是CDH的两个核心组件,可以对大数据进行分析和处理。本文将详细讲解使用yum命令在CentOS系统上安装CDH5.5 Hive、Impala的过程。
系统要求
- CentOS 7.x
- root权限
安装步骤
步骤一:导入Cloudera GPG密钥
在终端中执行以下命令,导入Cloudera GPG密钥:
rpm --import https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/RPM-GPG-KEY-cloudera
步骤二:创建Cloudera.repo文件
在终端中执行以下命令,创建Cloudera.repo文件:
vim /etc/yum.repos.d/Cloudera.repo
将以下内容写入Cloudera.repo文件中:
[cloudera-cdh5]
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/5/
gpgkey=https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/RPM-GPG-KEY-cloudera
gpgcheck=1
保存并退出。
步骤三:更新yum库并安装Hive
在终端中执行以下命令,更新yum库并安装Hive:
yum update
yum install hive
步骤四:更新yum库并安装Impala
在终端中执行以下命令,更新yum库并安装Impala:
yum update
yum install impala impala-server impala-shell
示例说明
示例一:使用Hive创建表
在终端中执行以下命令,启动Hive:
hive
在Hive交互界面中,使用以下命令创建一个表:
CREATE TABLE employee(emp_id int, name string, age int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE;
退出Hive交互界面:
quit;
示例二:使用Impala查询表
在终端中执行以下命令,启动Impala shell:
impala-shell
在Impala shell中,使用以下命令查询Hive创建的表:
USE default;
SELECT * FROM employee;
退出Impala shell:
quit;
结论
通过yum命令可以快速安装CDH5.5 Hive、Impala,大大降低了安装和配置的难度,方便了大数据的使用和开发。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:yum安装CDH5.5 hive、impala的过程详解 - Python技术站