yum安装CDH5.5 hive、impala的过程详解

Yum安装CDH5.5 Hive、Impala的过程详解

CDH是Cloudera公司提供的大数据解决方案,Hive与Impala是CDH的两个核心组件,可以对大数据进行分析和处理。本文将详细讲解使用yum命令在CentOS系统上安装CDH5.5 Hive、Impala的过程。

系统要求

  • CentOS 7.x
  • root权限

安装步骤

步骤一:导入Cloudera GPG密钥

在终端中执行以下命令,导入Cloudera GPG密钥:

rpm --import https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/RPM-GPG-KEY-cloudera

步骤二:创建Cloudera.repo文件

在终端中执行以下命令,创建Cloudera.repo文件:

vim /etc/yum.repos.d/Cloudera.repo

将以下内容写入Cloudera.repo文件中:

[cloudera-cdh5]
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/5/
gpgkey=https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/RPM-GPG-KEY-cloudera
gpgcheck=1

保存并退出。

步骤三:更新yum库并安装Hive

在终端中执行以下命令,更新yum库并安装Hive:

yum update
yum install hive

步骤四:更新yum库并安装Impala

在终端中执行以下命令,更新yum库并安装Impala:

yum update
yum install impala impala-server impala-shell

示例说明

示例一:使用Hive创建表

在终端中执行以下命令,启动Hive:

hive

在Hive交互界面中,使用以下命令创建一个表:

CREATE TABLE employee(emp_id int, name string, age int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE;

退出Hive交互界面:

quit;

示例二:使用Impala查询表

在终端中执行以下命令,启动Impala shell:

impala-shell

在Impala shell中,使用以下命令查询Hive创建的表:

USE default;
SELECT * FROM employee;

退出Impala shell:

quit;

结论

通过yum命令可以快速安装CDH5.5 Hive、Impala,大大降低了安装和配置的难度,方便了大数据的使用和开发。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:yum安装CDH5.5 hive、impala的过程详解 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • Linux lpr命令

    Linux lpr 命令的作用与使用方法 Linux lpr 命令用于将文件发送到打印机进行打印。它可以帮助用户在 Linux 系统中打印文档、图片等文件。 Linux lpr 命令使用方法 lpr 命令的基本语法如下: lpr [选项] 文件名 其中,选项是可选的。文件名是要打印文件名。下面是一些常用的选项: -P printer:指定打印机名称。 -# …

    Linux 2023年5月10日
    00
  • 在Centos7中配置NIS的详细过程

    在Centos7中配置NIS服务需要进行以下步骤: 1. 安装NIS服务 首先需要在Centos7系统中安装NIS服务: yum install ypbind ypserv rpcbind -y 2. 配置NIS服务 接下来需要进行NIS服务的配置: 2.1 修改配置文件 打开/etc/ypserv.conf文件,将以下代码添加到文件末尾: ypserv: …

    Linux 2023年5月14日
    00
  • 虚拟机安装linux系统无法上网的解决方法

    下面我将详细讲解一下“虚拟机安装linux系统无法上网的解决方法”的完整攻略。 背景 在虚拟机软件中安装 Linux 系统时,常常会遇到无法上网的情况。这是由于虚拟机默认无法正常获取网络连接导致的,需要我们手动配置才能上网。 解决方法 1. 修改虚拟机网络设置 进入虚拟机软件的虚拟网络编辑器,选择对应的虚拟机网络接口,启用 DHCP 服务器,并勾选 NAT …

    Linux 2023年5月24日
    00
  • Linux上的文件搜索命令实例详解

    让我们来详细讲解一下“Linux上的文件搜索命令实例详解”的攻略。 一、前言 在 Linux 系统中,有很多种方法可以搜索文件,包括使用命令行工具和图形化搜索工具。但是命令行工具不仅更加自由灵活,而且更易于扩展。因此,在本文中,我们将主要讨论在 Linux 系统中使用命令行工具来搜索文件的方法。 二、find 命令 find 命令是 Linux 系统中最常用…

    Linux 2023年5月14日
    00
  • linux Centos7断网下安装应用程序详解

    Linux CentOS7 断网下安装应用程序详解 在一些特殊情况下,我们在Linux CentOS7系统中需要安装应用程序,但是由于某些原因,无法连接网络,这时我们需要手动下载离线安装包并进行安装。本文将详细介绍如何在Linux CentOS7系统下进行断网安装应用程序的步骤。 步骤一:下载离线安装包 首先我们需要在可以连接网络的系统上下载对应的离线安装包…

    Linux 2023年5月14日
    00
  • linux定时任务执行php任务

    首先用命令检查服务是否在运行 systemctl status crond.service 如果服务器上没有装有crontab ,则可以执行 yum install vixie-cron yum install crontabs 常用指令 systemctl restart crond.service #启动服务 systemctl reload crond…

    Linux 2023年4月13日
    00
  • VMware虚拟机下linux上网的几种方式示例

    VMware虚拟机下 Linux 上网的几种方式示例 在 VMware 虚拟机中使用 Linux 操作系统时,我们需要配置虚拟机网络以使其能够连接互联网。本文将介绍几种在 VMware 虚拟机中配置 Linux 上网的方式,以便于用户进行选择。 1. Bridged模式 Bridged 模式就是让虚拟机的网络接口和宿主机的网络接口在同一个网络中。在这种情况下…

    Linux 2023年5月24日
    00
  • Linux中IIC总线驱动分析

    虽然I2C硬件体系结构比较简单,但是I2C体系结构在Linux中的实现却相当复杂.通过阐述Linux系统中I2C总线体系结构,在此基础上完成嵌入式Linux系统中I2C总线驱动的开发. 1. 嵌入式Linux中I2C驱动程序分析 I2C(Inter2IntegratedCircuit)总线是一种由PHILIPS公司开发的两线式串行总线,用于连接微控制器及其外…

    Linux 2023年4月11日
    00
合作推广
合作推广
分享本页
返回顶部