yum安装CDH5.5 hive、impala的过程详解

Yum安装CDH5.5 Hive、Impala的过程详解

CDH是Cloudera公司提供的大数据解决方案,Hive与Impala是CDH的两个核心组件,可以对大数据进行分析和处理。本文将详细讲解使用yum命令在CentOS系统上安装CDH5.5 Hive、Impala的过程。

系统要求

  • CentOS 7.x
  • root权限

安装步骤

步骤一:导入Cloudera GPG密钥

在终端中执行以下命令,导入Cloudera GPG密钥:

rpm --import https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/RPM-GPG-KEY-cloudera

步骤二:创建Cloudera.repo文件

在终端中执行以下命令,创建Cloudera.repo文件:

vim /etc/yum.repos.d/Cloudera.repo

将以下内容写入Cloudera.repo文件中:

[cloudera-cdh5]
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/5/
gpgkey=https://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/RPM-GPG-KEY-cloudera
gpgcheck=1

保存并退出。

步骤三:更新yum库并安装Hive

在终端中执行以下命令,更新yum库并安装Hive:

yum update
yum install hive

步骤四:更新yum库并安装Impala

在终端中执行以下命令,更新yum库并安装Impala:

yum update
yum install impala impala-server impala-shell

示例说明

示例一:使用Hive创建表

在终端中执行以下命令,启动Hive:

hive

在Hive交互界面中,使用以下命令创建一个表:

CREATE TABLE employee(emp_id int, name string, age int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE;

退出Hive交互界面:

quit;

示例二:使用Impala查询表

在终端中执行以下命令,启动Impala shell:

impala-shell

在Impala shell中,使用以下命令查询Hive创建的表:

USE default;
SELECT * FROM employee;

退出Impala shell:

quit;

结论

通过yum命令可以快速安装CDH5.5 Hive、Impala,大大降低了安装和配置的难度,方便了大数据的使用和开发。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:yum安装CDH5.5 hive、impala的过程详解 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • rsync中文手册之使用rsync实现网站镜像和备份linux第2/3页

    使用rsync实现网站镜像和备份是一项重要的工作,以下是实现此目标的完整攻略: 1. 安装rsync 在使用rsync之前,需要先安装rsync。使用以下命令安装: sudo apt-get install rsync 2. 创建目标文件夹 首先,需要在本地计算机上创建一个目标文件夹,以存储将要通过rsync复制的文件夹的内容。使用以下命令创建一个名为“my…

    Linux 2023年5月24日
    00
  • 浅谈Golang中创建一个简单的服务器的方法

    下面是关于创建Golang服务器的详细攻略: 创建一个简单的Golang服务器 步骤一:导入需要的包 在创建服务器之前,我们需要先导入net/http包。这个包提供了许多有用的函数和方法,使我们可以轻松地创建Web服务器、处理HTTP请求和发送HTTP响应。 import "net/http" 步骤二:编写处理函数 接下来,我们需要编写一…

    Linux 2023年5月14日
    00
  • Linux自动化工具之crontab (windows需要手动配置相关服务,具体百度)

    //有的shell解释器是/bin/tcsh而不是传统的/bin/bash.而且两者语法有些差异,注意避免.比如设置变量tcsh是set 变量 =`****`   1.crontab是什么,是linux里面自带的一个定时任务,可以让我们在某个时间段进行一些操作,无需人工干预。例如:定时发送邮件、自动采集、队列处理、数据备份、定时开灯等等,这只是一部分的举例,…

    Linux 2023年4月11日
    00
  • Linux下python2和python3共存

    https://www.python.org/ftp/python/3.4.4/Python-3.4.4.tar.xz 下载命令: wget https://www.python.org/ftp/python/3.4.4/Python-3.4.4.tar.xz 解压: tar xvf Python-3.4.4.tar.xz 进入目录: cd Python-3…

    Linux 2023年4月12日
    00
  • 自动ftp脚本,aix/linux 和 windows

     首先windows @echo off REM 基本配置 REM 远程信息 set remote_ip=%1 set remote_user=%2 set remote_passwd=%3 set remote_mode=%4 set remote_file=%5 set ftptxt=.\ftptxt.ftp set local_path=d:\ftp …

    Linux 2023年4月11日
    00
  • Linux下从零开始安装配置Nginx服务器+PHP开发环境

    感谢您的提问,以下是“Linux下从零开始安装配置Nginx服务器+PHP开发环境”的完整攻略步骤及示例说明。 1. 安装Nginx Nginx是一款高性能的HTTP服务器,对于需要处理大量并发请求的Web应用和负载平衡来说具有较好的性能。在Linux系统中,安装Nginx可以通过以下命令实现: sudo apt-get update sudo apt-ge…

    Linux 2023年5月14日
    00
  • Linux的命令行下抓包工具tcpdump的使用图文介绍

    根据您的需求,我会为您提供一个完整的“Linux的命令行下抓包工具tcpdump的使用图文介绍”的攻略。 一、什么是tcpdump tcpdump是Unix和Linux操作系统下的一款命令行下的网络抓包工具。它可以监听系统上的网络设备,捕获经网络设备传输的数据包,并将这些数据包的内容输出到终端上。 使用tcpdump可以帮助网络管理员或用于网络故障排除等工作…

    Linux 2023年5月14日
    00
  • Linux操作系统原理笔记

        在Linux操作系统内核内部,进程是通过一个链表,而且是一个双向链表来管理的。 进程描述符:每一个进程都有其描述符,每一个描述符彼此之间都有关联性的。   双向链表:   一个进程内部可能包含多个线程。     上下文切换(Context swtch)     假如说进程A从当前CPU上被拿走,切换成进程B,进程A有自己的描述符(task_struc…

    Linux 2023年4月11日
    00
合作推广
合作推广
分享本页
返回顶部