下面是Hadoop环境配置之hive环境配置详解的完整攻略:
Hadoop环境配置之hive环境配置详解
1. 安装Hadoop
首先,我们需要安装Hadoop,这里以Hadoop 3.2.2为例。具体安装过程可以参考Hadoop官网。
2. 安装Hive
安装Hive的过程分为以下几步:
2.1 下载Hive
可以从Hive官网或Hadoop官网下载Hive安装包,这里我选择从Hadoop官网下载。
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz
2.2 解压Hive安装包
tar -zxvf apache-hive-3.1.2-bin.tar.gz
2.3 配置Hive环境变量
编辑/etc/profile文件,在其末尾加入以下内容:
export HIVE_HOME=/path/to/hive
export PATH=$PATH:$HIVE_HOME/bin
2.4 配置Hive
进入Hive的conf目录,编辑hive-site.xml文件:
cd apache-hive-3.1.2-bin/conf
cp hive-env.sh.template hive-env.sh
vi hive-site.xml
在hive-site.xml中加入以下内容:
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.cj.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>hive</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>hive</value>
</property>
<property>
<name>hive.server2.enable.doAs</name>
<value>false</value>
</property>
<property>
<name>hive.cli.print.current.db</name>
<value>true</value>
</property>
<property>
<name>hive.metastore.uris</name>
<value>thrift://localhost:9083</value>
<description>IP地址:</description>
</property>
<property>
<name>hive.metastore.schema.verification</name>
<value>false</value>
</property>
</configuration>
2.5 初始化Hive
在Hive的bin目录下,执行hive命令:
cd apache-hive-3.1.2-bin/bin
./schematool -dbType mysql -initSchema
执行成功后,会在MySQL中创建Hive元数据库,并将Hive的相关表创建好。
2.6 启动Hive
执行以下命令启动Hive:
./hive
这时,会出现Hive的命令行界面,并显示当前数据库。
3. 示例说明
3.1 创建表
下面是在Hive中创建一张表的示例代码:
CREATE TABLE student(id INT, name STRING, age INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';
3.2 查询数据
下面是在Hive中查询数据的示例代码:
SELECT * FROM student;
以上就是Hadoop环境配置之hive环境配置详解的完整攻略,希望对你有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Hadoop环境配置之hive环境配置详解 - Python技术站