Hive创建表
Hive是基于Hadoop的一种数据仓库解决方案,它提供了类SQL的接口,可以将结构化的数据映射为一张数据库表,并通过HiveQL查询语言进行数据的分析和查询。下面我们将介绍如何在Hive中创建表。
创建表语法
我们可以使用CREATE TABLE
语句在Hive中创建表格,其语法如下:
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name
(column_name data_type [COMMENT 'column_comment'],...)
[COMMENT 'table_comment']
ROW FORMAT row_format
[STORED AS file_format]
LOCATION hdfs_path;
其中,EXTERNAL
关键字表示创建的表是外部表。如果是外部表,则表数据不会被Hive管理,用户可以自己维护表数据;否则,表数据将由Hive管理。IF NOT EXISTS
关键字表示如果表已存在,则不执行任何操作。table_name
表示要创建的表名,column_name
表示列名,data_type
表示列的数据类型,COMMENT
表示列或表的注释,table_comment
表示表备注。ROW FORMAT
表示每行数据的格式,file_format
表示存储文件的格式,LOCATION
表示表数据在HDFS上的存储路径。
示例
下面是一个创建表的示例,我们创建一个students
表,该表包含学生的基本信息,包括学生的ID(整型)、姓名(字符串类型)、性别(字符串类型)、出生日期(日期类型)等。
CREATE TABLE students(
id INT COMMENT '学生ID',
name STRING COMMENT '学生姓名',
gender STRING COMMENT '学生性别',
birthdate DATE COMMENT '学生出生日期'
)
COMMENT '学生信息表'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
LOCATION '/user/hive/warehouse/students';
在上面的示例中,我们使用CREATE TABLE
语句创建了一个名为students
的表,该表包含4个字段:id
、name
、gender
和birthdate
。这4个字段的数据类型分别为整型、字符串型、字符串型和日期型。表的注释为“学生信息表”。表中使用逗号分割符分割不同的字段,使用文本文件保存。表数据存储在/user/hive/warehouse/students
目录下。
总结
通过以上介绍,我们可以看出,在Hive中创建表格是基于类SQL语法的,我们只需要按照语法要求填写表格的详细信息即可创建表格。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:hive创建表 - Python技术站