当我们想要在Python中读取CSV文件时,就可以使用Pandas库的read_csv()
函数。这个函数极为灵活,我们可以用它来读取各种不同格式的CSV文件,甚至可以修改函数中的参数,以满足我们的不同需求。
下面是read_csv()
函数的深入讲解:
1. read_csv()
函数的语法
我们先来看一下read_csv()
函数的语法:
pandas.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, dtype=None, skiprows=None, skipfooter=None, ....)
2. read_csv()
函数的参数说明
下面我们来解释一下每个参数的作用:
-
filepath_or_buffer
: 文件路径或读取文件的url地址,也可以是数据文件的句柄。支持hdfs、s3等分布式存储。 -
sep
: 定义分隔符,默认为,
。 -
delimiter
: 如果文件的分隔符是非标准符号时,可以定义该分隔符来读取。 -
header
: 用于指定列名,默认infer
,即自动识别列名,如果没有列名,则设为None
。 -
names
: 用于指定列名,如果header=None
,则names
参数必须明确指定。 -
index_col
: 用于指定行索引。 -
usecols
: 指定想要读取的列。 -
squeeze
: 如果数据仅包含一列,则返回Series对象而不是DataFrame,默认为False
。 -
dtype
: 指定每个列的数据类型。 -
skiprows
: 跳过指定行的数据不读取。 -
skipfooter
: 跳过文件末尾的指定行数据不读取。
还有一些其他的参数没有列出来,如果需要更多相关参数的信息,可以参考官方文档。
3. read_csv()
函数的示例说明
下面我们来看两个代码示例,来看看如何使用read_csv()
函数来读取不同格式的CSV文件。
示例1:读取带有中文字符的CSV文件
假设我们有一个名为example.csv
文件,其中包含以下几列数据:
id,姓名,年龄,班级
1,李华,18,B1
2,张三,22,B2
3,李四,19,A4
4,王五,20,B2
此时,我们尝试使用read_csv()
函数来读取该文件中的数据,并将姓名列和年龄列、班级列分别存储在两个不同的DataFrame中:
import pandas as pd
# 读取example.csv文件中的数据
df = pd.read_csv('example.csv')
# 分别存储姓名、年龄和班级数据
name_age = df[['姓名', '年龄']]
grade = df[['班级']]
示例2:读取CSV文件中的部分数据
假设我们有一个名为sample.csv
文件,其中包含以下几列数据:
日期,股票名称,开盘价,收盘价,最高价,最低价,成交量
2021-01-04,华泰证券,16.57,17.36,17.50,16.26,4177939224
2021-01-05,华泰证券,17.33,16.98,17.55,16.87,4802979321
2021-01-06,华泰证券,16.99,16.26,17.06,16.17,3728964963
2021-01-07,华泰证券,16.20,16.26,16.38,16.09,2209495126
2021-01-08,华泰证券,16.45,16.81,16.88,16.34,2653921622
此时,我们想要读取该文件中的前三行数据,可以使用read_csv()
函数中的nrows
参数来指定要读取的行数:
import pandas as pd
# 读取sample.csv文件中的前三行数据
df = pd.read_csv('sample.csv', nrows=3)
# 输出读取到的数据
print(df)
输出:
日期 股票名称 开盘价 收盘价 最高价 最低价 成交量
0 2021-01-04 华泰证券 16.57 17.36 17.50 16.26 4177939224
1 2021-01-05 华泰证券 17.33 16.98 17.55 16.87 4802979321
2 2021-01-06 华泰证券 16.99 16.26 17.06 16.17 3728964963
以上就是read_csv()
函数的深入讲解,希望能对大家有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python中pandas.read_csv()函数的深入讲解 - Python技术站