CSV和EXCEL:
excel文件和 csv 文件的区别在于前者有分页(sheet),而且用文档编辑器打开的话会发现 excel 一行之间的单元格是以英文逗号 "," 结尾,而 csv 是以制表 “\t” 结尾。注意一点的是,并不是所有得到文件其内容都很规范,比如在一个单元格里面有一大段句子含有英文逗号,就会导致生成 DataFrame 出现问题。所以在导入 Python 中进行处理的时候有必要在 excel 中预查看一下。
import pandas as pd
def xlsx_to_csv_pd(): #读取excel实例
data_xls = pd.read_excel("test.xlsx",index_col=0 )
data_xls.to_csv("test.csv",encoding="utf-8")
参数举例:
def read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0,
index_col=None, names=None, usecols=None, parse_dates=False,
date_parser=None, na_values=None, thousands=None,
convert_float=True, converters=None, dtype=None,
true_values=None, false_values=None, engine=None,
squeeze=False, **kwds):
部分参数说明:
io:读取的文档地质
sheet_name:读取的指定sheet页
header:设置读取的excel第几行是作为列名称,默认值为 None
names:设置每列的名称
index_col:设置第几列是作为行名称,,默认值为 None
usecols:执行需要读取的数据列
参考文章:
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:【Python】Pandas读取 excel 机器学习之数据预处理,Pandas读取excel数据 - Python技术站