CSV和EXCEL:

excel文件和 csv 文件的区别在于前者有分页(sheet),而且用文档编辑器打开的话会发现 excel 一行之间的单元格是以英文逗号 "," 结尾,而 csv 是以制表 “\t” 结尾。注意一点的是,并不是所有得到文件其内容都很规范,比如在一个单元格里面有一大段句子含有英文逗号,就会导致生成 DataFrame 出现问题。所以在导入 Python 中进行处理的时候有必要在 excel 中预查看一下。

import pandas as pd
def xlsx_to_csv_pd(): #读取excel实例 data_xls = pd.read_excel("test.xlsx",index_col=0 ) data_xls.to_csv("test.csv",encoding="utf-8")

 参数举例:

def read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0,
               index_col=None, names=None, usecols=None, parse_dates=False,
               date_parser=None, na_values=None, thousands=None,
               convert_float=True, converters=None, dtype=None,
               true_values=None, false_values=None, engine=None,
               squeeze=False, **kwds):

 部分参数说明:

io:读取的文档地质

sheet_name:读取的指定sheet页

header:设置读取的excel第几行是作为列名称,默认值为 None

names:设置每列的名称

index_col:设置第几列是作为行名称,,默认值为 None

usecols:执行需要读取的数据列

 

参考文章:

机器学习之数据预处理,Pandas读取excel数据