当我们需要读取存储在本地计算机中的文本文件(如CSV、TSV、TXT等)时,Pandas是一个非常强大的Python库。下面是使用Pandas读取文本文件的完整攻略:
1. 导入Pandas库
首先,我们需要导入Pandas库。可以使用以下代码导入Pandas库:
import pandas as pd
2. 读取文本文件
使用Pandas读取文本文件非常简单。可以使用以下代码读取CSV、TSV或TXT等文本文件:
df = pd.read_csv('filename.csv')
使用read_csv()函数,在括号内指定文件路径及文件名,即可读取文本文件。同样的,读取TSV文件时,代码为:
df = pd.read_csv('filename.tsv', delimiter = '\t')
其中,delimiter参数指定分隔符为制表符(\t
)。
如果文件以TXT格式保存并且分隔符不是逗号或制表符,则可以使用read_table()函数读取:
df = pd.read_table('filename.txt', delimiter = ';')
在括号中指定文件路径和文件名,delimiter参数指定分隔符为分号(;
)。
3. 文件编码处理
在读取文本文件时,我们还需要考虑文件编码的问题,否则可能会抛出UnicodeDecodeError异常。可以通过以下方式解决它:
df = pd.read_csv('filename.csv', encoding='utf-8')
读取UTF-8编码的CSV文件时,使用encoding参数指定编码方式为utf-8即可。类似地,可以使用其他编码方式,如'gbk'。
4. 预览数据
在读取文件后,我们需要预览数据,以确保读取的文件正确无误。可以使用以下代码查看前n个数据行:
df.head(n)
其中,n参数表示需要查看的行数,如果不指定默认为5。
5. 完整代码示例
以下是一个完整的示例代码,演示如何读取CSV文件并预览前3行数据:
import pandas as pd
df = pd.read_csv('data.csv', encoding = 'utf-8')
print(df.head(3))
通过以上步骤,我们就可以很方便地使用Pandas读取文本文件了。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何用Pandas读取文本文件 - Python技术站