Python Pandas读取csv/tsv文件（read_csv，read_table）的区别

2023年5月14日下午3:21 • python

当使用Python Pandas库读取文本文件时，可以使用read_csv()和read_table()两种函数。它们的区别在于默认使用的分隔符不同。

read_csv()函数默认使用逗号作为分隔符，可以读取以.csv格式保存的文件。而read_table()函数默认使用制表符作为分隔符，可以读取以.tsv格式保存的文件。

另外，这两个函数还可以通过参数进行分隔符的指定。read_csv()函数可以使用sep参数指定分隔符，read_table()函数可以使用delimiter参数指定分隔符。

下面是两个示例，解释这两个函数的使用规则。

示例一：使用read_csv()函数读取csv文件

在以下示例中，我们使用read_csv()函数读取一个chocolate.csv文件。该文件包含多列，每个列之间用逗号分隔。在read_csv()函数中，我们指定分隔符为逗号(separator=',')

import pandas as pd

data = pd.read_csv('chocolate.csv', sep=',')
print(data.head())

示例二：使用read_table()函数读取tsv文件

在以下示例中，我们使用read_table()函数读取一个movies.tsv文件。该文件包含多列，每个列之间用制表符分隔。在read_table()函数中，我们使用delimiter参数指定分隔符为制表符 ('\t')

import pandas as pd

data = pd.read_table('movies.tsv', delimiter='\t')
print(data.head())

总结：

在使用Python Pandas库读取文本文件时，可以使用read_csv()和read_table()两种函数。这两个函数的主要区别在于默认使用的分隔符不同，read_csv()函数默认使用逗号作为分隔符，可以读取以.csv格式保存的文件。而read_table()函数默认使用制表符作为分隔符，可以读取以.tsv格式保存的文件。另外，这两个函数还可以通过参数进行分隔符的指定。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Python Pandas读取csv/tsv文件（read_csv，read_table）的区别 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Python数据结构与算法中的栈详解(2)

上一篇 2023年5月14日

WMTS中TileMatrix与ScaleDenominator浅析

下一篇 2023年5月14日

检查Pandas数据框架中的NaN

在 Pandas 中，NaN 是指 Not a Number，代表缺失值或无效值。检查 Pandas 数据框架中的 NaN 是数据预处理中重要的一步。下面介绍如何进行完整的 NaN 检查： 1. 查看数据框架中的缺失值可以使用 isnull() 或 isna() 函数查看数据框架中缺失值的情况。这两个函数的作用相同，都返回一个布尔型数组，表示数据框架中缺失…

python-answer 2023年3月27日
000
pandas中关于apply+lambda的应用

下面是关于使用 apply 和 lambda 实现对 Pandas 数据进行一些处理的攻略： 1. apply和lambda的含义 apply 是 Pandas 库中一个非常常用的方法，可以对数据进行一些特定的操作，比如，合并、过滤等等。而 lambda 则是 Python 中一种匿名函数的实现方式，也可看作是一种简短的语法糖，可在不定义完整函数的情况下快速…

python 2023年6月13日
001
pandas重复行删除操作df.drop_duplicates和df.duplicated的区别

Pandas 是一种用于数据操作和分析的强大 Python 库。在数据分析的过程中，经常会遇到需要删除重复数据的情况。而 Pandas 提供了两种方法来删除重复行，即 df.drop_duplicates() 和 df.duplicated()。下面分别进行详细讲解： df.drop_duplicates() df.drop_duplicates(subse…

python 2023年6月13日
000
Python Pandas教程之series 上的转换操作

下面就是关于“Python Pandas教程之series 上的转换操作”的完整攻略： 1. Series 上的转换操作 Pandas 中的 series 对象提供了一些对于 series 上数据转换的功能，包括重命名、重新索引、映射和排序等。下面我们详细讲解一些常用的 series 转换操作。 1.1 重命名重命名操作可以使用 Series 对象的 re…

python 2023年5月14日
000
Pandas描述性统计常用的方法

什么是描述性统计？描述统计学（descriptive statistics）是一门统计学领域的学科，是一种利用某些指标对数据进行概括和描述的一种统计方法。描述性统计通过统计数据的集中趋势、离散程度、分布形态、相关性等特征来描述数据的基本情况和规律，常用于数据分析、数据挖掘、商业分析等领域。常见的描述性统计指标包括均值、中位数、标准差、方差、极差、四分位数…

Pandas 2023年3月4日
000
python实现一次性封装多条sql语句(begin end)

要实现一次性封装多条SQL语句，可以使用Python的MySQLdb模块中的执行多个SQL语句的方法进行实现。下面是一份实现攻略，包括示例说明：准备工作安装MySQLdb模块：使用pip install MySQLdb进行安装。连接MySQL数据库：使用MySQLdb.connect()方法进行连接，在进行SQL操作时需要使用该连接。封装多个SQL语…

python 2023年5月14日
000
Pandas 按时间间隔的滚动平均值

Pandas是一个Python编程语言的数据分析库，其中包含了许多用于数据处理和统计的工具。在Pandas中，我们可以使用rolling()函数来进行滚动（滑动）操作，常见的应用包括按时间间隔的滑动平均值、滑动标准差等。下面是按时间间隔的滚动平均值具体攻略：首先，我们导入Pandas库： import pandas as pd 接下来，我们创建一个示例数…

python-answer 2023年3月27日
000
基于pandas中expand的作用详解

基于pandas中expand的作用详解 1. 什么是expand expand 是 pandas 库中的函数，该函数用于将序列单独拆分成列或行。 2. expand() 的基本使用方法 expand 函数的基本语法如下： Series.str.expand(pat=None) 其中 Series 是需要进行拆分的字符串序列，pat 是用于标识分割位置的正则…

python 2023年5月14日
000

合作推广

合作推广

返回顶部