python 读取.csv文件数据到数组(矩阵)的实例讲解

当我们需要从CSV文件中读取数据时,通常会用到Python的csv模块来实现。下面是使用Python读取CSV文件数据的详细攻略:

步骤1:导入csv模块

首先,我们需要导入Python的csv模块,该模块提供了读取CSV文件的方法。

import csv

步骤2:打开CSV文件并创建一个读取器

接下来需要打开CSV文件并创建一个读取器对象,以便读取CSV文件中的数据。

在这个过程中,你需要指定文件名和文件的打开模式。并且你还可以设置delimiter参数和quotechar参数。delimiter参数用于指定CSV文件中的分隔符,默认是逗号(,)。quotechar参数则用于指定CSV文件中的引号字符,默认是双引号(")。

with open('file.csv', 'r') as file:
    reader = csv.reader(file, delimiter=',', quotechar='"')

步骤3:读取CSV文件中的数据并存储到数组中

用上述代码段得到读取器reader后,我们可以通过for循环读取CSV文件中的每一行数据,并将其存储到数组中。下面是一个示例:

data = []  # 定义一个数组,用于存储CSV文件中的数据

with open('file.csv', 'r') as file:
    reader = csv.reader(file, delimiter=',', quotechar='"')
    for row in reader:
        data.append(row)

在上面的代码中,我们定义了一个data数组。然后使用for循环遍历读取器对象中的每一行数据,并将其作为一个列表添加到data数组中。

示例1

假设CSV文件的内容如下:

Name, Age, Gender
Tom, 20, Male
Mary, 25, Female
John, 30, Male

我们可以使用下面的代码读取该CSV文件中的数据:

import csv

data = []  # 定义一个数组,用于存储CSV文件中的数据

with open('example.csv', 'r') as file:
    reader = csv.reader(file, delimiter=',', quotechar='"')
    for row in reader:
        data.append(row)

print(data)

输出:
[['Name', ' Age', ' Gender'], 
['Tom', ' 20', ' Male'], 
['Mary', ' 25', ' Female'], 
['John', ' 30', ' Male']]

在输出结果中,我们可以看到一个包含四个列表(即四行数据)的data数组。

由于文件中每个数据都被包裹在双引号中,因此第一行的数据中Age和Gender之前有空格。可以用strip()方法去掉。

import csv

data = []  # 定义一个数组,用于存储CSV文件中的数据

with open('example.csv', 'r') as file:
    reader = csv.reader(file, delimiter=',', quotechar='"')
    for row in reader:
        data.append([item.strip() for item in row])

print(data)

输出:
[['Name', 'Age', 'Gender'], 
['Tom', '20', 'Male'], 
['Mary', '25', 'Female'], 
['John', '30', 'Male']]

示例2

假设现在有一个CSV文件,其中包含多行数据,每行数据都有多个字段,字段之间使用制表符分隔。文件名为“example2.csv”,内容如下:

ID  Age Gender
001 20  Male
002 30  Female
003 25  Male
004 28  Female

我们可以使用下面的代码读取该CSV文件中的数据:

import csv

data = []  # 定义一个数组,用于存储CSV文件中的数据

with open('example2.csv', 'r') as file:
    reader = csv.reader(file, delimiter='\t', quotechar='"')
    for row in reader:
        data.append(row)

print(data)

输出:
[['ID', 'Age', 'Gender'], 
['001', '20', 'Male'], 
['002', '30', 'Female'], 
['003', '25', 'Male'], 
['004', '28', 'Female']]

在这个示例中,我们通过设置delimiter参数为制表符来指定CSV文件中的分隔符,即"\t"。同时,我们还使用了自定义的引号字符,以便读取包含制表符的字段。

上述就是使用Python读取CSV文件数据到数组的攻略及两个示例。还有很多其他的技巧,可以根据实际需求进行调整。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python 读取.csv文件数据到数组(矩阵)的实例讲解 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • 在Pandas中用多个过滤器选择行

    在Pandas中使用多个过滤器选择行相对简单,通常使用“逻辑运算符”将多个过滤器连接起来。常用的逻辑运算符包括“&”和“|”,分别代表“与”和“或”。 以下是一个示例数据集和多个过滤器的使用方法: import pandas as pd # 创建示例数据集 data = {‘name’: [‘Alice’, ‘Bob’, ‘Charlie’, ‘Da…

    python-answer 2023年3月27日
    00
  • pandas 把数据写入txt文件每行固定写入一定数量的值方法

    Pandas 是一个流行的 Python 数据分析工具,在数据分析过程中,我们通常需要将分析结果保存成文件。Pandas 支持将数据保存到多种格式的文件中,包括 CSV、Excel、JSON、SQL、以及纯文本文件等。在本文中,我们将介绍如何使用 Pandas 将数据保存到纯文本文件,并控制每行写入的数据数量。 安装 Pandas 在开始之前,我们需要先安装…

    python 2023年6月13日
    00
  • 如何修复:No module named pandas

    No module named pandas提示表示Python代码在执行时缺少了pandas库。要修复该问题,可以按照以下步骤进行: 1. 确认是否已经安装了pandas库 在终端或命令行中,输入以下命令可以查看是否已安装pandas库: pip show pandas 如果能够成功显示pandas库的信息,那么说明该库已经被安装。否则需要进入第二步。 2…

    python-answer 2023年3月27日
    00
  • python学习之panda数据分析核心支持库

    Python学习之pandas数据分析核心支持库 简介 pandas是Python中一款强大的数据分析库,需要安装后才能使用。pandas基于NumPy库开发,可轻松处理具有浮点值和标签的数据,其中包括导入、清理、处理、合并、截取、过滤、变换和统计等操作。 安装 在Python环境中,使用pip命令进行安装(需要管理员身份): pip install pan…

    python 2023年5月14日
    00
  • pandas 查询函数query的用法说明

    下面是关于pandas查询函数query的用法说明的完整攻略。 1. 简介 Pandas是一种数据处理工具,在数据处理的过程中,经常需要进行数据筛选,查询等操作。Pandas提供了一个强大的查询函数query,可以帮助我们更方便地进行数据查询和筛选操作。 2. query函数的基本语法 query函数的基本语法为: DataFrame.query(expr,…

    python 2023年5月14日
    00
  • 对pandas的行列名更改与数据选择详解

    本文旨在详细讲解pandas包中的行列名更改与数据选择功能。在日常工作中,这些操作是非常基础也非常常用的,掌握好这些技能能够提高数据处理的效率与准确性。 Part 1:行列名更改 1.1 更改列名 在pandas中更改列名的方法是使用df.rename(columns={‘旧列名’:’新列名’})。具体实现方式如下: import pandas as pd …

    python 2023年5月14日
    00
  • 详解Padans Timedelta时间差的使用方法

    在 Pandas 中,时间差指的是两个日期时间之间的差值。Pandas 提供了 Timedelta 类型来表示时间差。Timedelta 可以支持多种时间单位,例如天、小时、分钟、秒等。 Timedelta 对象可以通过减法来获得两个日期时间之间的差值,例如: import pandas as pd # 创建两个 Pandas Series 对象 s1 = …

    Pandas 2023年3月6日
    00
  • pandas.DataFrame.drop_duplicates 用法介绍

    pandas.DataFrame.drop_duplicates用法介绍 介绍 pandas.DataFrame.drop_duplicates()方法返回一个DataFrame,其中包含DataFrame重复行的条目。在数据处理中,通常需要删除重复的行,以保证数据的一致性和准确性。 语法 DataFrame.drop_duplicates(subset=N…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部