python读取excel指定列数据并写入到新的excel方法

yizhihongxing

下面我将详细讲解Python读取Excel指定列数据并写入到新的Excel方法的完整实例教程。

准备工作

在开始之前,我们需要先安装一些必要的包:

  1. pandas:数据分析库,提供快速、灵活且富有表现力的数据结构,目的是为了让数据的清洗、转换、分析工作快速、简单、有表现力。
  2. openpyxl:操作Excel的一个Python库,可以读取和写入Excel文档。

可以使用pip安装:

pip install pandas openpyxl

实现步骤

  1. 导入必要的库:
import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
  1. 读取需要处理的Excel文件:
data = pd.read_excel('data.xlsx')

这里需要注意,我们需要将需要处理的Excel文件保存在代码当前目录下。

  1. data中将需要的列选取出来:

例如我们只需要第一列和第三列,那么可以这样实现:

data_selected = data.iloc[:, [0, 2]]

这里的iloc函数可以根据传入的参数选择具体的行和列,这里的逗号前面表示要选择所有的行,逗号后面的表示要选取第0列和第2列,注意这里的列数要从0开始计算。

  1. 将选取的数据写入新的Excel文件中:
wb = Workbook()
ws = wb.active
for r in dataframe_to_rows(data_selected, index=False, header=True):
    ws.append(r)
wb.save('data_selected.xlsx')

这里我们使用了openpyxl库来创建新的Excel文件和写入数据。首先创建了一个新的工作薄 wb,并且获取到了工作薄的活动工作表 ws,然后通过dataframe_to_rows函数将data_selected转化为一个可写入Excel的迭代器,并添加到新的工作表中。最后通过wb.save将新的Excel文件保存到当前目录下,文件名为 data_selected.xlsx

示例说明

下面通过两个示例说明如何将Excel数据进行处理。

示例一:选取某列数据

假设我们有一个Excel文件,其中包含学生的名字、年龄、成绩信息,我们要从这个Excel中选取所有学生的年龄信息,然后将这些数据保存到一个新的Excel中。

具体实现步骤如下:

  1. 首先打开Excel文件,然后选取需要处理的数据列,例如这里我们只需要选取年龄这一列数据。
  2. 将选取的年龄数据进行处理,然后保存到新的Excel文件中。
import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows

# 读取Excel数据文件
data = pd.read_excel('student_data.xlsx')

# 选取年龄这一列数据
age = data.iloc[:,1]

# 将数据保存到新的Excel文件中
wb = Workbook()
ws = wb.active
for r in dataframe_to_rows(age, index=False, header=True):
    ws.append(r)
wb.save('age.xlsx')

在这个示例中,我们首先读取了 student_data.xlsx 文件,然后使用 iloc 函数来选取年龄列,最后将选取的数据写入到了 age.xlsx 文件中。

示例二:选取多列数据

现在我们要选取多列数据,在这个示例中,我们只需要选取学生的姓名和成绩信息,然后将这些数据保存到一个新的Excel中。

具体实现步骤如下:

  1. 首先打开Excel文件,然后选取需要处理的数据列,例如这里我们需要选取姓名和成绩这两列数据。
  2. 将选取的姓名和成绩数据进行处理,然后保存到新的Excel文件中。
import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows

# 读取Excel数据文件
data = pd.read_excel('student_data.xlsx')

# 选取姓名和成绩这两列数据
data_selected = data.iloc[:, [0, 2]]

# 将数据保存到新的Excel文件中
wb = Workbook()
ws = wb.active
for r in dataframe_to_rows(data_selected, index=False, header=True):
    ws.append(r)
wb.save('name_score.xlsx')

在这个示例中,我们首先读取了 student_data.xlsx 文件,然后使用 iloc 函数来选取姓名和成绩两列,最后将选取的数据写入到了 name_score.xlsx 文件中。

以上就是Python读取Excel指定列数据并写入到新的Excel方法的完整实例教程,希望对你有所帮助!

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python读取excel指定列数据并写入到新的excel方法 - Python技术站

(0)
上一篇 2023年5月13日
下一篇 2023年5月13日

相关文章

  • 详解Python如何查看一个函数的参数

    下面是关于如何查看 Python 函数参数的攻略。具体步骤如下: 步骤1:查看函数文档 首先,我们可以查看函数的文档来了解其参数。 Python 在函数内置文档中提供了对函数参数的详细描述。可以在交互式解释器中使用 help() 函数来查看函数文档,也可以使用 __doc__ 属性来打印函数文档。 同样,我们也可以使用 help() 函数或 __doc__ …

    python 2023年6月5日
    00
  • 基于sklearn实现Bagging算法(python)

    基于sklearn实现Bagging算法(python) Bagging算法是一种集成学习方法,它通过对多个基分类器的测结果进行平均或投票来提高模型的准确性。本文将详细介绍如何Python中的sklearn库实现Bagging算法提供两个示例说明。 Bagging算法简介 Bagging法是一种集成学习方法,它通过对多个基分类器的测结果进行平均或投票来提高模…

    python 2023年5月14日
    00
  • Jupyter导入自定义模块及导入后TypeError错误问题及解决

    在Jupyter中导入自定义模块时,需要注意几个问题,本攻略将会详细讲解这些问题及解决方法。 1. 添加自定义模块目录到sys.path 在导入自定义模块时,我们需要先将自定义模块目录添加到sys.path环境变量中,否则Python解释器会无法找到目标模块。可以通过以下方法来添加自定义模块目录: import sys sys.path.append(‘/p…

    python 2023年5月13日
    00
  • Python Sqlite3以字典形式返回查询结果的实现方法

    下面是详细的攻略: 概述 Python中使用sqlite3库操作SQLite数据库时,查询结果默认以元组的形式返回。但是,在实际开发中,我们有时候需要以字典的形式返回查询结果,以方便代码的编写和维护。本攻略将介绍如何使用PythonSqlite3以字典形式返回查询结果。 实现方法 下面是具体的实现方法: 开启row_factory 在PythonSqlite…

    python 2023年5月13日
    00
  • python自定义线程池控制线程数量的示例

    下面就是Python自定义线程池控制线程数量的完整攻略: 1. 什么是线程池? 线程池是一种线程管理方式,它可以减少线程创建和销毁的开销,提高线程的复用率。线程池在应用程序中大量使用,可有效减轻计算机资源的消耗,提高计算机系统的性能。 2. Python中的线程池 在Python中,我们可以使用标准库中的ThreadPoolExecutor类创建自定义线程池…

    python 2023年5月19日
    00
  • Python实现图像的二进制与base64互转

    图像的二进制与base64互转 在Python中,我们可以使用base64模块来进行二进制与base64之间的转换。具体实现过程如下: 将二进制转为base64编码: import base64 # 二进制图片文件名 image_filename = ‘example.png’ # 读取二进制文件数据 with open(image_filename, ‘r…

    python 2023年5月20日
    00
  • rabbitmq(中间消息代理)在python中的使用详解

    RabbitMQ在Python中的使用详解 RabbitMQ是一个开源的消息代理,它可以在分布式系统中传递消息。在Python中,我们可以使用pika库来连接和操作RabbitMQ。 安装pika库 在使用pika库之前,我们需要先安装它。可以使用pip命令来安装pika库: pip install pika 连接RabbitMQ 在使用pika库连接Rab…

    python 2023年5月15日
    00
  • Python简单检测文本类型的2种方法【基于文件头及cchardet库】

    Python简单检测文本类型的2种方法 当我们需要处理各种文本文件时,首先需要确定文件的类型,以便进行正确的处理。本文将介绍2种简单的方法来检测文本文件类型:基于文件头和cchardet库。 基于文件头检测文本类型 文件头是文件开头的一部分数据,通常用于标识文件的类型。根据文件头的不同,可以判断出文件的类型。下面是一些常见的文本文件的文件头。 文件类型 文件…

    python 2023年5月18日
    00
合作推广
合作推广
分享本页
返回顶部