python读取excel指定列数据并写入到新的excel方法

下面我将详细讲解Python读取Excel指定列数据并写入到新的Excel方法的完整实例教程。

准备工作

在开始之前,我们需要先安装一些必要的包:

  1. pandas:数据分析库,提供快速、灵活且富有表现力的数据结构,目的是为了让数据的清洗、转换、分析工作快速、简单、有表现力。
  2. openpyxl:操作Excel的一个Python库,可以读取和写入Excel文档。

可以使用pip安装:

pip install pandas openpyxl

实现步骤

  1. 导入必要的库:
import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
  1. 读取需要处理的Excel文件:
data = pd.read_excel('data.xlsx')

这里需要注意,我们需要将需要处理的Excel文件保存在代码当前目录下。

  1. data中将需要的列选取出来:

例如我们只需要第一列和第三列,那么可以这样实现:

data_selected = data.iloc[:, [0, 2]]

这里的iloc函数可以根据传入的参数选择具体的行和列,这里的逗号前面表示要选择所有的行,逗号后面的表示要选取第0列和第2列,注意这里的列数要从0开始计算。

  1. 将选取的数据写入新的Excel文件中:
wb = Workbook()
ws = wb.active
for r in dataframe_to_rows(data_selected, index=False, header=True):
    ws.append(r)
wb.save('data_selected.xlsx')

这里我们使用了openpyxl库来创建新的Excel文件和写入数据。首先创建了一个新的工作薄 wb,并且获取到了工作薄的活动工作表 ws,然后通过dataframe_to_rows函数将data_selected转化为一个可写入Excel的迭代器,并添加到新的工作表中。最后通过wb.save将新的Excel文件保存到当前目录下,文件名为 data_selected.xlsx

示例说明

下面通过两个示例说明如何将Excel数据进行处理。

示例一:选取某列数据

假设我们有一个Excel文件,其中包含学生的名字、年龄、成绩信息,我们要从这个Excel中选取所有学生的年龄信息,然后将这些数据保存到一个新的Excel中。

具体实现步骤如下:

  1. 首先打开Excel文件,然后选取需要处理的数据列,例如这里我们只需要选取年龄这一列数据。
  2. 将选取的年龄数据进行处理,然后保存到新的Excel文件中。
import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows

# 读取Excel数据文件
data = pd.read_excel('student_data.xlsx')

# 选取年龄这一列数据
age = data.iloc[:,1]

# 将数据保存到新的Excel文件中
wb = Workbook()
ws = wb.active
for r in dataframe_to_rows(age, index=False, header=True):
    ws.append(r)
wb.save('age.xlsx')

在这个示例中,我们首先读取了 student_data.xlsx 文件,然后使用 iloc 函数来选取年龄列,最后将选取的数据写入到了 age.xlsx 文件中。

示例二:选取多列数据

现在我们要选取多列数据,在这个示例中,我们只需要选取学生的姓名和成绩信息,然后将这些数据保存到一个新的Excel中。

具体实现步骤如下:

  1. 首先打开Excel文件,然后选取需要处理的数据列,例如这里我们需要选取姓名和成绩这两列数据。
  2. 将选取的姓名和成绩数据进行处理,然后保存到新的Excel文件中。
import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows

# 读取Excel数据文件
data = pd.read_excel('student_data.xlsx')

# 选取姓名和成绩这两列数据
data_selected = data.iloc[:, [0, 2]]

# 将数据保存到新的Excel文件中
wb = Workbook()
ws = wb.active
for r in dataframe_to_rows(data_selected, index=False, header=True):
    ws.append(r)
wb.save('name_score.xlsx')

在这个示例中,我们首先读取了 student_data.xlsx 文件,然后使用 iloc 函数来选取姓名和成绩两列,最后将选取的数据写入到了 name_score.xlsx 文件中。

以上就是Python读取Excel指定列数据并写入到新的Excel方法的完整实例教程,希望对你有所帮助!

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python读取excel指定列数据并写入到新的excel方法 - Python技术站

(0)
上一篇 2023年5月13日
下一篇 2023年5月13日

相关文章

  • pip报错“ValueError: invalid literal for int() with base 10: ‘2.7’”怎么处理?

    当使用Java的Hibernate框架时,可能会遇到“ConstraintViolationException”错误。这个错误通常是由以下原因之一引起的: 违反了数据库约束:如果Hibernate尝试将无效的数据插入数据库,则会出现此错误。在这种情况下,需要检查数据库约束是否正确。 数据库表不存在:如果Hibernate尝试访问不存在的数据库表,则会出现此错…

    python 2023年5月4日
    00
  • Python3 requests模块如何模仿浏览器及代理

    Python3 requests模块如何模仿浏览器及代理 模仿浏览器 在使用Python3 requests模块发送HTTP请求时,可以通过设置请求头来模仿浏览器。以下是一个示例,可以使用Python3 requests模块模仿Chrome浏览器发送HTTP请求: import requests url = ‘https://www.example.com’…

    python 2023年5月15日
    00
  • python实现随机漫步算法

    下面是关于“Python实现随机漫步算法”的完整攻略。 1. 随机漫步算法简介 随机漫步算法是一种随机过程,它描述了一个物体在空间中随机移动的过程。随机步算法通常用于模拟分子扩散、股票价格变化等随机过程。 2. Python实现随机漫步算法 在Python中,我们可以使用 random 模块来实现随机漫步算法。下面是一个使用随机漫步算法模拟醉汉走路的示例: …

    python 2023年5月13日
    00
  • Python实现登陆文件验证方法

    下面是“Python实现登陆文件验证方法”的完整攻略。 确定需求 根据题目要求,我们需要实现一个 Python 登陆文件验证的方法。具体来说,就是要编写一个 Python 程序来从文本文件中读取用户名和密码,将用户输入的用户名和密码与文件中的用户名和密码进行比较,如果匹配成功,就允许用户登陆,否则就提示用户名或密码错误。 设计思路 根据需求,我们可以设计以下…

    python 2023年6月2日
    00
  • 使用 python 脚本将 XML 转换为 DataFrame

    【问题标题】:convert XML to DataFrame using python script使用 python 脚本将 XML 转换为 DataFrame 【发布时间】:2023-04-02 16:16:01 【问题描述】: 我正在尝试将以下 xml 数据转换为数据框。 <?xml version=”1.0″ encoding=”utf-8″…

    Python开发 2023年4月8日
    00
  • python实现逻辑回归的方法示例

    下面是“python实现逻辑回归的方法示例”的完整攻略。 1. 什么是逻辑回归 逻辑回归是一种用来预测二分类问题的机器学习算法,它的输出是一个0到1之间的概率值,表示结果为正类的概率大小。 2. 逻辑回归的 Python 实现 2.1 准备数据 逻辑回归算法首先需要准备数据。我们可以使用已有的数据集,或者自己创建数据。 以下是创建数据集的示例代码: impo…

    python 2023年5月19日
    00
  • python产生模拟数据faker库的使用详解

    Python产生模拟数据:Faker库的使用详解 什么是Faker库 Faker是一个Python库,它可以生成各种类型的数据,这些数据都是模拟的,可以用于测试、数据分析、测试环境下的数据填充等场景。 Faker库可以生成的数据类型包括但不限于: 姓名、地址、邮件地址、电话号码等个人信息数据 lorem、address、text等文本数据 时间、日期、年月日…

    python 2023年6月2日
    00
  • Python之列表推导式最全汇总(下篇)

    针对您提到的文章“Python之列表推导式最全汇总(下篇)”,我会给出一份完整的攻略。请您耐心看完以下内容。 标题 Python之列表推导式最全汇总(下篇) 文章简介 本篇文章主要介绍Python中的列表推导式,包括其基本语法、常见应用场景和实用技巧。通过本篇文章的学习,读者将能够掌握Python中列表推导式的使用技巧,提高代码编写效率。 文章内容 列表推导…

    python 2023年6月3日
    00
合作推广
合作推广
分享本页
返回顶部