下面我将为您详细讲解如何用Python实现简单Excel数据统计的实例,教程包含以下内容:
- 环境配置
- 安装依赖库
- 读取Excel数据
- 统计数据并生成结果
- 将结果写入新的Excel表格
1. 环境配置
首先,您需要安装Python 3.x环境,并配置好相应的环境变量。
2. 安装依赖库
为了能够读写Excel表格,我们需要安装openpyxl
库。您可以通过以下命令安装:
pip install openpyxl
3. 读取Excel数据
下面我们将展示如何读取Excel表格中的数据,以便统计数据并生成结果。
假设我们有一个名为data.xlsx
的Excel表格,其中包含有销售数据,如下所示:
日期 | 产品名称 | 销售额 |
---|---|---|
2021-01-01 | A | 100 |
2021-01-02 | B | 200 |
2021-01-03 | A | 150 |
2021-01-04 | C | 300 |
下面的代码将读取Excel表格中的数据,并将其存储为一个Python的列表:
import openpyxl
# 打开Excel表格
wb = openpyxl.load_workbook('data.xlsx')
# 获取第一个工作表
ws = wb.active
# 存储数据的列表
data = []
# 读取数据,并存储为一个列表
for row in ws.iter_rows(min_row=2, values_only=True):
date, product, sales = row
data.append((date, product, sales))
# 打印读取的数据
print(data)
输出结果如下:
[('2021-01-01', 'A', 100), ('2021-01-02', 'B', 200), ('2021-01-03', 'A', 150), ('2021-01-04', 'C', 300)]
4. 统计数据并生成结果
在读取Excel数据后,我们需要对其进行简单的统计,比如计算每个产品的销售总额。
下面的代码将实现这个功能,并以一个Python字典的形式存储每个产品的销售总额:
# 统计每个产品的销售总额
sales_by_product = {}
for date, product, sales in data:
if product not in sales_by_product:
sales_by_product[product] = 0
sales_by_product[product] += sales
# 打印每个产品的销售总额
for product, total_sales in sales_by_product.items():
print(product, total_sales)
输出结果如下:
A 250
B 200
C 300
5. 将结果写入新的Excel表格
最后,我们需要将统计结果写入一个新的Excel表格中。
下面的代码将实现这个功能,并将结果写入一个名为result.xlsx
的Excel表格:
from openpyxl import Workbook
# 创建一个新的Excel表格
wb = Workbook()
# 创建一个新的工作表
ws = wb.active
# 设置表头
ws.append(['产品名称', '销售总额'])
# 将统计结果写入表格中
for product, total_sales in sales_by_product.items():
ws.append([product, total_sales])
# 保存Excel表格
wb.save('result.xlsx')
执行后,将在当前目录下生成一个名为result.xlsx
的Excel表格,其中包含有每个产品的销售总额。
这就是用Python实现简单Excel数据统计的完整实例。您可以按照这个教程进行实践,并根据需要进行适当的修改。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:用python实现简单EXCEL数据统计的实例 - Python技术站