Python读取Excel一列并计算所有对象出现次数的方法

关于“Python读取Excel一列并计算所有对象出现次数的方法”,以下是一些完整的攻略:

步骤1:安装pandas库

在Python中,我们可以使用pandas库来处理Excel文件。所以,首先需要安装pandas库。可以使用以下命令来进行安装:

pip install pandas

步骤2:读取Excel文件

在Python中,可以使用pandas库中的read_excel函数来读取Excel文件。以下是一个示例代码:

import pandas as pd

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

以上代码使用read_excel函数来读取example.xlsx文件中的Sheet1工作表,并将数据存储在一个名为df的pandas DataFrame对象中。

步骤3:选择所需列并计算出现次数

在pandas DataFrame对象中,我们可以使用DataFrame对象的列名来选择需要的列。以下是一个示例代码,此示例中假设读取的Excel文件中存在一个名为“Column1”的列:

import pandas as pd

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
column1 = df['Column1']
counts = column1.value_counts()

以上代码首先读取名为“example.xlsx”的Excel文件中的Sheet1工作表,并从中选择名为“Column1”的列。然后,使用DataFrame对象的value_counts方法计算出了每个唯一对象的出现次数,并存储在一个名为“counts”的pandas Series对象中。您可以使用类似以下方式输出“counts”对象的内容:

print(counts.to_dict())

示例1:计算学生各城市来自人数

以下代码假设Excel文件中存在一个名为“City”的列,用于标识每个学生来自哪个城市。

import pandas as pd

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
city_col = df['City']
city_counts = city_col.value_counts()
print(city_counts.to_dict())

例如,假设Excel文件中存在以下学生信息:

Name City
Alice Beijing
Bob Shanghai
Charlie Beijing
David Ningbo
Elizabeth Beijing

那么以上代码将输出以下字典对象:

{'Beijing': 3, 'Shanghai': 1, 'Ningbo': 1}

这表示有3个学生来自北京,1个来自上海,1个来自宁波。

示例2:计算文本文件中每个单词的出现次数

以下代码读取一个文本文件,并计算文件中每个单词的出现次数。

import pandas as pd
import re

with open('example.txt', 'r') as f:
    text = f.read()

word_list = re.findall('\w+', text)
word_series = pd.Series(word_list)
word_counts = word_series.value_counts()

print(word_counts.to_dict())

例如,假设example.txt文件中包含以下文本:

The quick brown fox jumped over the lazy dog. The dog was not amused.

那么以上代码将输出以下字典对象:

{'the': 2, 'dog': 2, 'quick': 1, 'brown': 1, 'fox': 1, 'jumped': 1, 'over': 1, 'lazy': 1, 'was': 1, 'not': 1, 'amused': 1}

这表示“the”和“dog”这两个单词均出现了两次,而其余单词均只出现了一次。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python读取Excel一列并计算所有对象出现次数的方法 - Python技术站

(1)
上一篇 2023年6月3日
下一篇 2023年6月3日

相关文章

  • Object arrays cannot be loaded when allow_pickle=False的问题

    “Object arrays cannot be loaded when allow_pickle=False”的问题一般出现在使用numpy库的load函数时。该问题的产生原因是numpy.load函数默认是禁止加载文件中包含pickle的数据类型的,因为它容易受到恶意代码的攻击。因此,在打开二进制文件时需要通过设置参数allow_pickle=True来…

    python 2023年6月2日
    00
  • python3实现暴力穷举博客园密码

    Python3 实现暴力穷举博客园密码 简介 博客园是一个类似于Wordpress的博客平台,其密码由数字与字母组成,不易记住。为了避免忘记密码或是密码泄漏所带来的危害,我们可以使用python3实现博客园密码的暴力破解。 破解原理 暴力破解的原理就是穷举所有可能的密码,并尝试登录。在博客园中,密码是由6位数字与字母组成,总共有36^6=2176782336…

    python 2023年5月19日
    00
  • Python读取pdf表格写入excel的方法

    下面是Python读取pdf表格写入excel的方法的完整实例教程。 1. 环境准备 首先,我们需要安装三个Python库,分别是pdfplumber、openpyxl和os,可以通过pip命令安装: !pip install pdfplumber !pip install openpyxl 2. 实现步骤 接下来,我们具体来看如何使用Python实现读取p…

    python 2023年5月13日
    00
  • Python使用Excel将数据写入多个sheet

    下面是Python使用Excel将数据写入多个sheet的完整实例教程。 环境准备 我们需要安装 openpyxl 库,它是一个用于读写Excel文件的Python模块,可以通过以下命令进行安装: pip install openpyxl 实例说明1 假设我们有一个学生成绩表格,其中有三个学科:语文、数学、英语,现在我们要将学生成绩按照不同学科写入不同的sh…

    python 2023年5月13日
    00
  • python requests实现上传excel数据流

    下面就来讲解详细的Python requests实现上传Excel数据流的完整实例教程。 1. 准备工作 在开始之前,需要安装Python的requests库,并准备一个Excel文件。 如果你还没有安装过requests库,可以在命令行中使用以下命令进行安装: pip install requests 准备一个Excel文件,并将其保存在本地路径(比如/p…

    python 2023年5月13日
    00
  • Python爬虫之Spider类用法简单介绍

    Python爬虫之Spider类用法简单介绍 Spider类是Scrapy框架中最核心的类,其主要作用是定义如何爬取某些网站,并解析网页数据。下面将介绍Spider类的一些基本用法。 前置知识 在介绍Spider类之前,我们需要了解一些Scrapy框架的基本概念: Scrapy: 一个python web爬虫框架,旨在用最少的代码便捷地爬取web站点。 Re…

    python 2023年5月13日
    00
  • 将 LinearSVC 的决策函数转换为概率(Scikit learn python)

    【问题标题】:Converting LinearSVC’s decision function to probabilities (Scikit learn python )将 LinearSVC 的决策函数转换为概率(Scikit learn python) 【发布时间】:2023-04-07 13:40:01 【问题描述】: 我使用来自 scikit l…

    Python开发 2023年4月8日
    00
  • Python经纬度坐标转换为距离及角度的实现

    Python中经纬度坐标转换为距离以及角度的实现可以通过使用Haversine公式来实现。 Haversine公式 Haversine公式是一种通过经纬度计算球面距离的算法,它的计算方式基于圆心角,其公式如下: $d = 2r\arcsin\sqrt{\sin^2\frac{\phi_2-\phi_2}{2}+\cos\phi_1\cos\phi_2\sin…

    python 2023年6月3日
    00
合作推广
合作推广
分享本页
返回顶部