跟老齐学Python之集合的关系

yizhihongxing

接下来我将详细讲解“跟老齐学Python之集合的关系”的完整攻略。

什么是集合?

集合是Python中的一种数据类型,它是一组无序、唯一的元素。集合的创建方式有两种,分别是使用set()函数和使用花括号{}。下面是两种方式的创建集合代码示例:

# 使用 set() 函数创建集合
my_set = set([1, 2, 3, 4, 5])
print(my_set)

# 使用花括号 {} 创建集合
my_set = {1, 2, 3, 4, 5}
print(my_set)

输出结果都是 {1, 2, 3, 4, 5},因为集合是无序的,所以元素在输出时的顺序可能有所不同。

集合的常用操作

添加元素

集合可以使用 add() 方法向其中添加元素,例如:

my_set = {1, 2, 3}
my_set.add(4)
print(my_set)   # 输出: {1, 2, 3, 4}

删除元素

集合可以使用 remove()discard() 方法删除元素,例如:

my_set = {1, 2, 3}
my_set.remove(2)
print(my_set)   # 输出: {1, 3}

交集、并集和差集

  • 交集:集合的交集可以使用 & 运算符或者 intersection() 方法实现。示例代码如下:
set1 = {1, 2, 3}
set2 = {2, 3, 4}
common_set = set1 & set2
print(common_set)   # 输出: {2, 3}
  • 并集:集合的并集可以使用 | 运算符或者 union() 方法实现。示例代码如下:
set1 = {1, 2, 3}
set2 = {2, 3, 4}
union_set = set1 | set2
print(union_set)   # 输出: {1, 2, 3, 4}
  • 差集:集合的差集可以使用 - 运算符和 difference() 方法实现。示例代码如下:
set1 = {1, 2, 3}
set2 = {2, 3, 4}
diff_set = set1 - set2
print(diff_set)   # 输出: {1}

跟老齐学Python中集合的应用

在跟老齐学Python中,集合的应用十分广泛。例如,在查找一个列表中所有不重复元素时,可以使用集合来实现:

my_list = [1, 2, 2, 3, 4, 4, 5, 5]
my_set = set(my_list)
unique_list = list(my_set)
print(unique_list)   # 输出: [1, 2, 3, 4, 5]

另外,在实现诸如统计一段英文文本中各个单词出现次数等操作时,也可以使用集合来帮助我们实现。例如下面的代码,它读取一个文件,并统计其中各个单词出现的次数:

with open('english.txt', 'r') as f:
    text = f.read()

words = text.split()
count_dict = {}
for word in words:
    if word not in count_dict.keys():
        count_dict[word] = 1
    else:
        count_dict[word] += 1

print(count_dict)

但是我们会发现,上面的代码并没有考虑到单词大小写、标点符号等问题,所以统计结果可能不准确。这时候,我们可以通过将所有单词转换成小写,并过滤掉标点符号之后,再统计它们的出现次数。下面的代码演示了如何使用集合帮助我们完成这个操作:

import re

with open('english.txt', 'r') as f:
    text = f.read()

words = re.findall(r'\b\w+\b', text.lower())
count_dict = {}
for word in words:
    if word not in count_dict.keys():
        count_dict[word] = 1
    else:
        count_dict[word] += 1

print(count_dict)

上面的代码使用了正则表达式来过滤标点符号,并将所有单词转换成小写,再进行统计。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:跟老齐学Python之集合的关系 - Python技术站

(0)
上一篇 2023年5月13日
下一篇 2023年5月13日

相关文章

  • 数据挖掘之Apriori算法详解和Python实现代码分享

    数据挖掘之Apriori算法详解和Python实现代码分享 什么是Apriori算法 Apriori算法是一种用于发现数据集中关联规则的算法。它基于两个假设: 先验性质(Antecedent Property):如果一个项目集是频繁的,那么它的所有子集也是频繁的。换句话说,如果某个项集出现的次数大于等于最小支持度(Minimum Support),则它的所有…

    python 2023年5月14日
    00
  • 10个必须要掌握的Python内置函数

    下面我将详细讲解一下“10个必须要掌握的Python内置函数”的攻略。 目录 Python内置函数及其作用 10个必须要掌握的Python内置函数 print() len() range() type() str() int() float() list() dict() set() 示例说明 总结 1. Python内置函数及其作用 Python内置函数是…

    python 2023年6月5日
    00
  • 如何使用python检查句子中的拼写错误

    【问题标题】:How to check spelling mistakes in sentence using python如何使用python检查句子中的拼写错误 【发布时间】:2023-04-05 17:26:01 【问题描述】: 我想检查拼写错误的数量。在句子中 print(a) 输出是 myy nameq is xyz i am fromm abc …

    Python开发 2023年4月5日
    00
  • 让Python脚本暂停执行的几种方法(小结)

    当我们编写 Python 脚本时,经常需要让脚本暂停执行一段时间,例如等待用户输入或者等待其他程序执行完毕。在 Python 中,有多种方法可以实现暂停脚本的执行。下面将详细介绍 Python 脚本暂停执行的几种方法。 方法一:使用 time.sleep() time.sleep() 是 Python 提供的内置函数,可以让脚本暂停执行一段时间。它的语法如下…

    python 2023年6月2日
    00
  • python安装后无法打开IDLE Subprocess Connection Error的解决方法

    Python安装后无法打开IDLESubprocessConnectionError的解决方法 在Python安装后,有时会出现无法打开IDLE的情况,这通常由于SubprocessConnectionError错误引起的。本略将提供Python安装后无法打开IDLESubprocessConnectionError的解决方法的完攻略,包括错误的原因、解决方…

    python 2023年5月13日
    00
  • Python打印数据类型的全过程

    下面来详细讲解“Python打印数据类型的全过程”。 1. 背景知识 在Python中,数据类型是非常重要的知识点之一。常见的数据类型有整数、浮点数、字符串、列表、元组、字典等。我们可以使用type()函数来查看一个变量的数据类型。下面简单介绍一下type()函数的用法。 var1 = 123 var2 = 3.14 var3 = "hello w…

    python 2023年6月5日
    00
  • shell自动安装python3的脚本写法

    下面是“shell自动安装python3的脚本写法”攻略。 前置条件 在安装 Python3 之前,您的系统应该已经安装了一些编译器和依赖项。以下命令,可以在 Ubuntu 系统中安装这些依赖项: sudo apt-get update sudo apt-get install build-essential checkinstall sudo apt-ge…

    python 2023年5月19日
    00
  • Python中常用数据类型使用示例概括总结

    以下是“Python中常用数据类型使用示例概括总结”的完整攻略。 1. Python中常用的数据类型 在Python中常用的数据类型包括整数、浮点数、字符串、列表、元组、字典和集合等。以下是这些数据类型的简要介绍: 整数:表示整数,例如1、2、3等。 浮点数:表示带有小数点的数,例如1.0、2.5、3.14等。 字符串:表示文本,例如”hello””worl…

    python 2023年5月13日
    00
合作推广
合作推广
分享本页
返回顶部