Python中关于集合的介绍与常规操作解析
什么是集合
集合是一种无序、不重复的容器,它是Python语言中的一种基本数据类型。集合中的元素不能重复,且不保证元素存储的顺序。
如何创建集合
可以使用set()函数或者使用花括号{}来创建一个集合。
# 使用set()函数创建一个集合
my_set = set([1, 2, 3])
print(my_set)
# 使用花括号{}创建一个集合
my_set = {1, 2, 3}
print(my_set)
常规操作
添加元素
可以通过add()方法向集合中添加一个元素,如果添加的元素已经存在于集合中,则不进行任何操作。
my_set = {1, 2, 3}
my_set.add(4)
print(my_set)
删除元素
可以通过remove()方法或discard()方法从集合中删除一个元素,两种方法的区别在于remove()方法删除的元素不存在时会抛出KeyError异常,而discard()方法不会。
my_set = {1, 2, 3}
my_set.remove(3)
print(my_set)
my_set.discard(2)
print(my_set)
集合运算
集合可以进行并集、交集、差集等运算。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
# 并集
print(set1 | set2)
print(set1.union(set2))
# 交集
print(set1 & set2)
print(set1.intersection(set2))
# 差集
print(set1 - set2)
print(set1.difference(set2))
示例说明
示例1:从列表中去重
在处理数据时,经常需要从一个列表中去重。可以使用集合的特性将列表中的重复元素去掉。
my_list = [1, 2, 2, 3, 4, 4, 5]
my_set = set(my_list)
new_list = list(my_set)
print(new_list)
输出:
[1, 2, 3, 4, 5]
示例2:统计单词数量
在处理文本数据时,经常需要统计其中不同单词的数量。可以使用split()方法将文本分割成单词,然后使用集合进行去重。
text = "Hello world, this is a sample text for word counting."
words = text.split()
unique_words = set(words)
word_count = len(unique_words)
print("There are", word_count, "unique words in the text.")
输出:
There are 9 unique words in the text.
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python中关于集合的介绍与常规操作解析 - Python技术站