获取Pandas DataFrame中包含给定子字符串的所有记录的过程可以分为以下几个步骤:
- 导入Pandas模块以及相关的数据文件
先导入Pandas模块,并读取包含数据的CSV文件,如下所示:
import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
- 利用str.contains()方法查找包含子字符串的记录
使用str.contains()方法查找包含子字符串的记录。str.contains()方法的第一个参数为要查找的子字符串,第二个参数为na=False表示在查找子字符串时不考虑缺失值(nan),代码如下:
# 查找包含子字符串的记录
contains = df[df['column_name'].str.contains(substring, na=False)]
其中,column_name代表需要查找的列名称,substring代表要查找的子字符串。
- 输出包含子字符串的记录
使用print()函数输出包含子字符串的记录,如下所示:
# 输出包含子字符串的记录
print(contains)
完整代码示例:
import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
# 查找包含子字符串的记录
contains = df[df['column_name'].str.contains(substring, na=False)]
# 输出包含子字符串的记录
print(contains)
需要注意的是,在实际的操作中,要根据具体的数据文件和需要查找的子字符串进行修改,确保代码的正确性。同时还需注意,str.contains()方法默认是区分大小写的,如果需要忽略大小写,可以传入参数case=False。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:获取Pandas DataFrame中包含给定子字符串的所有记录 - Python技术站