加入Pandas数据框架并进行子串匹配包括以下几个步骤:
- 导入Pandas库:在Python中使用Pandas进行数据处理时,需要先导入Pandas库。
import pandas as pd
- 创建数据框架:将数据读入Pandas数据框架中。可以从CSV或Excel文件中读入或直接手动创建。
# 从CSV文件中读入数据
df = pd.read_csv('data.csv')
# 从Excel文件中读入数据
df = pd.read_excel('data.xlsx')
# 手动创建数据框架
df = pd.DataFrame({'Name':['Alice', 'Bob', 'Charlie'],
'Age':[25, 30, 35],
'Gender':['F', 'M', 'M']})
- 子串匹配:使用Pandas中的str.contains()函数进行子串匹配,该函数返回一个布尔类型的Series对象。
# 根据Name列的值是否包含'M',返回匹配结果的布尔类型Series对象
match_result = df['Name'].str.contains('M')
- 过滤数据:通过将布尔类型的Series对象传递给数据框架的.loc[]函数,可以轻松地过滤出满足条件的数据。
# 过滤出Name列值包含'M'的行
filtered_df = df.loc[match_result, :]
完整代码实例:
import pandas as pd
# 创建数据框架
df = pd.DataFrame({'Name':['Alice', 'Bob', 'Charlie'],
'Age':[25, 30, 35],
'Gender':['F', 'M', 'M']})
# 根据Name列的值是否包含'M',返回匹配结果的布尔类型Series对象
match_result = df['Name'].str.contains('M')
# 过滤出Name列值包含'M'的行
filtered_df = df.loc[match_result, :]
print(filtered_df)
输出结果:
Name Age Gender
1 Bob 30 M
2 Charlie 35 M
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:加入Pandas数据框架,通过子串匹配 - Python技术站