【发布时间】:2023-04-01 18:47:01
【问题描述】:
我正在尝试比较两个 Excel 电子表格,从第一个电子表格中删除两个电子表格中出现的名称,然后使用 python 将其导出到 csv 文件。我是新手,但这是我目前所拥有的:
import pandas as pd
data_1 = pd.read_excel (r'names1.xlsx')
bit_data = pd.DataFrame(data_1, columns= ['Full_Name'])
bit_col = len(bit_data)
data_2 = pd.read_excel (r'force_names.xlsx')
force_data = pd.DataFrame(data_2, columns= ['FullName'])
force_col = len(force_data)
for bit_num in range(bit_col):
for force_num in range(force_col):
if bit_data.iloc[bit_num,0] == force_data.iloc[force_num,0]:
data_1 = data_1.drop(data_1.index[[bit_num]])
data_1.to_csv(r"/Users/name/Desktop/Reports/Names.csv")
当我运行它时,它会删除一些重复项,但不是全部,任何人的建议将不胜感激。
【问题讨论】:
-
你遇到了什么问题?
-
查看How to make good pandas examples 和edit 您的问题,包括minimal reproducible example 显示示例输入数据帧、当前输出和预期输出
-
另请注意,pandas 内置了
merge()
、isin()
和drop_duplicates()
函数,这些函数在这里可能会有所帮助
标签:
python
excel
pandas
dataframe
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:比较两个电子表格,删除重复项并将结果导出到 python 中的 csv - Python技术站