【问题标题】:Comparing two spreadsheets, removing the duplicates and exporting the result to a csv in python比较两个电子表格,删除重复项并将结果导出到 python 中的 csv
【发布时间】:2023-04-01 18:47:01
【问题描述】:

我正在尝试比较两个 Excel 电子表格,从第一个电子表格中删除两个电子表格中出现的名称,然后使用 python 将其导出到 csv 文件。我是新手,但这是我目前所拥有的:

import pandas as pd
data_1 = pd.read_excel (r'names1.xlsx')
bit_data = pd.DataFrame(data_1, columns= ['Full_Name'])
bit_col = len(bit_data)
data_2 = pd.read_excel (r'force_names.xlsx')

force_data = pd.DataFrame(data_2, columns= ['FullName'])

force_col = len(force_data)


for bit_num in range(bit_col):

  for force_num in range(force_col):

        if bit_data.iloc[bit_num,0] == force_data.iloc[force_num,0]:

            data_1 = data_1.drop(data_1.index[[bit_num]])

            data_1.to_csv(r"/Users/name/Desktop/Reports/Names.csv")


                   

当我运行它时,它会删除一些重复项,但不是全部,任何人的建议将不胜感激。

【问题讨论】:

标签:
python
excel
pandas
dataframe