在Pandas中用另一个DataFrame的值替换一个DataFrame的值

2023年3月27日下午3:23 • python-answer

首先，我们需要明确的是，Pandas中用另一个DataFrame的值替换一个DataFrame的值有两种情况：

用另一个DataFrame替换当前DataFrame中所有匹配的值。
用另一个DataFrame替换当前DataFrame中指定列（列名相同）的所有匹配的值。

下面，我们将对这两种情况进行详细的讲解。

用另一个DataFrame替换当前DataFrame中所有匹配的值

假设我们有两个DataFrame，一个是scores，另一个是replace：

import pandas as pd

scores = pd.DataFrame({'name': ['Tom', 'Jerry', 'Mickey'],
                       'score': [80, 90, 85]})
replace = pd.DataFrame({'name': ['Jerry', 'Mickey'],
                        'score': [95, 92]})

scores中包含学生的姓名和分数，replace中包含需要替换的学生的姓名和新分数。现在我们希望将scores中需要替换的学生的分数替换成replace中的新分数。

我们可以通过merge()方法来实现：

new_scores = pd.merge(scores, replace, on='name', how='left')
new_scores['score'] = new_scores['score_y'].fillna(new_scores['score_x'])
new_scores.drop(columns=['score_x', 'score_y'], inplace=True)

首先，我们使用merge()方法将scores和replace按照姓名进行左连接（how='left'表示以scores为基准，如果replace中有与之匹配的姓名，则将匹配的行和scores中对应的行合并成新的行，如果没有匹配的姓名，则将scores中对应的行保留）。这一步操作之后得到了一个新的DataFramenew_scores，它包含了两个DataFrame合并之后的所有列。

其次，我们将新DataFrame中的score_x（表示scores中的分数）和score_y（表示replace中的新分数）两列进行取值，如果score_y列不为空，则将其值作为新分数，否则将score_x作为原分数。最后，我们通过drop()方法将score_x和score_y两列删除掉，最终得到了一个新的DataFramenew_scores，它中的分数已经被替换成了新分数。

用另一个DataFrame替换当前DataFrame中指定列（列名相同）的所有匹配的值

假设我们有两个DataFrame，均包含学生的姓名和分数：

import pandas as pd

scores = pd.DataFrame({'name': ['Tom', 'Jerry', 'Mickey'],
                       'score': [80, 90, 85]})
replace = pd.DataFrame({'name': ['Jerry', 'Mickey'],
                        'score': [95, 92]})

这里的scores和上一个例子中的一样，replace中也包含了需要替换的学生的姓名和新分数。

现在我们希望将scores中需要替换的学生的分数替换成replace中的新分数，我们可以使用update()方法来实现：

scores.set_index('name', inplace=True)
replace.set_index('name', inplace=True)

scores.update(replace)

首先，我们使用set_index()方法将scores和replace的索引设置为名称（name）。接着，我们使用update()方法将replace中的值更新到scores中，只更新索引相同且列名相同的值。这一步操作完成之后，scores中的分数已经被替换成了新分数。

注意，在使用update()方法之前，我们将scores和replace的索引都设置成了名称（name），这是因为使用update()方法时，Pandas会根据索引和列名来匹配需要更新的值。如果两个DataFrame的索引不同，则无法匹配需要更新的值；如果两个DataFrame的列名不同，则无法匹配需要更新的列。因此，我们需要将两个DataFrame的索引和列名都设置成相同的名称才能使用update()方法进行更新。

以上就是在Pandas中用另一个DataFrame的值替换一个DataFrame的值的完整攻略和实例说明。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：在Pandas中用另一个DataFrame的值替换一个DataFrame的值 - Python技术站

在Pandas中用另一个DataFrame的值替换一个DataFrame的值

用另一个DataFrame替换当前DataFrame中所有匹配的值

用另一个DataFrame替换当前DataFrame中指定列（列名相同）的所有匹配的值

相关文章