如何修复：Pandas中的KeyError

2023年3月27日下午12:02 • python-answer

Pandas中的KeyError常常出现在我们使用DataFrame或Series时，我们输入不存在的键或索引时，系统会抛出KeyError错误。如果不处理这个错误，会影响我们的程序正常运行，甚至导致无法继续操作。

下面提供几种解决KeyError的方法：

1. 检查键是否存在

我们需要检查我们尝试访问的键是否存在，可以使用Pandas提供的in操作符。比如下面的代码：

import pandas as pd

data = {'Name': ['John', 'Mike', 'Sarah'], 'Age': [25, 30, 28], 'Score': [85, 75, 90]}

df = pd.DataFrame(data)

if 'Gender' in df.columns:
    print(df['Gender'])
else:
    print('The key "Gender" does not exist.')

我们通过检查列名'Gender'是否在DataFrame的列名列表中，避免了出现KeyError的情况。如果存在这个键，我们就可以正常地使用它访问DataFrame的数据；如果不存在，我们可以得到一个友好的提示信息。

2. 重新生成索引

如果我们的数据中存在缺失值或者有一些键或索引不是连续的，那么我们可能需要使用reset_index()方法重新生成索引。这个方法会将原来的行号作为一列数据，然后生成一个新的递增的索引。代码如下：

import pandas as pd

data = {'Name': ['John', 'Mike', 'Sarah'], 'Age': [25, 30, 28], 'Score': [85, 75, 90]}

df = pd.DataFrame(data, index=['a', 'b', 'c'])
df = df.reset_index()

print(df.loc[3])

在这个例子中，原来的索引是字母，我们使用reset_index()方法生成了一组新的递增索引，从0开始。这样我们就可以正常地访问第四行数据，而不会出现KeyError错误。

3. 使用.loc[]访问数据

当我们尝试使用索引或键访问DataFrame的数据，我们可以使用.loc[]方法。比如下面的代码：

import pandas as pd

data = {'Name': ['John', 'Mike', 'Sarah'], 'Age': [25, 30, 28], 'Score': [85, 75, 90]}

df = pd.DataFrame(data, index=['a', 'b', 'c'])

print(df.loc['d'])  # 会抛出KeyError错误

因为索引'd'不存在，所以会出现KeyError错误。我们可以在这里使用.loc[]方法，并传递一个错误提示信息，以避免程序抛出异常：

import pandas as pd

data = {'Name': ['John', 'Mike', 'Sarah'], 'Age': [25, 30, 28], 'Score': [85, 75, 90]}

df = pd.DataFrame(data, index=['a', 'b', 'c'])
key = 'd'

if key in df.index:
    print(df.loc[key])
else:
    print(f'The key "{key}" does not exist in the DataFrame.')

这样就可以避免访问不存在的索引时出现KeyError错误。

以上是三种解决Pandas中的KeyError错误的方法。具体采用哪一种方法，可以根据具体的需求和情况来进行选择。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：如何修复：Pandas中的KeyError - Python技术站