利用pandas将非数值数据转换成数值的方式

在数据分析过程中，我们通常需要对非数值数据进行数值化处理。常见的非数值数据包括文本、类别和时间等。Pandas是Python中最受欢迎的数据分析工具库之一，提供了灵活方便的数据转换功能来处理非数值数据。

下面是利用Pandas将非数值数据转换为数值类型的方式：

1. 利用map方法将类别数据转换为数值型

实例1：性别数据的转换

假设我们有一组以字符串形式表示的性别数据，例如：

import pandas as pd

df = pd.DataFrame({'sex': ['男', '女', '女', '男', '女', '男']})

我们需要将性别数据转换为0和1表示，其中0表示男，1表示女。

可以使用Python内置的map方法，将每个类别映射为对应的数值：

df['sex'] = df['sex'].map({'男': 0, '女': 1})

这样，我们就将性别数据转换为了数值类型，并且可以方便地进行后续的数据分析。

实例2：星期数据的转换

假设我们有一组以字符串形式表示的星期数据，例如：

import pandas as pd

df = pd.DataFrame({'day': ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']})

我们需要将星期数据转换为数字表示，其中Monday为1，Tuesday为2，以此类推。

可以使用map方法进行转换：

days = {'Monday': 1,
        'Tuesday': 2,
        'Wednesday': 3,
        'Thursday': 4,
        'Friday': 5,
        'Saturday': 6,
        'Sunday': 7}

df['day'] = df['day'].map(days)

这样我们就完成了星期数据的转换，使其成为了数值型数据。

2. 利用replace方法将类别数据转换为数值型

使用replace方法可以将指定的字符串替换为指定的值。可以将DataFrame中的每个字符串都替换为对应的数值。下面是一个示例，演示如何使用replace方法将星期数据转换为数值类型：

实例3：星期数据的转换

import pandas as pd

df = pd.DataFrame({'day': ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']})

我们需要将星期数据转换为数字表示，其中Monday为1，Tuesday为2，以此类推。

可以使用replace方法进行转换：

df['day'] = df['day'].replace({'Monday': 1,
                               'Tuesday': 2,
                               'Wednesday': 3,
                               'Thursday': 4,
                               'Friday': 5,
                               'Saturday': 6,
                               'Sunday': 7})