二维列表是制作Pandas DataFrame的一种方式,通过将二维列表转换为DataFrame,我们可以在Python中更方便地进行数据分析和处理。下面是用二维列表制作Pandas DataFrame的详细攻略。
准备工作
首先,我们需要导入Pandas库,以便在Python中使用它。导入Pandas的代码如下所示:
import pandas as pd
制作二维列表
接下来,我们需要制作一个二维列表作为DataFrame的数据源。这个二维列表可以由一个或多个列表构成,每个列表代表DataFrame中的一列数据。例如,下面是一个包含学生姓名、成绩和年龄的二维列表:
data = [['Tom', 80, 18],
['Jerry', 90, 17],
['Mickey', 95, 19],
['Minnie', 85, 18],
['Donald', 92, 19]]
将二维列表转换为DataFrame
有了数据源后,我们需要将二维列表转换为Pandas DataFrame。使用Pandas的DataFrame函数可以轻松地实现这一步骤。DataFrame函数的基本语法如下:
df = pd.DataFrame(data, columns=[col1, col2, col3...])
其中,data是我们要转换为DataFrame的二维列表,columns是一个可选的参数,用于指定DataFrame中每列的列名。
以学生成绩为例,我们可以这样建立一个DataFrame:
df = pd.DataFrame(data, columns=['Name', 'Score', 'Age'])
print(df)
输出结果为:
Name Score Age
0 Tom 80 18
1 Jerry 90 17
2 Mickey 95 19
3 Minnie 85 18
4 Donald 92 19
访问和操作DataFrame
有了DataFrame,我们可以方便地对数据进行访问和操作。例如,我们可以使用loc方法访问DataFrame中的指定行、列数据。下面的代码演示了如何使用loc方法访问特定的行、列数据。
# 访问第一行,第二列
print(df.loc[0, 'Score'])
# 访问第一列的所有数据
print(df.loc[:, 'Name'])
# 访问前三行的数据
print(df.loc[:2, :])
# 访问分数大于90的学生的数据
print(df.loc[df['Score'] > 90, :])
还可以使用其他方法对DataFrame进行操作,例如添加新列、删除列等等。下面的代码展示了如何将学生成绩相对于平均成绩的偏差作为一个新的列添加到DataFrame中。
# 计算平均成绩
mean_score = df['Score'].mean()
# 计算成绩偏差
df['Deviation'] = df['Score'] - mean_score
# 输出DataFrame
print(df)
输出结果为:
Name Score Age Deviation
0 Tom 80 18 -5.00
1 Jerry 90 17 5.00
2 Mickey 95 19 10.00
3 Minnie 85 18 0.00
4 Donald 92 19 7.00
这就是用二维列表制作Pandas DataFrame的完整攻略,有了这种方法,我们可以快速地将数据准备为Pandas可用于分析和可视化的格式。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:用二维列表制作Pandas DataFrame - Python技术站