创建数据框(DataFrame)是pandas中最基础而又最常用的操作之一,下面是从Pandas系列创建数据框架的完整攻略:
导入Pandas
在使用Pandas之前,需要先导入Pandas模块。
import pandas as pd
通过字典创建数据框
创建数据框最常见的方式是使用字典,字典的键代表表头,值代表表格中的数据。
data = {'name': ['Tom', 'Jerry', 'Mickey'],
'age': [20, 18, 22],
'gender': ['Male', 'Female', 'Male']}
df = pd.DataFrame(data)
代码中,我们使用了一个字典data,其中包含了三列数据:name
,age
,和gender
。让我们使用pd.DataFrame()
函数创建了一个数据框。
通过二维列表创建数据框
我们也可以使用二维列表(List)来创建数据框,这种方法需要注意的一点是:表头需要单独设置。
data = [['Tom', 20, 'Male'], ['Jerry', 18, 'Female'], ['Mickey', 22, 'Male']]
columns = ['name', 'age', 'gender']
df = pd.DataFrame(data, columns=columns)
代码中,我们使用了一个二维列表data,这个列表中包含了三行数据。columns参数用于传入表头的名称,创建了一个新的数据框。
通过CSV文件创建数据框
CSV(逗号分隔值)是一种常见的数据格式,可以使用pd.read_csv()
函数直接将该格式的文件读取成数据框。
df = pd.read_csv('data.csv')
代码中的data.csv
是一个CSV格式的文件,我们可以直接使用pd.read_csv()
函数将其读取为一个数据框。
通过Excel文件创建数据框
如果数据量较大或者需要多张表格,通常会选择将数据存储在Excel文件中。原理与读取CSV文件相同,使用pd.read_excel()
函数读取Excel文件即可。
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
代码中的data.xlsx
是一个Excel文件,我们可以使用pd.read_excel()
函数将其读取为一个数据框,可以指定sheet_name参数指定需要读取的sheet表格。
以上方式是常见的从Pandas系列创建数据框架的方式。建议初学者把以上方式实践过一遍,熟悉Pandas数据框的创建方式,这样对后续数据处理,分析等操作有很好的帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:从Pandas系列创建数据框架 - Python技术站