Python中的pandas.array()函数

2023年3月27日下午12:06 • python-answer

首先需要说明的是，pandas.array()函数是pandas 1.0.0版本引入的新函数，用于创建pandas中的array类型。与numpy中的array不同，pandas的array支持混合数据类型，可以容纳不同类型的数据。

pandas.array()函数主要有两个参数：

下面分别介绍pandas.array()两个参数的使用方法：

pandas.array()函数的data参数可以接收Python的列表、元组、数组、字典等不同类型的数据结构。

例如，可以创建一个包含不同数据类型的列表，并使用pandas.array()函数创建pandas的array：

import pandas as pd

data = [1, 2.0, '3', [4], {'5': 6}]
arr = pd.array(data)
print(arr)

输出结果为：

<PandasArray>
[1, 2.0, '3', [4], {'5': 6}]
Length: 5, dtype: object

可以看到，输出结果中的array包含了整型、浮点数、字符串、列表、字典等数据类型。由于data中包含了不同数据类型的数据，所以输出结果中的dtype为object。

在创建pandas的array时，可以通过dtype参数指定输出数组的数据类型。

例如，可以创建一个包含整型和浮点型数据的列表，并使用pandas.array()函数创建pandas的array，并指定输出的数据类型为float：

import pandas as pd

data = [1, 2, 3.0, 4.0]
arr = pd.array(data, dtype=float)
print(arr)

输出结果为：

<PandasArray>
[1.0, 2.0, 3.0, 4.0]
Length: 4, dtype: float64

可以看到，输出结果中的dtype为float64，即已经转换为了浮点型。如果没有指定dtype参数，则输出数组中的dtype为int或float，具体取决于输入数据的数据类型。

除了支持不同数据类型的数据，pandas的array还支持缺失值。如果创建的数据结构中包含缺失值，pandas的array会自动将缺失值填充为<NA>。

例如，可以创建一个包含缺失值的列表，并使用pandas.array()函数创建pandas的array：

import pandas as pd

data = [1, 2, None, 4, pd.NA]
arr = pd.array(data)
print(arr)

输出结果为：

<PandasArray>
[1, 2, <NA>, 4, <NA>]
Length: 5, dtype: object

可以看到，输出结果中的缺失值已经被填充为<NA>。需要注意的是，因为pandas的array支持混合数据类型，所以在创建包含缺失值的array时需要确保数据类型的兼容性。

以上就是pandas.array()函数的详细介绍。总体来说，pandas.array()函数可以用于创建包含不同数据类型和缺失值的pandas的array，从而方便进行数据处理和分析。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Python中的pandas.array()函数 - Python技术站