首先需要说明的是,pandas.array()
函数是pandas 1.0.0版本引入的新函数,用于创建pandas中的array类型。与numpy中的array不同,pandas的array支持混合数据类型,可以容纳不同类型的数据。
pandas.array()
函数主要有两个参数:
- data: 输入数据,可以是列表、数组、元组、字典等数据结构
- dtype: 输出数据的数据类型,可以是float、object、int等
下面分别介绍pandas.array()
两个参数的使用方法:
- data参数
pandas.array()
函数的data参数可以接收Python的列表、元组、数组、字典等不同类型的数据结构。
例如,可以创建一个包含不同数据类型的列表,并使用pandas.array()
函数创建pandas的array:
import pandas as pd
data = [1, 2.0, '3', [4], {'5': 6}]
arr = pd.array(data)
print(arr)
输出结果为:
<PandasArray>
[1, 2.0, '3', [4], {'5': 6}]
Length: 5, dtype: object
可以看到,输出结果中的array包含了整型、浮点数、字符串、列表、字典等数据类型。由于data中包含了不同数据类型的数据,所以输出结果中的dtype为object。
- dtype参数
在创建pandas的array时,可以通过dtype参数指定输出数组的数据类型。
例如,可以创建一个包含整型和浮点型数据的列表,并使用pandas.array()
函数创建pandas的array,并指定输出的数据类型为float:
import pandas as pd
data = [1, 2, 3.0, 4.0]
arr = pd.array(data, dtype=float)
print(arr)
输出结果为:
<PandasArray>
[1.0, 2.0, 3.0, 4.0]
Length: 4, dtype: float64
可以看到,输出结果中的dtype为float64,即已经转换为了浮点型。如果没有指定dtype参数,则输出数组中的dtype为int或float,具体取决于输入数据的数据类型。
除了支持不同数据类型的数据,pandas的array还支持缺失值。如果创建的数据结构中包含缺失值,pandas的array会自动将缺失值填充为<NA>
。
例如,可以创建一个包含缺失值的列表,并使用pandas.array()
函数创建pandas的array:
import pandas as pd
data = [1, 2, None, 4, pd.NA]
arr = pd.array(data)
print(arr)
输出结果为:
<PandasArray>
[1, 2, <NA>, 4, <NA>]
Length: 5, dtype: object
可以看到,输出结果中的缺失值已经被填充为<NA>
。需要注意的是,因为pandas的array支持混合数据类型,所以在创建包含缺失值的array时需要确保数据类型的兼容性。
以上就是pandas.array()
函数的详细介绍。总体来说,pandas.array()
函数可以用于创建包含不同数据类型和缺失值的pandas的array,从而方便进行数据处理和分析。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python中的pandas.array()函数 - Python技术站