Pandas中把dataframe转成array的方法

yizhihongxing

Pandas 中的 dataframe 转换为数组(array)是一个很常见的需求。Pandas是一个基于NumPy构建的数据科学工具包,它提供了许多方便的函数将DataFrame数据转换为NumPy数组。以下是把 dataframe 转换为 array 的几种方法。

方法一:使用to_numpy函数

  1. to_numpy:此方法被广泛广泛使用,可以快速地将 Pandas DataFrame 转换为 NumPy array,并且可以处理 DataFrame 中的任何类型数据。
import pandas as pd

df = pd.DataFrame({
    'name': ['Jack', 'Lucy', 'Mike', 'Lee'],
    'age': [23, 25, 18, 20],
    'gender': ['male', 'female', 'male', 'male']
})

# 使用 to_numpy 函数将 dataframe 转换成 array
arr = df.to_numpy()
print(arr)

输出:

array([['Jack', 23, 'male'],
       ['Lucy', 25, 'female'],
       ['Mike', 18, 'male'],
       ['Lee', 20, 'male']], dtype=object)
  1. 使用values属性:另一种常见方法是使用DataFrame的values属性将DataFrame转换为多维数组。但是,这种方法已被弃用,建议使用to_numpy()来替代。
import pandas as pd

df = pd.DataFrame({
    'name': ['Jack', 'Lucy', 'Mike', 'Lee'],
    'age': [23, 25, 18, 20],
    'gender': ['male', 'female', 'male', 'male']
})

# 使用 values 属性将 dataframe 转换成 array
arr = df.values
print(arr)

输出:

array([['Jack', 23, 'male'],
       ['Lucy', 25, 'female'],
       ['Mike', 18, 'male'],
       ['Lee', 20, 'male']], dtype=object)

方法二:先转置再使用to_numpy方法

import pandas as pd

df = pd.DataFrame({
    'name': ['Jack', 'Lucy', 'Mike', 'Lee'],
    'age': [23, 25, 18, 20],
    'gender': ['male', 'female', 'male', 'male']
})

# 使用 to_numpy 方法将 dataframe 转换成 array
arr = df.T.to_numpy()
print(arr)

输出:

array([['Jack', 'Lucy', 'Mike', 'Lee'],
       [23, 25, 18, 20],
       ['male', 'female', 'male', 'male']], dtype=object)

以上是把 dataframe 转换成 array 的几种方法,使用哪一种方法请根据实际情况选择。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas中把dataframe转成array的方法 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • win10系统下安装superset的步骤

    下面是在win10系统下安装superset的步骤攻略: 安装步骤 步骤一:安装Python Python官网下载对应版本的Python安装包,也可以通过conda安装。需要注意的是,目前superset所支持的Python版本为Python 3。安装完成后,应将python和pip(Python package installer)添加到系统的Path环境…

    python 2023年5月14日
    00
  • Pytorch 的损失函数Loss function使用详解

    Pytorch的损失函数Loss Function使用详解 在神经网络的模型训练过程中,损失函数是非常重要的一个组成部分。Pytorch作为一个深度学习框架,内置了许多常用的损失函数,可以快速地选择和使用。 1. Pytorch内置损失函数 在Pytorch中,常用的损失函数主要包括以下几种: nn.MSELoss: 均方误差损失函数,适合回归任务。 nn.…

    python 2023年5月14日
    00
  • 按列值分割Pandas数据框架

    按列值分割Pandas数据框架是数据分析中非常常用的操作,它可以将一个数据框架按照指定的列进行分割,并以此生成多个子数据框架。在这里,我将提供一个完整攻略,帮助您了解如何按列值分割Pandas数据框架。 1.导入必要的库 要按列值分割Pandas数据框架,首先需要导入必要的库,例如Pandas库和NumPy库。在Python中,可以使用以下代码导入: imp…

    python-answer 2023年3月27日
    00
  • Python Pandas常用函数方法总结

    PythonPandas常用函数方法总结 什么是Python Pandas库? Pandas是Python中的一个数据处理库,它提供了数据处理和分析的实用工具,使得数据处理更加快速和容易。Pandas主要包含两个核心数据结构:Series和DataFrame。Series用于处理单一纬度的数据,而DataFrame用于处理多维数据的表格。 Pandas常用函…

    python 2023年5月14日
    00
  • Python3.5 Pandas模块缺失值处理和层次索引实例详解

    Python3.5 Pandas模块缺失值处理和层次索引实例详解 1. 缺失值处理 在数据分析中,经常会遇到数据缺失的情况,面对缺失数据,需要进行相应的处理以保证数据的完整性和准确性。 Pandas 模块提供了很多有用的方法来处理缺失数据。下面我们就来看一下 Pandas 模块缺失值处理的实例。 (1)创建带有缺失值的 DataFrame 我们可以通过 nu…

    python 2023年6月13日
    00
  • 在pycharm中无法import所安装的库解决方案

    当使用PyCharm编写Python代码时,有时候会遇到无法导入(import)已安装的库的情况。这时候可以尝试以下几个解决方案。 1. 检查Python解释器 首先,确保正在使用正确的Python解释器。PyCharm支持在同一项目中同时使用多种Python解释器,但如果使用错误的解释器,则可能无法导入所需的库。可以通过以下步骤检查和更改Python解释器…

    python 2023年5月14日
    00
  • 使用Excel文件创建一个数据框架

    首先,需要明确数据框架的概念,它指的是一种二维的表格形式,其中每一行都是一个观测值,每一列都是一种变量。 在Excel文件中,可以通过以下步骤来创建一个数据框架: 第一步:打开Excel软件并建立一个新工作簿 在Excel中,新建一个工作簿的方法是打开软件后点击“文件”(File)->“新建”(New)。这将在屏幕上打开一个新的工作簿。 第二步:创建数…

    python-answer 2023年3月27日
    00
  • 使用pandas to_datetime与时间戳

    下面是关于使用pandas to_datetime与时间戳的完整攻略: 1. pandas to_datetime函数简介 to_datetime()函数是pandas中用来将时间格式的字符串和数值转换成时间戳的函数。在数据分析和处理过程中,需要将时间数据转换成对应的时间戳格式,方便对数据进行处理和分析,to_datetime()函数在这方面起到了重要的作用…

    python-answer 2023年3月27日
    00
合作推广
合作推广
分享本页
返回顶部