pandasinfo函数

yizhihongxing

pandas.info()函数是pandas库中的一个函数,用于显示DataFrame对象的基本信息,包括每列的名称、非空值的数量、数据类型和内存使用情况等。以下是使用pandas.info()函数的完整攻略:

步骤1:导入pandas库

在使用pandas.info()函数之前,需要先导入pandas库。可以使用以下代码导入pandas库:

import pandas as pd

步骤2:创建DataFrame对象

在使用pandas.info()函数之前,需要先创建一个DataFrame对象。可以使用以下代码创建一个DataFrame对象:

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M'],
        'salary': [50000, 800, 20000, 100000]}
df = pd.DataFrame(data)

上面的代码创建了一个包含4行和4列的DataFrame对象,每列的名称分别为“name”、“age”、“gender”和“salary”。

步骤3:使用pandas.info()函数

pandas.info()函数可以显示DataFrame对象的基本信息。可以使用以下代码调用pandas.info()函数:

df.info()

运行上面的代码后,将会输出以下信息:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 4 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   name    4 non-null      object
 1   age     4 non-null      int64 
 2   gender  4 non-null      object
 3   salary  4 non-null      int64 
dtypes: int64(2), object(2)
memory usage: 256.0+ bytes

上面的输出信息包括以下内容:

  • DataFrame对象的类型(class)
  • DataFrame对象的行数和列数(RangeIndex)
  • 每列的名称(Data columns)
  • 每列的非空值数量(Non-Null Count)
  • 每列的数据类型(Dtype)
  • DataFrame对象的内存使用情况(memory usage)

示例1:使用pandas.info()函数显示Titanic数据集的基本信息

以下是使用pandas.info()函数显示Titanic数据集的基本信息的示例代码:

import pandas as pd

# 读取Titanic数据集
df = pd.read_csv('titanic.csv')

# 显示数据集的基本信息
df.info()

运行上面的代码后,将会输出以下信息:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 12 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   PassengerId  891 non-null    int64  
 1   Survived     891 non-null    int64  
 2   Pclass       891 non-null    int64  
 3   Name         891 non-null    object 
 4   Sex          891 non-null    object 
 5   Age          714 non-null    float64
 6   SibSp        891 non-null    int64  
 7   Parch        891 non-null    int64  
 8   Ticket       891 non-null    object 
 9   Fare         891 non-null    float64
 10  Cabin        204 non-null    object 
 11  Embarked     889 non-null    object 
dtypes: float64(2), int64(5), object(5)
memory usage: 83.7+ KB

上面的输出信息包括以下内容:

  • DataFrame对象的类型(class)
  • DataFrame对象的行数和列数(RangeIndex)
  • 每列的名称(Data columns)
  • 每列的非空值数量(Non-Null Count)
  • 每列的数据类型(Dtype)
  • DataFrame对象的内存使用情况(memory usage)

示例2:使用pandas.info()函数显示Iris数据集的基本信息

以下是使用pandas.info()函数显示Iris数据集的基本信息的示例代码:

import pandas as pd

# 读取Iris数据集
df = pd.read_csv('iris.csv')

# 显示数据集的基本信息
df.info()

运行上面的代码后,将会输出以下信息:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 150 entries, 0 to 149
Data columns (total5 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   sepal_length_cm   150 non-null    float64
 1   sepal_width_cm    150 non-null    float64
 2   petal_length_cm   150 non-null    float64
 3   petal_width_cm    150 non-null    float64
 4   species           150 non-null    object 
dtypes: float64(4), object(1)
memory usage: 6.0+ KB

上面的输出信息包括以下内容:

  • DataFrame对象的类型(class)
  • DataFrame对象的行数和列数(Index)
  • 每列的名称(Data columns)
  • 每列的非空值数量(Non-Null Count)
  • 每列的数据类型(Dtype)
  • DataFrame对象的内存使用情况(memory usage)

总结:

  • pandas.info()函数用于显示DataFrame的基本信息,包括每列的名称、非空值的数量、数据类型和内存使用情况等。
  • 在使用pandas.info()函数之前,需要先导入pandas库并创建一个DataFrame对象。
  • 可以使用pandas.info()函数显示任何DataFrame对象的基本信息,包括Titanic集和Iris数据集等。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandasinfo函数 - Python技术站

(0)
上一篇 2023年5月7日
下一篇 2023年5月7日

相关文章

  • C++实现LeetCode(86.划分链表)

    C++实现LeetCode(86.划分链表)完整攻略 问题描述 给定一个链表和一个特定值$x$,对于链表中的所有小于$x$的节点,排列在大于或等于$x$的节点之前。同时保留链表节点的初始相对顺序。 例如,给定的链表是1->4->3->2->5->2, 给定的值是$3$。那么,目标答案是1->2->2->4-&g…

    other 2023年6月27日
    00
  • ASP:ActiveX不能创建Scripting.FileSystemObject对象解决办法

    以下是关于解决ASP中ActiveX不能创建Scripting.FileSystemObject对象的完整攻略: ASP: ActiveX不能创建Scripting.FileSystemObject对象解决办法 在ASP中,有时候会遇到ActiveX不能创建Scripting.FileSystemObject对象的问题。这通常是由于安全设置或权限问题导致的。…

    other 2023年10月15日
    00
  • Jenkins初级应用之Invoke Phing targets插件配置

    下面是“Jenkins初级应用之Invoke Phing targets插件配置”的完整攻略。 插件介绍 首先,我们需要了解一下插件的功能和作用。Invoke Phing targets插件是Jenkins中的一个插件,它可以帮助我们把Phing的targets(任务)集成到Jenkins中,并在构建项目时自动执行Phing任务。这个插件的安装非常简单,在J…

    other 2023年6月27日
    00
  • Github如何在Linux系统下创建本地仓库

    Github如何在Linux系统下创建本地仓库的完整攻略 本文将为您详细讲解如何在Linux系统下创建本地仓库并将其上传到Github,包括环境搭建、仓库创建、本地仓库初始化、本地仓库提交和上传到Github等步骤。 环境搭建 在开始创建本地仓库之前,需要先在Linux系统中安装Git。可以使用以下命令进行安装: sudo apt-get update su…

    other 2023年5月6日
    00
  • FreeRTOS实时操作系统Cortex-M内核使用注意事项

    FreeRTOS概述 FreeRTOS是一个开源的实时操作系统,广泛应用于单片机、微处理器或DSP等嵌入式系统中,可用于控制器、网络设备、家庭自动化等多种应用场景。FreeRTOS支持多任务处理和多线程处理,能够有效地优化嵌入式系统的资源利用和功耗管理。 Cortex-M内核使用注意事项 在使用FreeRTOS实时操作系统时,需要注意以下几点: 2.1 中断…

    other 2023年6月27日
    00
  • Qt实现网络聊天室的示例代码

    下面是使用Qt实现网络聊天室的完整攻略。 简介 Qt是一款跨平台的C++开发框架,它提供了丰富的GUI界面开发组件和网络编程组件,可以轻松开发跨平台的图形化应用程序和网络应用程序。 网络编程是Qt框架的一个重要组成部分,Qt提供了QTcpServer、QTcpSocket、QUdpSocket等网络编程组件,这些组件可以方便地实现基于TCP协议和UDP协议的…

    other 2023年6月27日
    00
  • 关于java:如何使用java_opts环境变量?

    下面是关于“关于java:如何使用java_opts环境变量?”的完整攻略: 1. Java_opts环境变量简介 Java_opts环变量是一个用于设置Java虚拟机(JVM)选项的环境变量。Java_opts环境变量可以用于设置JVM的堆大小、栈大小、垃圾回收器等选项,以及其他一些应用程序的选项。 2. 设置Java_opts环境变量 在Windows系…

    other 2023年5月7日
    00
  • htmlref标签

    HTML ref标签详细使用方法 HTML中的ref标签可以用于创建外部资源的引用,例如文献、书籍、网站等。在本文中,我们将介绍ref标签详细使用方法。 步骤 以下是使用ref标签的步骤: 编写HTML代码。 使用ref标签创建外部资源的引用。 配置ref标签的属性。 示例 以下是两个示例,演示如何使用ref标签。 示例1:创建文献引用 在此示例中,我们将创…

    other 2023年5月6日
    00
合作推广
合作推广
分享本页
返回顶部