pandas.info()
函数是pandas库中的一个函数,用于显示DataFrame对象的基本信息,包括每列的名称、非空值的数量、数据类型和内存使用情况等。以下是使用pandas.info()
函数的完整攻略:
步骤1:导入pandas库
在使用pandas.info()
函数之前,需要先导入pandas库。可以使用以下代码导入pandas库:
import pandas as pd
步骤2:创建DataFrame对象
在使用pandas.info()
函数之前,需要先创建一个DataFrame对象。可以使用以下代码创建一个DataFrame对象:
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'M', 'M'],
'salary': [50000, 800, 20000, 100000]}
df = pd.DataFrame(data)
上面的代码创建了一个包含4行和4列的DataFrame对象,每列的名称分别为“name”、“age”、“gender”和“salary”。
步骤3:使用pandas.info()函数
pandas.info()
函数可以显示DataFrame对象的基本信息。可以使用以下代码调用pandas.info()
函数:
df.info()
运行上面的代码后,将会输出以下信息:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 name 4 non-null object
1 age 4 non-null int64
2 gender 4 non-null object
3 salary 4 non-null int64
dtypes: int64(2), object(2)
memory usage: 256.0+ bytes
上面的输出信息包括以下内容:
- DataFrame对象的类型(class)
- DataFrame对象的行数和列数(RangeIndex)
- 每列的名称(Data columns)
- 每列的非空值数量(Non-Null Count)
- 每列的数据类型(Dtype)
- DataFrame对象的内存使用情况(memory usage)
示例1:使用pandas.info()函数显示Titanic数据集的基本信息
以下是使用pandas.info()
函数显示Titanic数据集的基本信息的示例代码:
import pandas as pd
# 读取Titanic数据集
df = pd.read_csv('titanic.csv')
# 显示数据集的基本信息
df.info()
运行上面的代码后,将会输出以下信息:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 12 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 PassengerId 891 non-null int64
1 Survived 891 non-null int64
2 Pclass 891 non-null int64
3 Name 891 non-null object
4 Sex 891 non-null object
5 Age 714 non-null float64
6 SibSp 891 non-null int64
7 Parch 891 non-null int64
8 Ticket 891 non-null object
9 Fare 891 non-null float64
10 Cabin 204 non-null object
11 Embarked 889 non-null object
dtypes: float64(2), int64(5), object(5)
memory usage: 83.7+ KB
上面的输出信息包括以下内容:
- DataFrame对象的类型(class)
- DataFrame对象的行数和列数(RangeIndex)
- 每列的名称(Data columns)
- 每列的非空值数量(Non-Null Count)
- 每列的数据类型(Dtype)
- DataFrame对象的内存使用情况(memory usage)
示例2:使用pandas.info()函数显示Iris数据集的基本信息
以下是使用pandas.info()
函数显示Iris数据集的基本信息的示例代码:
import pandas as pd
# 读取Iris数据集
df = pd.read_csv('iris.csv')
# 显示数据集的基本信息
df.info()
运行上面的代码后,将会输出以下信息:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 150 entries, 0 to 149
Data columns (total5 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 sepal_length_cm 150 non-null float64
1 sepal_width_cm 150 non-null float64
2 petal_length_cm 150 non-null float64
3 petal_width_cm 150 non-null float64
4 species 150 non-null object
dtypes: float64(4), object(1)
memory usage: 6.0+ KB
上面的输出信息包括以下内容:
- DataFrame对象的类型(class)
- DataFrame对象的行数和列数(Index)
- 每列的名称(Data columns)
- 每列的非空值数量(Non-Null Count)
- 每列的数据类型(Dtype)
- DataFrame对象的内存使用情况(memory usage)
总结:
pandas.info()
函数用于显示DataFrame的基本信息,包括每列的名称、非空值的数量、数据类型和内存使用情况等。- 在使用
pandas.info()
函数之前,需要先导入pandas库并创建一个DataFrame对象。 - 可以使用
pandas.info()
函数显示任何DataFrame对象的基本信息,包括Titanic集和Iris数据集等。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandasinfo函数 - Python技术站