下面是Python常见的pandas用法demo示例的攻略:
pandas的基本操作
导入pandas库
import pandas as pd
读取数据
df = pd.read_csv('data.csv')
观察数据
df.head() # 查看前五行
df.tail() # 查看后五行
df.shape # 查看行列数
数据清洗
df = df.dropna() # 删除有空值的行
df = df.drop_duplicates() # 删除重复行
df['date'] = pd.to_datetime(df['date']) # 把日期列转换为日期格式
df['age'] = df['age'].astype(int) # 把年龄列转换为整数型
df['income'] = df['income'].str.replace(',', '').astype(float) # 把收入列转换为浮点型
数据分析
df.describe() # 查看数据的基本统计信息
df.groupby('gender').mean() # 按性别分组,并计算平均值
df.corr() # 计算各列的相关系数矩阵
示例一——读取Excel文件
读取Excel文件
df = pd.read_excel('data.xlsx')
数据清洗
df = df.dropna() # 删除有空值的行
df = df.drop_duplicates() # 删除重复行
df['date'] = pd.to_datetime(df['date']) # 把日期列转换为日期格式
df['age'] = df['age'].astype(int) # 把年龄列转换为整数型
df['income'] = df['income'].str.replace(',', '').astype(float) # 把收入列转换为浮点型
数据分析
df.describe() # 查看数据的基本统计信息
df.groupby('gender').mean() # 按性别分组,并计算平均值
df.corr() # 计算各列的相关系数矩阵
示例二——数据可视化
导入Matplotlib库
import matplotlib.pyplot as plt
绘制柱状图
df.groupby('gender')['income'].mean().plot(kind='bar')
plt.title('Average Income by Gender')
plt.xlabel('Gender')
plt.ylabel('Income')
绘制折线图
df.groupby('date')['income'].sum().plot(kind='line')
plt.title('Total Income by Date')
plt.xlabel('Date')
plt.ylabel('Total Income')
希望这些示例能够帮助你更好地理解和运用pandas库。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python常见的pandas用法demo示例 - Python技术站