绘制Groupby对象中每个组的大小是一项基本的数据分析任务,在Pandas中可以通过多种方式实现。下面是具体步骤:
1.导入Pandas库并读入数据集
import pandas as pd
data = pd.read_csv("data.csv")
2.使用groupby()方法按照指定的列分组
grouped = data.groupby("column_name")
3.使用size()方法获取每个组的大小
group_size = grouped.size()
4.将数据存储在DataFrame中并重命名列名
df = pd.DataFrame(group_size.reset_index(name = 'group_size'))
5.使用Matplotlib绘制柱状图
import matplotlib.pyplot as plt
plt.bar(df['column_name'], df['group_size'])
plt.xlabel('Groups')
plt.ylabel('Size')
plt.show()
这里是一个示例:
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据集
data = pd.read_csv("data.csv")
# 按照指定列分组
grouped = data.groupby("gender")
# 获取每个组的大小
group_size = grouped.size()
# 存储数据在DataFrame中并重命名列名
df = pd.DataFrame(group_size.reset_index(name = 'group_size'))
# 绘制柱状图
plt.bar(df['gender'], df['group_size'])
plt.xlabel('Gender')
plt.ylabel('Size')
plt.show()
该示例中,我们根据数据集中的“gender”列进行分组,并得到每个组的大小,然后将数据存储在DataFrame中并在Matplotlib中绘制了柱状图,这样我们可以很清楚地看到每个组的大小。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:在Pandas中绘制Groupby对象中每个组的大小 - Python技术站