Series和DataFrame是Pandas库中两个最为基础和最为重要的数据结构,对于Pandas的使用者来说,掌握它们的使用方法相当重要。本文将从如何创建Series和DataFrame、如何对它们进行操作等方面,为大家提供一份基础入门攻略。
1. Series
1.1 创建Series
在Pandas中,可以通过列表、数组、字典等方式创建Series。下面以列表为例,介绍一下如何创建Series:
import pandas as pd
data = [10, 20, 30, 40, 50]
s = pd.Series(data)
print(s)
输出结果为:
0 10
1 20
2 30
3 40
4 50
dtype: int64
1.2 Series的基本操作
一旦创建了Series,就可以对它进行一些基本的操作了,比如:
1.2.1 访问元素
可以通过下标的方式访问Series中的元素:
print(s[0]) # 输出 10
print(s[3]) # 输出 40
1.2.2 切片
可以通过切片的方式访问Series中的一段数据:
print(s[1:4]) # 输出 [20, 30, 40]
1.2.3 运算
可以对Series进行各种运算,比如加、减、乘、除等:
s1 = pd.Series([1, 2, 3, 4])
s2 = pd.Series([4, 3, 2, 1])
print(s1 + s2) # 输出 [5, 5, 5, 5]
print(s1 - s2) # 输出 [-3, -1, 1, 3]
print(s1 * s2) # 输出 [4, 6, 6, 4]
print(s1 / s2) # 输出 [0.25, 0.6666666666666666, 1.5, 4.0]
2. DataFrame
2.1 创建DataFrame
与Series类似,可以通过列表、数组、字典等方式创建DataFrame。下面以字典为例,介绍一下如何创建DataFrame:
import pandas as pd
data = {
'name': ['小明', '小红', '小刚'],
'age': [18, 19, 20],
'gender': ['male', 'female', 'male']
}
df = pd.DataFrame(data)
print(df)
输出结果为:
name age gender
0 小明 18 male
1 小红 19 female
2 小刚 20 male
2.2 DataFrame的基本操作
一旦创建了DataFrame,就可以对它进行一些基本的操作了,比如:
2.2.1 访问列
可以通过列名的方式访问DataFrame中的一列:
print(df['name'])
输出结果为:
0 小明
1 小红
2 小刚
Name: name, dtype: object
#### 2.2.2 访问行
可以通过下标的方式访问DataFrame中的一行:
```python
print(df.iloc[1])
输出结果为:
name 小红
age 19
gender female
Name: 1, dtype: object
#### 2.2.3 切片
可以通过切片的方式访问DataFrame中的一部分数据:
```python
print(df.iloc[1:3])
输出结果为:
name age gender
1 小红 19 female
2 小刚 20 male
#### 2.2.4 运算
可以对DataFrame进行各种运算,比如加、减、乘、除等:
```python
df1 = pd.DataFrame({'a': [1, 2, 3], 'b': [4, 5, 6], 'c': [7, 8, 9]})
df2 = pd.DataFrame({'a': [2, 3, 4], 'b': [5, 6, 7], 'c': [8, 9, 10]})
print(df1 + df2)
输出结果为:
a b c
0 3 9 15
1 5 11 17
2 7 13 19
```
总结
通过以上的介绍,相信大家已经掌握了如何使用Pandas库中的两个重要数据结构:Series和DataFrame。在实际应用中,我们还可以通过其他方式,比如读取CSV或者Excel文件,来创建DataFrame。掌握了基本的使用方法后,相信大家可以在Pandas中愉快地处理数据了。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Series和DataFrame使用简单入门 - Python技术站