dataframe取值
在数据分析中,经常会用到一种叫做DataFrame的数据结构,这种结构可以看做是由多个Series组成的二维表格,可以类比于Excel表格中的一个工作表。在DataFrame结构中,我们需要通过索引(Index)和列(Column)来访问其中的数据。本文将简单介绍DataFrame中如何取值。
loc方法
loc方法是DataFrame中用来通过行索引和列索引来取值的方法。在loc方法中,我们需要传入两个参数,分别是行索引和列索引。
下面是一个简单的示例:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}, index=['a', 'b', 'c'])
print(df.loc['a', 'A']) # 1
print(df.loc[['a', 'b'], ['A', 'B']])
以上代码中,我们首先创建了一个包含两列的数据表格df,并给每一行指定了行索引a、b、c。接着通过df.loc['a', 'A']取出了第一行第一列(即索引为a,列名为A)的元素,输出结果为1。而通过df.loc[['a', 'b'], ['A', 'B']]则取出了第一行和第二行,并且只保留A和B两列。
iloc方法
iloc方法与loc方法类似,只不过是使用的是行号和列号来进行取值。在iloc方法中,我们同样需要传入两个参数,分别是行号和列号。
以下是一个简单的示例:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print(df.iloc[0, 0]) # 1
print(df.iloc[[0, 1], [0, 1]])
以上代码中,我们首先创建了一个包含两列的数据表格df,并通过df.iloc[0,0]取出了第一行第一列的元素,输出结果为1。而通过df.iloc[[0,1], [0,1]]则取出了第一行和第二行,并且只保留了前两列。
ix方法
ix方法是loc和iloc方法的结合,可以通过行索引或者行号来取值。在ix方法中,如果传入的是行索引,则使用loc方法,如果传入的是行号,则使用iloc方法。
下面是一个简单的示例:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}, index=['a', 'b', 'c'])
print(df.ix['a', 'A']) # 1
print(df.ix[0, 0]) # 1
以上代码中,我们首先创建了一个包含两列的数据表格df,并通过df.ix['a', 'A']取出了索引为a,列名为A的元素,输出结果为1。而通过df.ix[0,0]则取出了第一行第一列的元素,输出结果同样为1。
通过以上介绍,我们可以看出,在DataFrame中,取值操作可以使用多种方法进行。具体应该选择哪种方法,应根据实际情况来决定。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:dataframe取值 - Python技术站