Python Polars库使用简介
什么是Polars库
Polars是一个开源的基于Rust编写的Python数据操作库。Polars库旨在使数据操作更快、更可靠和更易于使用。它的灵感来自于Pandas,并使用了类似于Numpy和Pandas的数据模型。
安装Polars库
要安装Polars库,可以使用pip命令,如下所示:
pip install polars
创建Series对象
要创建一个Series对象,可以使用pl.Series
方法。示例代码如下:
import polars as pl
# 创建Series对象
s = pl.Series("a", [1, 2, 3, 4])
print(s)
输出结果如下:
shape: (4,)
Series: 'a' [i64]
[
1
2
3
4
]
创建DataFrame对象
要创建一个DataFrame对象,可以使用pl.DataFrame
方法。示例代码如下:
import polars as pl
# 创建DataFrame对象
df = pl.DataFrame({
"a": [1, 2, 3, 4],
"b": ["foo", "bar", "baz", "qux"]
})
print(df)
输出结果如下:
shape: (4, 2)
╭─────┬───────╮
│ a ┆ b │
│ --- ┆ --- │
│ i64 ┆ str │
╞═════╪═══════╡
│ 1 ┆ "foo" │
│ 2 ┆ "bar" │
│ 3 ┆ "baz" │
│ 4 ┆ "qux" │
╰─────┴───────╯
选择数据
要选择DataFrame对象的数据,可以使用[]
和.select
方法。示例代码如下:
import polars as pl
# 创建DataFrame对象
df = pl.DataFrame({
"a": [1, 2, 3, 4],
"b": ["foo", "bar", "baz", "qux"]
})
# 选择a列
a = df["a"]
print(a)
# 选择a,b列
a_b = df.select(["a", "b"])
print(a_b)
输出结果如下:
shape: (4,)
Series: 'a' [i64]
[
1
2
3
4
]
shape: (4, 2)
╭─────┬───────╮
│ a ┆ b │
│ --- ┆ --- │
│ i64 ┆ str │
╞═════╪═══════╡
│ 1 ┆ "foo" │
│ 2 ┆ "bar" │
│ 3 ┆ "baz" │
│ 4 ┆ "qux" │
╰─────┴───────╯
数据过滤
要根据条件过滤DataFrame对象的数据,可以使用&
或|
符号进行逻辑运算。示例代码如下:
import polars as pl
# 创建DataFrame对象
df = pl.DataFrame({
"a": [1, 2, 3, 4],
"b": ["foo", "bar", "baz", "qux"]
})
# 根据条件过滤数据
filtered = df[(df["a"] > 1) & (df["b"] != "foo")]
print(filtered)
输出结果如下:
shape: (2, 2)
╭─────┬─────╮
│ a ┆ b │
│ --- ┆ --- │
│ i64 ┆ str │
╞═════╪═════╡
│ 2 ┆ "bar"│
│ 3 ┆ "baz"│
╰─────┴─────╯
总结
Polars库是一个快速、可靠和易于使用的数据操作库,可以使用常见的数据模型和操作方法进行数据操作。在实际项目中,Polars库可以在数据处理和分析方面提供帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python Polars库的使用简介 - Python技术站