Python的这些库,你知道多少?
Python拥有非常强大且丰富的标准库,此外还有众多第三方库也逐渐流行起来。在本文中,我们将介绍一些Python常用的库及其用法。
一、数据处理类库
NumPy
NumPy 是 Python 中做科学计算的基础库。它提供了数组(ndarray)这个数据结构、数组运算、整形、随机数生成等科学计算中常用的基本功能。可以说,在很多一般的数据处理任务中,NumPy 的出现一定能大大提升效率。
示例: 数组运算
代码:
import numpy as np
a = np.array([1,2,3])
b = np.array([4,5,6])
# 数组相加
c = a + b
print(c)
结果:
array([5, 7, 9])
Pandas
Pandas 是一个基于 NumPy 开发的数据分析库。它提供了一些基本的数据结构,包括 Series (类似一维数组) 和 DataFrame (类似二维表格)。Pandas 可以很好地完成对数据的清洗、加工、分析和可视化等任务。
示例: CSV文件读取
代码:
import pandas as pd
data = pd.read_csv('data.csv')
print(data.head())
结果:
id name age gender
0 1 John 23.0 M
1 2 Jane 25.0 F
2 3 Margaret 21.0 F
3 4 Peter 32.0 M
4 5 Rachel 27.0 F
二、网络爬虫类库
Requests
Requests 是 Python 中一个常用的 HTTP 库,用来发送网络请求及获取 HTTP 响应的文本等信息。它很容易上手,且可以帮助你快速实现一个小型的网页爬虫。
示例: 发送请求
代码:
import requests
response = requests.get('http://www.baidu.com')
print(response.text)
结果:
<!DOCTYPE html>
<!--STATUS OK--><html>
<head>
<meta http-equiv=content-type content="text/html;charset=utf-8">
...
</html>
Beautiful Soup
Beautiful Soup 是一个可以从 HTML 或 XML 文件中提取数据的 Python 库。它将一段 HTML 或 XML 解析为树形结构,然后你就可以利用它提供的 API 查找、遍历、修改树中的节点及数据等。在爬虫程序开发过程中,它是非常有用的。
示例: 提取网页内容
代码:
import requests
from bs4 import BeautifulSoup
response = requests.get('http://www.baidu.com')
soup = BeautifulSoup(response.text, 'html.parser')
print(soup.title)
结果:
<title>百度一下,你就知道 </title>
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python的这些库,你知道多少? - Python技术站