以下是关于Python3使用requests包抓取并保存网页源码的方法的攻略:
Python3使用requests包抓取并保存网页源码的方法
在Python3中,可以使用requests包抓取网页源码,并将其保存到本地文件中。是Python3使用requests包抓取并保存网页源码的方法的攻略。
使用requests包抓取网页源码
使用requests包可以轻松抓取网页源码。以下是使用requests包抓取网页源码的示例:
import requests
url = 'https://www.example.com'
response = requests.get(url)
html = response.text
print(html)
在上面的示例中,我们使用requests包发送了一个GET请求到https://www.example.com,并使用text属性获取响应内容。
将网页源码保存到本地文件
使用Python3内置的文件操作函数,可以将网页源码保存到本地文件中。以下是将网页源码保存到本地文件的示例:
import requests
url = 'https://www.example.com'
response = requests.get(url)
html = response.text
with open('example.html', 'w', encoding='utf-8') as f:
f.write(html)
在上面的示例中,我们使用requests包发送了一个GET请求到https://www.example.com,并使用text属性获取响应内容。然后,我们使用with语句打开文件example.html,并使用write方法将网页源码写入文件中。
将网页源码保存到本地文件(二进制)
如果需要将网页源码保存为二进制文件,可以使用二进制模式打开文件,并使用content属性获取响应内容。以下是将网页源码保存为二进制文件的示例:
import requests
url = 'https://www.example.com'
response = requests.get(url)
content = response.content
with open('example.bin', 'wb') as f:
f.write(content)
在上面的示例中,我们使用requests包发送了一个GET请求到https://www.example.com,并使用content属性获取响应内容。然后,我们使用with语句打开文件example.bin,并使用write方法将二进制内容写入文件中。
以上是Python3使用requests包抓取并保存网页源码的方法的攻略,希望对您有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python3使用requests包抓取并保存网页源码的方法 - Python技术站