王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

《乘风破浪的姐姐3》王心凌一骑绝尘,破收视率,多年后再次全网爆火,某音截止现在差不多3500W粉丝,五月份热门女星排名,吊打其它所有人,不愧是我女神!

但是这个热度,感觉她的歌曲和MV,已经离收费越来越近了,于是我连夜用Python把所有MV 和歌曲离线,今天先给大家分享MV的方法。

女神镇楼!

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

话不多说,我们开冲!

步骤分析

一、数据来源分析

1、首先我们确定自己的需求,什么网站,获取什么数据。

以酷我为例,直接打开酷我搜索王心凌,点击MV。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

然后我们通过开发者工具进行抓包分析,分析我们想要的数据来自于哪里。

直接点击第一个,然后右键点击检查,或者直接按F12 打开开发者工具,然后点击network ,点击AII ,然后我们看到的是这样的页面。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

这个时候是没有数据的,所以我们需要刷新一下。

现在数据就出来了

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

每个视频都有自己的编号,我们可以在地址栏看到,这个视频的编号是89622

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

我们在开发者工具找到对应的目录,在network → AII 里第一个就是。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

或者直接点左上角的搜索工具,或者直接 Ctrl+f 打开搜索框,输入序号进行搜索。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

第一个就是,或者搜索对应的标题也可以找到相关数据。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

然后再这里找到我们需要的 Cookie 、Referer 、url 等等数据。

代码展示

本文代码实现的基本四大步骤

1. 发送请求, 模拟浏览器对于url网址发送请求  <专门定义函数来发送请求>
2. 获取数据, 获取网页源代码
3. 解析数据, 提取我们想要数据内容 <视频信息以及视频标题>
4. 保存数据, 把视频内容保存本地

1、首先导入需要用的模块

import requests
import re

 

requests 是第三方模块,需要手动安装一下。

键盘按住 win+r 输入 cmd 确定,弹出命令提示符窗口,输入 pip install requests 回车安装即可。

不会的可以看我置顶文章,有专门介绍,或者加文章底部直接联系我。

2、发送请求

模拟浏览器对于url网址发送请求 <专门定义函数来发送请求>

headers = {
    'Cookie': '_ga=GA1.2.1259590012.1628168238; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1655356984; _gid=GA1.2.1126000694.1655356984; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1655357023; _gat=1; kw_token=XBR2CWDG9IP',
    'Host': 'www.kuwo.cn',
    'Referer': 'http://www.kuwo.cn/search/list?key=%E9%99%88%E5%A5%95%E8%BF%85',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36',
}
url = 'http://www.kuwo.cn/mvplay/89622'
response = requests.get(url=url, headers=headers)

# Python学习交流群  279199867

 

这些数据的话,都在开发者工具里面获取,还记得前面讲的步骤吗?

Cookie、Host 、Referer 、 User-Agent 这些数据找到后,直接复制下来,Referer是防盗链,没看到的话不用写。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 url 在第一个

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

对应的标签需要加上引号,把复制下来的内容变成字典格式。

然后通过 response 对网站发送请求

print 打印一下

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

<Response [200]>: 请求成功

3、获取数据

html_data = response.text
print(html_data)
# Python学习交流群 279199867

 

打印一下看看获取到的数据

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

4、解析数据

.*?匹配任意字符 n 换行除外

video_url = re.findall('src:"(.*?)"}]', html_data)[0]
video_url = video_url.replace('\u002F', '/')
video_data = requests.get(url=video_url).content

 

5、保存数据

with open('爱你.mp4', mode='wb') as f:
    f.write(video_data)

 

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

就可以开始愉快的欣赏女神了!

这里我只是做了单个获取,多个爬取和多页爬取我专门录了视频,文中可以获取。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线 - Python技术站

(0)
上一篇 2023年4月2日 下午5:28
下一篇 2023年4月2日 下午5:28

相关文章

  • 利用Python生成随机密码,灰常简单

    兄弟们,今天我们来用Python生成随机密码试试~ 知识点 文件读写 基础语法 字符串处理 字符拼接   代码解析 导入模块 import platform import string import random # 我还给大家准备了这些资料:Python视频教程、100本Python电子书、基础、爬虫、数据分析、web开发、机器学习、人工智能、面试题、Py…

    Python开发 2023年4月2日
    00
  • 用Python写一个自动下载B站视频、弹幕、评论的软件

    哈喽兄弟们,今天来实现一个Python采集视频、弹幕、评论与一体的小软件。 平常咱们都是直接代码运行,不过今天我们做成软件,这样的话,咱们不仅能自己用,还能分享给小伙伴,女朋友一起使用。 内容有点多,拿好小本本,做好笔记,发车了~ 效果展示 我们先来看看效果,全部代码文末获取。 整体界面 我随便找个视频下载一下 弹幕和评论我都顺便下载了 有一说一,确实方便,…

    Python开发 2023年4月2日
    00
  • 为了防止这个公众号被封,我连夜用Python爬取了它所有图片~

    哈喽兄弟们,今天来试试批量获取公众号文章,emmm…     虽然名义上是文章,单其实它是一篇纯图片文,至于为什么不是文字,小姐姐不比文字香?     事前准备     我们需要用到 Fiddler Everywhere 这个软件,Crack是本次要使用到的文件,以及要安装微信PC版客户端,我专门录了一个安装 及使用的教程。 本次使用的是Python3.8 …

    2023年4月2日
    00
  • 不怕新歌有多嗨,就怕老歌带DJ,用Python批量下载dj歌曲!

    俗话说,不怕新歌有多嗨,就怕老歌带dj,为了验证这句话,于是我直接找了个dj网,用Python把dj都下载下来,亲身体验一下! 环境模块 软件 Python3.8 pycharm2021   模块 import requests import re   requests是数据请求模块,第三方模块,需要手动安装一下,win+r打开运行框,输入cmd按回车,然后…

    2023年4月2日
    00
  • Python丨听说这个地方的漫画不错,只用40行代码,给它全部爬下来

    前因后果 公司新来的小姐姐,超级喜欢看漫画,天天给我介绍,好烦~ 现在是2022年9月15日16点30,于是我决定, 五点下班前写个代码把她说的漫画全部爬下来,应付一下~ 再发篇文章揭露她的罪恶,嘿嘿~ 准备事项 环境使用 Python 3.8 Pycharm 2021.2版本   模块使用 import requests >>> # 数据…

    Python开发 2023年4月2日
    00
  • 利用Python自动生成请假条

    哈喽兄弟们,今天咱们来实现用Python来批量生成请假条,这回既学了东西又做了事情,两不误~ 本文就将基于一个真实的办公案例进行讲解如何提取Excel内容并创建Word 主要将涉及以下三个知识点 openpyxl 读取 Excel 文件 python-docx 写入 Word 文件 python-docx 各类样式的设计和调整 需求描述 你是公司的底层小虾米…

    Python开发 2023年4月2日
    00
  • 重温Python基础——变量

    哈喽兄弟们,今天我们来复习下变量。 首先尝试在一个hello_world.py文件中使用变量,在文件开头添加一行代码,并对第二行代码进行修改,如下所示: message=”hello world” print(message) # Python源码/教程领取扣君羊:279199867 运行这个程序,会与 print(“hello world”) 相同。 我们…

    Python开发 2023年4月2日
    00
  • 重温Python基础——列表

    哈喽,兄弟们,今天让我们一起来重温一下Python基础中的列表,看看你还记得多少呢? 列表是什么 列表有一系列特定顺序排列的元素组成。可以包含字母表中的所有字母,数字等。其中的元素之间可以没有任何联系,列表通常包含多种元素。 在Python中用方括号([])表示列表,用逗号分隔其中的元素。 a=[‘wo’,’ai’,’xue’,’xi’,13,14]   访…

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部