王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

《乘风破浪的姐姐3》王心凌一骑绝尘,破收视率,多年后再次全网爆火,某音截止现在差不多3500W粉丝,五月份热门女星排名,吊打其它所有人,不愧是我女神!

但是这个热度,感觉她的歌曲和MV,已经离收费越来越近了,于是我连夜用Python把所有MV 和歌曲离线,今天先给大家分享MV的方法。

女神镇楼!

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

话不多说,我们开冲!

步骤分析

一、数据来源分析

1、首先我们确定自己的需求,什么网站,获取什么数据。

以酷我为例,直接打开酷我搜索王心凌,点击MV。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

然后我们通过开发者工具进行抓包分析,分析我们想要的数据来自于哪里。

直接点击第一个,然后右键点击检查,或者直接按F12 打开开发者工具,然后点击network ,点击AII ,然后我们看到的是这样的页面。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

这个时候是没有数据的,所以我们需要刷新一下。

现在数据就出来了

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

每个视频都有自己的编号,我们可以在地址栏看到,这个视频的编号是89622

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

我们在开发者工具找到对应的目录,在network → AII 里第一个就是。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

或者直接点左上角的搜索工具,或者直接 Ctrl+f 打开搜索框,输入序号进行搜索。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

第一个就是,或者搜索对应的标题也可以找到相关数据。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

然后再这里找到我们需要的 Cookie 、Referer 、url 等等数据。

代码展示

本文代码实现的基本四大步骤

1. 发送请求, 模拟浏览器对于url网址发送请求  <专门定义函数来发送请求>
2. 获取数据, 获取网页源代码
3. 解析数据, 提取我们想要数据内容 <视频信息以及视频标题>
4. 保存数据, 把视频内容保存本地

1、首先导入需要用的模块

import requests
import re

 

requests 是第三方模块,需要手动安装一下。

键盘按住 win+r 输入 cmd 确定,弹出命令提示符窗口,输入 pip install requests 回车安装即可。

不会的可以看我置顶文章,有专门介绍,或者加文章底部直接联系我。

2、发送请求

模拟浏览器对于url网址发送请求 <专门定义函数来发送请求>

headers = {
    'Cookie': '_ga=GA1.2.1259590012.1628168238; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1655356984; _gid=GA1.2.1126000694.1655356984; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1655357023; _gat=1; kw_token=XBR2CWDG9IP',
    'Host': 'www.kuwo.cn',
    'Referer': 'http://www.kuwo.cn/search/list?key=%E9%99%88%E5%A5%95%E8%BF%85',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36',
}
url = 'http://www.kuwo.cn/mvplay/89622'
response = requests.get(url=url, headers=headers)

# Python学习交流群  279199867

 

这些数据的话,都在开发者工具里面获取,还记得前面讲的步骤吗?

Cookie、Host 、Referer 、 User-Agent 这些数据找到后,直接复制下来,Referer是防盗链,没看到的话不用写。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 url 在第一个

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

对应的标签需要加上引号,把复制下来的内容变成字典格式。

然后通过 response 对网站发送请求

print 打印一下

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

<Response [200]>: 请求成功

3、获取数据

html_data = response.text
print(html_data)
# Python学习交流群 279199867

 

打印一下看看获取到的数据

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

4、解析数据

.*?匹配任意字符 n 换行除外

video_url = re.findall('src:"(.*?)"}]', html_data)[0]
video_url = video_url.replace('\u002F', '/')
video_data = requests.get(url=video_url).content

 

5、保存数据

with open('爱你.mp4', mode='wb') as f:
    f.write(video_data)

 

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

就可以开始愉快的欣赏女神了!

这里我只是做了单个获取,多个爬取和多页爬取我专门录了视频,文中可以获取。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线 - Python技术站

(0)
上一篇 2023年4月2日 下午5:28
下一篇 2023年4月2日 下午5:28

相关文章

  • Python实现人脸识别

    哈喽兄弟们,今天实现一下人脸识别。 先问大家一个问题什么是百度Aip模块? 百度AI平台提供了很多的API接口供开发者快速的调用运用在项目中本文写的是使用百度AI的在线接口SDK模块(baidu-aip)进行实现人脸识别 除了人脸识别,其他api功能的调用也同理。 准备工作 本机环境 系统:win11Python版本:3.9.7编辑器:VS2022 安装ba…

    Python开发 2023年4月2日
    00
  • 14个Python处理Excel的常用操作,我先试过了,非常好用

    自从学了Python后就逼迫用Python来处理Excel,所有操作用Python实现。目的是巩固Python,与增强数据处理能力。这也是我写这篇文章的初衷。废话不说了,直接进入正题。 数据是网上找到的销售数据,长这样: 一、关联公式:Vlookup vlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。所以我先把这张表分为两个表。 df1…

    Python开发 2023年3月31日
    00
  • 2022 IEEE 编程语言榜单发布!Python 又双叒叕霸榜了,学 SQL 工作更吃香!

    哈喽兄弟们! 近年来,Python 宛如一匹黑马,一骑绝尘,横扫 TIOBE、Stack Overflow 等榜单,如今在 IEEE Spectrum 发布的第九届年度顶级编程语言榜单中,Python 依然是 C、C++、C#、Java 等老牌语言无法比拟的。 关于编程语言的优劣,众说纷纭。不过,在今年这份报告中,我们也发现了一个让人出乎意料的结果,即根据就…

    Python开发 2023年4月2日
    00
  • 过年不让放炮,我用Python实现了1000响大地红的特效

    兄弟们,马上(还有13天)就要过年啦,今年能带对象回家了吗哈哈哈 新的一年,新的气象,穿上新衣准备过大年… 俗话说得好,这所谓放鞭炮就是来压邪祟,除恶的,但是近几年来都不让放炮了,搞得没有一点年尾,不过还好,2023年改革新政策!!!有一部分城市可以进行放鞭炮啦! 在新的一年里祝大家1、六六大顺,七星高照。2、新年快乐,龙马精神。3、官运亨通,美梦连连。4、…

    Python开发 2023年3月31日
    00
  • 当我把用Python做的课堂点名系统献给各科老师后,再也没挂过科

    刚上大学的表弟问我,大学准备好好玩玩,问我有没有什么不挂科的秘诀。 哎,这可就问对人了,要想不挂科,先把老师贿赂好,当然,咱们说的贿赂不是送钱啥的,这不是侮辱老师吗? 于是我连夜给表弟写了一个课堂点名系统,让他给每个任课老师都送一遍,方便老师就是方便自己,嘿嘿~ 准备工作 首先我们需要准备好点名的姓名文件,使用的时候导入进去就可以开始点名了。 新建一个文本文…

    Python开发 2023年4月2日
    00
  • 用Python做了一个法律查询小工具,非常好用

    哈喽兄弟,今天给大家分享一个Python tkinter制作法律查询小工具。 光爬虫大家也只能自己用用,就算打包了exe,运行也不好看,那我们直接写成界面。 当我们想了解法律,但是又不想买书的时候,就可以用这个小工具,慢慢查询了解。 当然,如果想整的比较有意思,就得靠大家自己来完善实现了。 效果展示 我们来看看效果     写的比较简陋,大家不要太在意。 再…

    2023年3月31日
    00
  • 用python将网上的文章转存为PDF文档,保存电脑上慢慢看

    我们有时候看到一篇好的文章,想去保存下来,传统方式一般是收藏书签、复制粘贴到文档或者直接复制链接保存,但这样一次两次还好,数量多了,比较麻烦不说,还可能不好找~ 这个时候,Python的作用就来了,直接抓下来导出为PDF,直接把整个网站的内容都导下来都行~ 话不多说,我们直接上代码! import requests import parsel import …

    Python开发 2023年4月2日
    00
  • python移除列表中的重复元素

    所谓基础不牢,地动山摇,咱们基础学完了,但是要温故而知新。     涉及知识点 python 遍历列表 python 集合 set python 方法调用 代码解析 咱们通过遍历和集合两个方式来实现 首先导入使用的模块 import platform # Python学习交流群:279199867 # 进群后可领取海量:Python视频教程、100本Pyth…

    2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部