王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

《乘风破浪的姐姐3》王心凌一骑绝尘,破收视率,多年后再次全网爆火,某音截止现在差不多3500W粉丝,五月份热门女星排名,吊打其它所有人,不愧是我女神!

但是这个热度,感觉她的歌曲和MV,已经离收费越来越近了,于是我连夜用Python把所有MV 和歌曲离线,今天先给大家分享MV的方法。

女神镇楼!

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

话不多说,我们开冲!

步骤分析

一、数据来源分析

1、首先我们确定自己的需求,什么网站,获取什么数据。

以酷我为例,直接打开酷我搜索王心凌,点击MV。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

然后我们通过开发者工具进行抓包分析,分析我们想要的数据来自于哪里。

直接点击第一个,然后右键点击检查,或者直接按F12 打开开发者工具,然后点击network ,点击AII ,然后我们看到的是这样的页面。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

这个时候是没有数据的,所以我们需要刷新一下。

现在数据就出来了

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

每个视频都有自己的编号,我们可以在地址栏看到,这个视频的编号是89622

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

我们在开发者工具找到对应的目录,在network → AII 里第一个就是。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

或者直接点左上角的搜索工具,或者直接 Ctrl+f 打开搜索框,输入序号进行搜索。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

第一个就是,或者搜索对应的标题也可以找到相关数据。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

然后再这里找到我们需要的 Cookie 、Referer 、url 等等数据。

代码展示

本文代码实现的基本四大步骤

1. 发送请求, 模拟浏览器对于url网址发送请求  <专门定义函数来发送请求>
2. 获取数据, 获取网页源代码
3. 解析数据, 提取我们想要数据内容 <视频信息以及视频标题>
4. 保存数据, 把视频内容保存本地

1、首先导入需要用的模块

import requests
import re

 

requests 是第三方模块,需要手动安装一下。

键盘按住 win+r 输入 cmd 确定,弹出命令提示符窗口,输入 pip install requests 回车安装即可。

不会的可以看我置顶文章,有专门介绍,或者加文章底部直接联系我。

2、发送请求

模拟浏览器对于url网址发送请求 <专门定义函数来发送请求>

headers = {
    'Cookie': '_ga=GA1.2.1259590012.1628168238; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1655356984; _gid=GA1.2.1126000694.1655356984; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1655357023; _gat=1; kw_token=XBR2CWDG9IP',
    'Host': 'www.kuwo.cn',
    'Referer': 'http://www.kuwo.cn/search/list?key=%E9%99%88%E5%A5%95%E8%BF%85',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36',
}
url = 'http://www.kuwo.cn/mvplay/89622'
response = requests.get(url=url, headers=headers)

# Python学习交流群  279199867

 

这些数据的话,都在开发者工具里面获取,还记得前面讲的步骤吗?

Cookie、Host 、Referer 、 User-Agent 这些数据找到后,直接复制下来,Referer是防盗链,没看到的话不用写。

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 url 在第一个

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

对应的标签需要加上引号,把复制下来的内容变成字典格式。

然后通过 response 对网站发送请求

print 打印一下

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

<Response [200]>: 请求成功

3、获取数据

html_data = response.text
print(html_data)
# Python学习交流群 279199867

 

打印一下看看获取到的数据

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

4、解析数据

.*?匹配任意字符 n 换行除外

video_url = re.findall('src:"(.*?)"}]', html_data)[0]
video_url = video_url.replace('\u002F', '/')
video_data = requests.get(url=video_url).content

 

5、保存数据

with open('爱你.mp4', mode='wb') as f:
    f.write(video_data)

 

王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线

 

 

就可以开始愉快的欣赏女神了!

这里我只是做了单个获取,多个爬取和多页爬取我专门录了视频,文中可以获取。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:王心凌再次爆火,为了防止收费,我连夜用Python把她所有的MV离线 - Python技术站

(0)
上一篇 2023年4月2日 下午5:28
下一篇 2023年4月2日 下午5:28

相关文章

  • 这份工具清单,令Python 提速N倍,简直太好用了

    在众多编程语言中,Python的社区生态是其中的佼佼者之一。几乎所有的技术痛点,例如优化代码提升速度,在社区内都有很多成功的解决方案。本文分享的就是一份可以令 Python 变快的工具清单,值得了解下。     一、序言 这篇文章会提供一些优化代码的工具。会让代码变得更简洁,或者更迅速。 当然这些并不能代替算法设计,但是还是能让Python加速很多倍。 其实…

    Python开发 2023年4月2日
    00
  • Python之字典删除元素(6种方式)

    文中代码 smart_girl = {“name”:”yuan wai”, “age”: 25,”address”:”Beijing”}   第一种方式:pop()方法 注意:找不到对应的key,pop方法会抛出异常KeyError smart_girl.pop(“name”) #返回值是value # Python学习交流裙 708525271   第二种…

    Python开发 2023年3月31日
    00
  • Python爬虫基础丨采集知乎问答区内容

    不知道现在还有多少人玩知某乎,我们那时候没事就刷刷知某乎,贴某吧,不知留下了多少足迹。 知乎上问答的质量挺高,今天咱们就对其问答内容进行爬虫实验。 效果展示 可以看到,数据咱们就获取下来了,保存就可以了。 代码展示 import requests import re import json import pprint # 文章不理解,我还专门个大家录制了详细…

    Python开发 2023年3月31日
    00
  • 2022 IEEE 编程语言榜单发布!Python 又双叒叕霸榜了,学 SQL 工作更吃香!

    哈喽兄弟们! 近年来,Python 宛如一匹黑马,一骑绝尘,横扫 TIOBE、Stack Overflow 等榜单,如今在 IEEE Spectrum 发布的第九届年度顶级编程语言榜单中,Python 依然是 C、C++、C#、Java 等老牌语言无法比拟的。 关于编程语言的优劣,众说纷纭。不过,在今年这份报告中,我们也发现了一个让人出乎意料的结果,即根据就…

    Python开发 2023年4月2日
    00
  • 重温Python基础——字符串

    哈喽,兄弟们, 本文带大家复习一下Python基础中的字符串,不知道大家还记得多少内容呢? 字符串 1、字符串就是一系列字符 在python中,用引号括起的都是字符串,其中引号可以是单的,也可以是双的。例如: “i am not happy” ‘i am not happy’   这种灵活性能在字符串中包含引号和撇号,例如: “she told me ‘Py…

    Python开发 2023年4月2日
    00
  • Python实现将文本数据批量导入Excel表格,并按格式保存

    本文实现用Python将文本文件自动保存到Excel表格里面去。 需求 将锦江区.txt 文件中的数据整理到 锦江区.xlsx 的 锦江区 sheet ; 将推荐菜字段丢弃(保留前面14个字段) ; 将人均消费中的 ¥ 符号去掉,如果价格为空整条数据都不要; 成果展示 txt文本部分数据 效果 稍微打了点码,尊重一下别人。 代码展示 import openp…

    Python开发 2023年4月2日
    00
  • Python之字典添加元素

    本文使用代码 book_dict = {“price”: 500, “bookName”: “Python设计”, “weight”: “250g”}   第一种方式:使用[] book_dict[“owner”] = “tyson”   说明:中括号指定key,赋值一个value,key不存在,则是添加元素(如果key已存在,则是修改key对应的value…

    Python开发 2023年3月31日
    00
  • 使用Python获取春节档电影影评,制作可视化词云图

    春节电影听巳月说都还可以,我不信,我觉得还是要看看看过的观众怎么说,于是我点开了流浪地球2 … 看起来好像不错的样子,8.2的评分,三十多亿的票房 就是这评价也太多了,那我们今天就把网友对它的评论获取下来,做成可视化词云图看看大家讨论最多的是什么。 准备工作 使用的环境 Python 3.8 解释器 Pycharm 编辑器   需要手动安装的模块 parse…

    Python开发 2023年3月31日
    00
合作推广
合作推广
分享本页
返回顶部