西瓜视频视频颜值区如此惊艳,看我只用30行Python代码批量下载,保存本地慢慢看

不知道各位老色批们平常看视频都是在哪里看的,有人说某鱼舞蹈区,有人说某牙舞蹈区,要我说都不如西瓜shipin,这里面个个都是人才,说话又好听,超喜欢这里的…

西瓜视频视频颜值区如此惊艳,看我只用30行Python代码批量下载,保存本地慢慢看

西瓜视频视频颜值区如此惊艳,看我只用30行Python代码批量下载,保存本地慢慢看
西瓜视频视频颜值区如此惊艳,看我只用30行Python代码批量下载,保存本地慢慢看
好了话不多说,我们直接开始本次的内容。

模块安装

本次需要使用的模块是requests 模块,没安装的小伙伴直接pip安装即可。

环境

本次使用的环境是Python3.8 ,编辑器是 pycharm 

效果展示

西瓜视频视频颜值区如此惊艳,看我只用30行Python代码批量下载,保存本地慢慢看

西瓜视频视频颜值区如此惊艳,看我只用30行Python代码批量下载,保存本地慢慢看

代码展示

使用的模块

import requests
import re
import json
import base64

 

发送请求

headers = {
    'cookie': 'support_webp=true; support_avif=true; csrf_session_id=76ceeb6d60b0fcd804de9be6e9693c54; s_v_web_id=verify_lefmeh66_SLWSXhCD_aZkd_4NEx_BgaI_hGUNbdQrHIpi; MONITOR_WEB_ID=56b4a269-39b6-4147-ab7c-9195b568c5e8; _tea_utm_cache_2018=undefined; passport_csrf_token=1a7dd3b7b20888e47197ea1d942e17d5; passport_csrf_token_default=1a7dd3b7b20888e47197ea1d942e17d5; passport_auth_status=121a29188cf1b9ecf308efbe3d0920c5%2C; passport_auth_status_ss=121a29188cf1b9ecf308efbe3d0920c5%2C; sid_guard=d75c6025dd5f4e3d658be37aad5f91b5%7C1677067151%7C3024000%7CWed%2C+29-Mar-2023+11%3A59%3A11+GMT; uid_tt=2f228913ef6379e66da0c3399feaa580; uid_tt_ss=2f228913ef6379e66da0c3399feaa580; sid_tt=d75c6025dd5f4e3d658be37aad5f91b5; sessionid=d75c6025dd5f4e3d658be37aad5f91b5; sessionid_ss=d75c6025dd5f4e3d658be37aad5f91b5; sid_ucp_v1=1.0.0-KGQ4Nzc4MjZiYWI1NWRmYTg5YjQyYmMyZjhmYjY1OWYyYzQzMDUyOGEKFAjo5IrYFxCPh9ifBhgYIAw4CEAFGgJobCIgZDc1YzYwMjVkZDVmNGUzZDY1OGJlMzdhYWQ1ZjkxYjU; ssid_ucp_v1=1.0.0-KGQ4Nzc4MjZiYWI1NWRmYTg5YjQyYmMyZjhmYjY1OWYyYzQzMDUyOGEKFAjo5IrYFxCPh9ifBhgYIAw4CEAFGgJobCIgZDc1YzYwMjVkZDVmNGUzZDY1OGJlMzdhYWQ1ZjkxYjU; __ac_nonce=063f604bf003948a3bad9; __ac_signature=_02B4Z6wo00f01SciCjgAAIDARCjKUZOPEREnAg6AACpBKsMzhMS3tmVlQF6xo9y4lk1.8f3BOblIBNOWtyn2ZteVVEle52JVejsr-gjz52x7fFDNHLhhWPSptiT342agtlzTUnp1SO2LBVZxb3; ixigua-a-s=3; odin_tt=5529039b6eb72ae52e2705d0db550fc06655c83bdbe61914be61c42152989c387a55ad2fa056636bfd1f880a86407f88; tt_scid=ORPDc-M6KS5eOmTgjaUrefaIL0yzO7y.HdHVQAZXahd0wmCZXjYo6rBN9gfC3xYF3559; ttwid=1%7CiWx9zpr2eLSL5pxwfW7PdpTasAnL2Tszm5jFlS0A_ac%7C1677067476%7C2d4446661479733452a7b0217ff6d0c80645ddd3f9f9e85f43547870d43654da; msToken=cSgsxZfj-6sePYrKBxT8cLGTA9Fe4h9FVEyqx2na-t6-TyoXHDL3Q_CQIxRvs9MrWsKeXvTH9OeSdsfiVqYu48Qcw-sEg2hF6sThIHy2b9J1L2mNumIx',
    'referer': 'https://www.ixigua.com/7188507369205301794?logTag=2bb3393d5b417ff0f1fa',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36'
}
url = 'https://www.***.com/7188507369205301794?logTag=2bb3393d5b417ff0f1fa'
response = requests.get(url=url, headers=headers)
# 我这里只爬取了一个内容,我还录制了详细的视频讲解
# 直接在这个扣裙 708525271 拿视频和代码。

 

获取数据

response.encoding = "utf-8"
html_data = response.text

 

解析数据

json_str = re.findall('window._SSR_HYDRATED_DATA=(.*?)</script>', html_data)[0]
# 字典 undefined
json_str = json_str.replace('undefined', 'null')
json_data = json.loads(json_str)
video_list = json_data['anyVideo']['gidInformation']['packerData']['video']['videoResource']['normal']['video_list']
num = len(list(video_list.keys()))
main_url = video_list.get(f'video_{num}').get("main_url")
video_url = base64.b64decode(main_url).decode()
print(video_url)

 

保存视频/音频

video_data = requests.get(video_url, headers=headers).content
with open('1.mp4', mode='wb') as f:
    f.write(video_data)
audio_data = requests.get(audio_url).content
with open(f'{title}.mp3', mode='wb') as f:
    f.write(audio_data)
ffmpeg = r'ffmpeg -i ' + title + '.mp4 -i ' + title + '.mp3 -acodec copy -vcodec copy ' + title + '-out.mp4'
subprocess.run(ffmpeg)
os.remove(f'{title}.mp3')
os.remove(f'{title}.mp4')

 

最后

好了,今天的分享就到这里,喜欢的话记得点赞收藏,咱们下次见!

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:西瓜视频视频颜值区如此惊艳,看我只用30行Python代码批量下载,保存本地慢慢看 - Python技术站

(0)
上一篇 2023年3月31日
下一篇 2023年3月31日

相关文章

  • Python批量处理Excel表格,将多个表格内容合并到一个,提升工作效率!

    老板最近越来越过分了,快下班了发给我几百个表格让我把内容合并到一个表格内去。还好我会Python,分分钟就搞定了,这要是换个不会Python的,不得加班到第二天天亮去了~ 这么好用的技能,必须分享给大家,话不多说,咱们直接开始! 准备工作 咱们需要先准备表格数据,会爬虫的兄弟可以自己爬一点,不会的,可以找我直接拿数据。 表格内数据     我这里只做展示,所…

    Python开发 2023年4月2日
    00
  • 只用20行代码,Python实现爬取网易云音乐,非常简单!

    哈喽,大家好,今天咱们试试只用20行代码来实现批量获取网抑云文件保存本地,炒鸡简单! 悄悄的告诉你,其实不到20行代码~     你需要准备 本次使用的环境是Python3.8,编辑器是pycharm  模块使用的是requests、re、os 三个,其中requests是第三方模块,需要手动安装一下,re、os都是内置模块,不需要安装。 pip insta…

    2023年4月2日
    00
  • 利用Python生成随机密码,灰常简单

    兄弟们,今天我们来用Python生成随机密码试试~ 知识点 文件读写 基础语法 字符串处理 字符拼接   代码解析 导入模块 import platform import string import random # 我还给大家准备了这些资料:Python视频教程、100本Python电子书、基础、爬虫、数据分析、web开发、机器学习、人工智能、面试题、Py…

    Python开发 2023年4月2日
    00
  • 这个Python读取文件的方法,堪称天花板级别…

    序言 哈喽兄弟们,今天咱们来了解一下 fileinput 。 说到fileinput,可能90%的码农表示没用过,甚至没有听说过。 这不奇怪,因为在python界,既然open可以走天下,何必要fileinput呢? 但是,今天我还是要介绍fileinput这个方法,因为太奈斯了。 不止是香。是真香! 接下来,就跟着我,一起fileinput,对,就是这个f…

    Python开发 2023年4月2日
    00
  • Python实现下载一个URL图片文件到本地

    今天咱们来实现一下,如何用Python实现下载一个URL图片文件保存本地。 涉及知识点 文件读写 基础语法 字符串处理 # 我还给大家准备了这些资料:Python视频教程、100本Python电子书、基础、爬虫、数据分析、web开发、机器学习、人工智能、面试题、Python学习路线图、问题解答! # 都放在这个扣群啦:279199867   代码展示 imp…

    Python开发 2023年4月2日
    00
  • python一键去PDF水印,只需十行代码,超级简单…

    弟弟最近要考试,临时抱佛脚在网上找了一堆学习资料复习,这不刚就来找我了,说PDF上有水印,影响阅读效果,到时候考不好就怪资料不行,气的我差点当场想把他揍一顿! 算了,弟弟长大了,看在打不过他的份上,就不打他了~ 稍加思索,我想起了Python不是可以去水印?说搞就搞! 去除水印原理 去除方法: 用 PyMuPDF 打开 pdf 文件,将 pdf 的每一页都转…

    Python开发 2023年4月2日
    00
  • Python爬虫基础丨采集知乎问答区内容

    不知道现在还有多少人玩知某乎,我们那时候没事就刷刷知某乎,贴某吧,不知留下了多少足迹。 知乎上问答的质量挺高,今天咱们就对其问答内容进行爬虫实验。 效果展示 可以看到,数据咱们就获取下来了,保存就可以了。 代码展示 import requests import re import json import pprint # 文章不理解,我还专门个大家录制了详细…

    Python开发 2023年3月31日
    00
  • Python之字典遍历元素(4种方式)

    第一种:for in girl_dict= {“China”: “小美”, “Japan”: “图多天光”, “Korea”: “斯密达美”} for everyKey in girl_dict: print (“key:” + everyKey + “value:” + girl_dict[everyKey])   输出结果 key:japan value…

    Python开发 2023年3月31日
    00
合作推广
合作推广
分享本页
返回顶部