用Python批量爬取快手视频，实现自动关注/点赞/评论

2023年4月2日下午5:29 • Python开发

今天来点特别的~

不仅把好看的视频全部pa下来，咱们还要实现自动评论、点赞、关注三连~

宝，你也可以顺手给我个三连吗？给你个摸摸大~

用Python批量爬取快手视频，实现自动关注/点赞/评论

抓包分析流程

我写成了文档，都在这个PDF里面了，但是好像不能上传，所以点一下大家自行下载吧！
点我获取，提取密码 qwer

开始代码

获取视频的代码

import requests     # 发送请求 第三方模块(第三方应用 pip)
import re


# 伪装
# 1. 选中要替换的代码
# 2. ctrl + R
# 3. 第一个框(.*?): (.*)
# 4. 在第二个框里面输入 '$1': '$2',
# 5. 点击全部替换(* 点亮 * 号)
# Python学习交流群 279199867
headers = {
    'content-type': 'application/json',
    'Cookie': 'kpf=PC_WEB; kpn=KUAISHOU_VISION; clientid=3; did=web_ea128125517a46bd491ae9ccb255e242; client_key=65890b29; didv=1646739254078; userId=270932146; kuaishou.server.web_st=ChZrdWFpc2hvdS5zZXJ2ZXIud2ViLnN0EqABctRgGaXi5efEBpnbdtJMp3nnnXqENRWBoFQABtOr1ZFUNAjEo5NTZ4F0leSypsSFE4_-FGTnBqKEYh8Wcrszm3FGF03559Z9bFQCX_8ew_kLKPWVB9ZRlWQgISoG4-XZXIOqiBgkQKsPbpYKiA3X4_0rMDbo9-c0nWXeOoThekj8W3u7_yfI4fUY3h5WgTEDYT0yrXkZmhWlFV_jpVxDrBoSzFZBnBL4suA5hQVn0dPKLsMxIiCo1i0bY9V6-OVEk7yMnH86RNliTZACHvLPjL9FTHHQOigFMAE; kuaishou.server.web_ph=09735672944cbf9e53431bf3e0514a0d058b',
    'Host': 'www.***.com',
    'Origin': 'https://www.***.com',
    # 防盗链
    'Referer': 'https://www.kuaishou.com/profile/3xhv7zhkfr3rqag',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.88 Safari/537.36',
}
url = 'https://www.***.com/graphql'


def get_page(pcursor):
    # 指定要谁的视频
    data = {
        "operationName": "visionProfilePhotoList",
        "query": "query visionProfilePhotoList($pcursor: String, $userId: String, $page: String, $webPageArea: String) {n  visionProfilePhotoList(pcursor: $pcursor, userId: $userId, page: $page, webPageArea: $webPageArea) {n    resultn    llsidn    webPageArean    feeds {n      typen      author {n        idn        namen        followingn        headerUrln        headerUrls {n          cdnn          urln          __typenamen        }n        __typenamen      }n      tags {n        typen        namen        __typenamen      }n      photo {n        idn        durationn        captionn        likeCountn        realLikeCountn        coverUrln        coverUrls {n          cdnn          urln          __typenamen        }n        photoUrls {n          cdnn          urln          __typenamen        }n        photoUrln        likedn        timestampn        expTagn        animatedCoverUrln        stereoTypen        videoRation        profileUserTopPhoton        __typenamen      }n      canAddCommentn      currentPcursorn      llsidn      statusn      __typenamen    }n    hostNamen    pcursorn    __typenamen  }n}n",
        "variables": {"userId": "3x2vsxyxbbwcjta", "pcursor": pcursor, "page": "profile"}
    }
    # 1. 发送请求  get  post
    response = requests.post(url=url, headers=headers, json=data)
    # <Response [200]>: 请求成功
    # 2. 获取数据 .json() 返回字典类型数据
    # .text: 拿到的就是 文本内容 python数据类型 字符串 > 字典类型 > 键值对(拼音)方式取值
    json_data = response.json()
    # 3. 解析数据
    # 新华字典 = {'A': '啊', 'B': '不', 'C': '从'}
    # 新华字典['B']  python数据容器 存储数据
    # 正则
    feeds = json_data['data']['visionProfilePhotoList']['feeds']
    pcursor = json_data['data']['visionProfilePhotoList']['pcursor']
    for feed in feeds:
        photoUrl = feed['photo']['photoUrl']
        caption = feed['photo']['caption']
        # 正则替换
        # 第一个参数里面是需要替换的一些字符
        # 第二个参数 是把这些字符替换为 空
        # 第三个参数 是需要替换的变量
        # \ : 
        # / : /
        caption = re.sub('[\/:*?"<>|n]', '', caption)
        print(caption, photoUrl)
        # 4. 保存数据  如果你们拿到的链接 就是 视频 或者 音频 或者 图片
        # .content: 获取视频(音频 / 图片) 二进制数据
        video_data = requests.get(photoUrl).content
        # 视频名称
        # wb 以二进制覆盖写入
        with open(f'video/{caption}.mp4', mode='wb') as f:
            f.write(video_data)
    # 递归: 2.出口
    if pcursor == "no_more":
        # 退出?
        return
    # 递归: 1.自己调用自己
    get_page(pcursor)

get_page("")

自动评论

def post_comment(self, content, photoAuthorId, photoId):
    """
    :param content: 评论内容
    :param photoAuthorId: 该作品的作者id
    :param photoId: 作品id
    :return: 有没有成功
    """
    json = {
        'operationName': "visionAddComment",
        'query': "mutation visionAddComment($photoId: String, $photoAuthorId: String, $content: String, $replyToCommentId: ID, $replyTo: ID, $expTag: String) {  (photoId: $photoId, photoAuthorId: $photoAuthorId, content: $content, replyToCommentId: $replyToCommentId, replyTo: $replyTo, expTag: $expTag) {n    resultn    commentIdn    contentn    timestampn    statusn    __typenamen  }n}n",
        'variables': {
            'content': content,
            'expTag': "1_a/2005158523885162817_xpcwebsearchxxnull0",
            'photoAuthorId': photoAuthorId,
            'photoId': photoId
        }
    }
    response = requests.post(url=self.url, json=json, headers=self.headers)
    json_data = response.json()
    print(json_data)
    return json_data

自动点赞

def is_like(self, photoId, photoAuthorId):
    """
    :param photoId: 作品id
    :param photoAuthorId: 该作品的作者id
    :return: 有没有成功
    """
    json = {
        'operationName': "visionVideoLike",
        'query': "mutation visionVideoLike($photoId: String, $photoAuthorId: String, $cancel: Int, $expTag: String) {n  visionVideoLike(photoId: $photoId, photoAuthorId: $photoAuthorId, cancel: $cancel, expTag: $expTag) {n    resultn    __typenamen  }n}",
        'variables': {
            'cancel': 0,
            'expTag': "1_a/2005158523885162817_xpcwebsearchxxnull0",
            'photoAuthorId': photoAuthorId,
            'photoId': photoId
        }
    }
    response = requests.post(url=self.url, json=json, headers=self.headers)
    json_data = response.json()
    print(json_data)
    return json_data

自动关注

def is_follow(self, touid):
    """

    :param touid: 用户id
    :return:
    """
    json = {
        'operationName': "visionFollow",
        'query': "mutation visionFollow($touid: String, $ftype: Int, $followSource: Int, $expTag: String) {n  visionFollow(touid: $touid, ftype: $ftype, followSource: $followSource, expTag: $expTag) {n       followStatusn    hostNamen    error_msgn    __typenamen  }n}n",
        'variables': {
            'expTag': "1_a/2005158523885162817_xpcwebsearchxxnull0",
            'followSource': 3,
            'ftype': 1,
            'touid': touid
        }
    }
    response = requests.post(url=self.url, json=json, headers=self.headers)
    json_data = response.json()
    print(json_data)
    return json_data

溜了溜了，今天就到这里，兄弟们快去试试吧！

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：用Python批量爬取快手视频，实现自动关注/点赞/评论 - Python技术站

轻松学Python

0 0 打赏

微信扫一扫

支付宝扫一扫

python 本地音乐播放器制作过程

上一篇 2023年4月2日下午5:29

Python解释器的下载安装与使用

下一篇 2023年4月2日下午5:29

聊天尬住了？教你用Python一键获取斗图表情包，从此摇身变海王

很多兄弟在聊天上没有下太多的功夫，导致自己聊天的时候很容易尬住，然后就不知道聊啥了，这时候合适表情包分分钟就能救场，但是一看自己收藏的表情包，好家伙，两只手都数得过来。所以今天来给兄弟们分享一下爬取表情包的代码，再也不用尬聊了！给大家看看我朋友的尬聊场面本次目标网站：发表情网不好，没加载出来，表弟又在当老六，看不该看的抢我网速！！！使用…

Python开发 2023年3月31日
000
用Python做一个抢票脚本，演唱会门票轻松到手！

最近演唱会还挺多的，都是大家喜欢的那些知名歌手，所以特地出一手教程给大家助力（主要是表弟想追女神，所以教他自己抢票）知识点 selenium 淘宝滑块处理抢购逻辑实现必备环境 python 3.8 pycharm 专业版谷歌浏览器+谷歌驱动+selenium3.141.0 stealth.min.js 代码展示模块 import time fro…

Python开发 2023年3月31日
000
用Python做一个小说下载器，从获取数据到编写GUI界面

对于广大书虫而言，没有小说看是最痛苦的，你身边有这样的人吗？今天咱们分享一个小说下载器代码，打包成exe后，发给你的小伙伴也能直接使用… 思路流程什么是爬虫? 按照一定的规则, 去采集互联网上面数据爬虫可以做什么? 采集数据: 定制化采集数据自动化脚本：自动点赞/评论/刷票/商品抢购脚本/自动发送弹幕爬虫基本实现思路? 一、数据来源分析明确需求:…

Python开发 2023年3月31日
000
教师节我用Python做了个学生点名系统送给老师当礼物，这回毕业稳了

今年教师节前夕，我特意用Python做了个学生点名系统，非常好用，送给各科老师、辅导员当节日礼物，老师们都喜滋滋，说平常逃课就原谅我了，我心想，这次毕业应该不是问题了~ 本文背景根据我的调查，现在的学生大部分都很积极，会主动举手回答问题。但是，也会遇到一些不好的情况，比如年级越高主动举手的人越少，有些班级举手的通常都是少部分积极的学生，有部分学生从来不举手…

Python开发 2023年4月2日
000
利用Python生成随机密码，灰常简单

兄弟们，今天我们来用Python生成随机密码试试~ 知识点文件读写基础语法字符串处理字符拼接代码解析导入模块 import platform import string import random # 我还给大家准备了这些资料：Python视频教程、100本Python电子书、基础、爬虫、数据分析、web开发、机器学习、人工智能、面试题、Py…

Python开发 2023年4月2日
000
Python制作炫酷的个人足迹地图

用Python来绘制自己的个人足迹地图，精确到市级别。首先我们需要安装以下Python的第三方模块: echarts-china-cities-pypkg==0.0.9 echarts-china-provinces-pypkg==0.0.3 pyecharts==1.6.2 PyYAML==5.3.1 本项目的完整结构如下：我们在项目中采用YAM…

Python开发 2023年4月2日
000
Python开发

这将使你见过最全面的Python制作GUI学生管理系统教程

表弟大学快毕业了，学了一个学期Python居然还不会写学生管理系统，真的给我丢脸啊，教他又不肯学，还让我直接给他写，我真想两巴掌上去，最终还是写了给他，谁让他是我表弟呢，关键时候还是得帮他一把！写完了放在那也是放着，所以今天分享给大家吧！话不多说，咱们直接开始吧！代码解析一、登录页面 1、定义登录类及初始化对象首先导入咱们需要用…

2023年4月2日
000
Python开发

为了防止这个公众号被封，我连夜用Python爬取了它所有图片~

哈喽兄弟们，今天来试试批量获取公众号文章，emmm… 虽然名义上是文章，单其实它是一篇纯图片文，至于为什么不是文字，小姐姐不比文字香？事前准备我们需要用到 Fiddler Everywhere 这个软件，Crack是本次要使用到的文件，以及要安装微信PC版客户端，我专门录了一个安装及使用的教程。本次使用的是Python3.8 …

2023年4月2日
000

用Python批量爬取快手视频，实现自动关注/点赞/评论

抓包分析流程

开始代码

相关文章