Python批量爬取大众点评数据

众所周知,某点评是一直有JS加密的,所以关于它的外包一直都很贵,有些公司甚至用来面试,可见他的难度。

但是吧,最近他好像没有加密了,这~

不值钱了啊!

那当时就忍不住了,就得用Python开始整活了!

Python批量爬取大众点评数据

 

 

Python批量爬取大众点评数据
话不多说,让我们上代码!

全部代码

今天就没那么多步骤了,直接上代码!

import requests
import parsel

url = 'https://www.dianping.com/search/keyword/344/0_%E7%81%AB%E9%94%85/p2'
headers = {
    'Cookie': 'fspop=test; cy=344; cye=changsha; _lxsdk_cuid=181f2b8ceedc8-00c68dfc700b1e-c4c7526-384000-181f2b8ceedc8; _lxsdk=181f2b8ceedc8-00c68dfc700b1e-c4c7526-384000-181f2b8ceedc8; _hc.v=fa46cfdd-99f6-80af-c226-f8777fc1f097.1657634607; s_ViewType=10; _lx_utm=utm_source%3DBaidu%26utm_medium%3Dorganic; Hm_lvt_602b80cf8079ae6591966cc70a3940e7=1657634608,1657690542; lgtoken=0ecd60582-14f9-4437-87ad-7b55881b56df; WEBDFPID=3x389w8ww1vw5vuzy491zvxxu36989x2818u39v38389795895568429-1657776946569-1657690545731QSUUAWGfd79fef3d01d5e9aadc18ccd4d0c95072230; dper=6cfaf0f82f34d241b584d587fc92a7117ba6c082354d350ed861c0a256d00ba3beb93db7dc5485b4e2e4e4085a92126fa2e5f1dbe1b6eaefd1c814167fce943e; ll=7fd06e815b796be3df069dec7836c3df; Hm_lpvt_602b80cf8079ae6591966cc70a3940e7=1657690573; _lxsdk_s=181f60e4e6c-cad-fea-c91%7C%7C40',
    'Host': 'www.dianping.com',
    'Referer': 'https://www.dianping.com/search/keyword/344/0_%E7%81%AB%E9%94%85',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36',
}

response = requests.get(url=url, headers=headers)
selector = parsel.Selector(response.text)
href = selector.css('.shop-list ul li .pic a::attr(href)').getall()
print(href)
for index in href:
    html_data = requests.get(url=index, headers=headers).text
    selector_1 = parsel.Selector(html_data)
    title = selector_1.css('.shop-name::text').get()  # 店名
    count = selector_1.css('#reviewCount::text').get()  # 评论
    Price = selector_1.css('#avgPriceTitle::text').get()  # 人均消费
    item_list = selector_1.css('#comment_score .item::text').getall()  # 评价
    taste = item_list[0].split(': ')[-1]  # 口味评分
    environment = item_list[1].split(': ')[-1]  # 环境评分
    service = item_list[-1].split(': ')[-1]  # 服务评分
    address = selector_1.css('#address::text').get()  # 地址
    tel = selector_1.css('.tel ::text').getall()[-1]  # 电话
    dit = {
        '店名': title,
        '评论': count,
        '人均消费': Price,
        '口味': taste,
        '环境': environment,
        '服务': service,
        '地址': address,
        '电话': tel,
        '详情页': index,
    }
    print(dit)

 

注释我就不注释了,有点赶时间,女朋友喊我去吃饭呢!

Python批量爬取大众点评数据

 

 

Python批量爬取大众点评数据
不过没关系,还好我有先见之明,已经录了视频,都发在这里了,代码不明白的话,可以看视频有一步步的讲解。

视频地址: Python爬取大众点评

# 我给大家准备了这些资料:Python视频教程、100本Python电子书、基础、爬虫、数据分析、web开发、机器学习、人工智能、面试题、Python学习路线图、问题解答!
# 都放在这个扣群啦 : 279199867

 

效果展示

Python批量爬取大众点评数据
本文代码只是爬取了部分内容,视频中还讲解了让数据更好看,多页爬取,保存Excel表格等等。

Python批量爬取大众点评数据

 

 

给大家展示一下效果

Python批量爬取大众点评数据

 

 

Python批量爬取大众点评数据

 

 

Python批量爬取大众点评数据Python批量爬取大众点评数据

好了,今天的分享就到这,下次再见!

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python批量爬取大众点评数据 - Python技术站

(0)
上一篇 2023年4月2日 下午5:19
下一篇 2023年4月2日 下午5:20

相关文章

  • 圣诞节快到了,教大家用Python画一个简单的圣诞树和烟花,送给那个她

    这不是圣诞节快到了,准备让让女朋友开心开心,也算是亲手做的,稍稍花了点心思。 话不多说,咱们直接来展示吧,学会了赶紧画给你的那个她吧! 本文分为两个大块,我们先来试试画圣诞树。 圣诞树 效果展示 代码展示 导入模块 import turtle as t from turtle import * import random as r import time  …

    Python开发 2023年4月2日
    00
  • 使用Python计算个人所得税

    企业发放的奖金根据利润提成。 利润(I)低于或等于10万元时,奖金可提10%; 利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可提成7.5%; 20万到40万之间时,高于20万元的部分,可提成5%; 40万到60万之间时高于40万元的部分,可提成3%; 60万到100万之间时,高于60万元的部分,可提成1.5%, 高于…

    Python开发 2023年4月2日
    00
  • 利用Python快速实现一个线程池,非常简单

    雷猴啊,兄弟们!今天来展示一下如何用Python快速实现一个线程池。   一、序言 当有多个 IO 密集型的任务要被处理时,我们自然而然会想到多线程。但如果任务非常多,我们不可能每一个任务都启动一个线程去处理,这个时候最好的办法就是实现一个线程池,至于池子里面的线程数量可以根据业务场景进行设置。 比如我们实现一个有 10 个线程的线程池,这样可以并发地处理 …

    Python开发 2023年4月2日
    00
  • 14个Python处理Excel的常用操作,我先试过了,非常好用

    自从学了Python后就逼迫用Python来处理Excel,所有操作用Python实现。目的是巩固Python,与增强数据处理能力。这也是我写这篇文章的初衷。废话不说了,直接进入正题。 数据是网上找到的销售数据,长这样: 一、关联公式:Vlookup vlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。所以我先把这张表分为两个表。 df1…

    Python开发 2023年3月31日
    00
  • 花了一个月终于整理出来了,800道Python习题,试试你能做对多少道!

    最近沉寂的太久了,只为了给大家准备这一套试题,这大概是全网最全面的了,各位学这么久Python,检验学习成果的时间到了!! 话不多说我们直接开始把! 一、填空题 001、Python安装扩展库常用的工具是__________和conda,其中后者需要安装Python集成开发环境Anaconda3之后才可以使用,而前者是Python官方推荐和标配的; 我还给大…

    Python开发 2023年4月2日
    00
  • Python爬取往期股票数据,分析中奖规律!

    快过年了,手头有点紧,但是作为一个男人,身上怎么能够没有大把钞票呢? 于是我决定用Python来分析一波股票,赢了会所嫩*,输了下海干活! 好了,上面是我吹牛逼的,不过确实有小伙伴看了爬股票数据进行分析的教程中过,但是我还是不建议各位去碰这玩意,今天咱们就是纯纯的分享技术哈~ 准备工作 既然要去赚马内,咱们首先要获取往期的数据来进行分析,通过往期的规律来对当…

    Python开发 2023年3月31日
    00
  • 如何用Python将普通视频变成动漫视频

    最近几个月,毒教材被曝光引发争议,那些编写度教材的人着实可恶。咱程序员也没有手绘插画能力,但咱可以借助强大的深度学习模型将视频转动漫。所以今天的目标是让任何具有python语言基本能力的程序员,实现短视频转动漫效果。 效果展示 一、思路流程 读取视频帧 将每一帧图像转为动漫帧 将转换后的动漫帧转为视频 难点在于如何将图像转为动漫效果。这里我们使用基于深度学习…

    Python开发 2023年4月2日
    00
  • Python告别pip手动安装模块,实现全自动安装第三方库,彻底解放你的双手

    兄弟们,为了帮助大家更加高效的摸鱼,今天分享一个骚操作,Python自动安装第三方库! 为了体现小编在懒上的造就,今天再分享一个骚操作:Python自动安装第三方库,全自动不需要你动! pip手动安装 一说Python要安装哪个模块,我们第一反应,win+r输入cmd,pip instll 安装~ 没毛病,必须的! 但是如果换电脑了(土豪才换电脑,我都换朋友…

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部