Python爬取安居客房源信息,轻松获取优质房源!

又到了所谓的金山银四就业季,那找工作的小伙伴宿舍住不惯的话,就会去租房子住,当然也不一定有宿舍,那么自己找房子的话,肯定是不知道哪哪好。

所以今天教大家用Python来采集本地房源数据,帮助大家筛选好房。

Python爬取安居客房源信息,轻松获取优质房源!

本文涉及知识点

  1. 爬虫基本流程
  2. requests 发送请求
  3. parsel 解析数据
  4. csv 保存数据

开发环境

Python 3.8
Pycharm

 

本文思路

一.、思路分析

找到数据来源
https://cs.anjuke.com/sale/p1/?from=navigation

二、代码实现

  1. 发送请求 & 获取数据
  2. 解析数据 (提取你想要的数据)
  3. 保存数据

代码展示

使用的模块

import requests 
import parsel
import csv

 

发送请求 & 获取数据

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36'
}
# 为了防止大家看不懂,我特地录制了视频详细讲解,包括完整代码都打包好了。
# 我还准备了数百本电子书,大量的视频教程,直接在这个Q裙:708525271 加它自取。
response = requests.get(url, headers=headers, proxies=get_proxies())
html_data = response.text

 

解析数据

selector = parsel.Selector(html_data)
divs = selector.xpath("//div[@class='property']")
for div in divs:
    # 单个房源去提取
    title = div.xpath(".//div[@class='property-content']//h3/text()").get().strip()
    house_type = ''.join(div.xpath(".//div[@class='property-content-info']//span/text()").getall()).strip()
    area = div.xpath(".//div[@class='property-content-info']/p[2]/text()").get().strip()
    direction = div.xpath(".//div[@class='property-content-info']/p[3]/text()").get().strip()
    floor = div.xpath(".//div[@class='property-content-info']/p[4]/text()").get("").strip()
    year = div.xpath(".//div[@class='property-content-info']/p[5]/text()").get("").strip()
    price_total = ''.join(div.xpath(".//div[@class='property-price']/p[1]/span/text()").getall()).strip()
    price_average = div.xpath(".//div[@class='property-price']/p[2]/text()").get().strip()
    print(title, house_type, area, direction, floor, year, price_total, price_average)

 

保存数据

csv_writer.writerow([title, house_type, area, direction, floor, year, price_total, price_average])

 

好了,今天的分享就到这里结束了,兄弟们快去试试吧!

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python爬取安居客房源信息,轻松获取优质房源! - Python技术站

(0)
上一篇 2023年3月31日 下午8:45
下一篇 2023年3月31日 下午8:45

相关文章

  • Python制作炫酷的个人足迹地图

    用Python来绘制自己的个人足迹地图, 精确到市级别。 首先我们需要安装以下Python的第三方模块: echarts-china-cities-pypkg==0.0.9 echarts-china-provinces-pypkg==0.0.3 pyecharts==1.6.2 PyYAML==5.3.1   本项目的完整结构如下: 我们在项目中采用YAM…

    Python开发 2023年4月2日
    00
  • 简单的用Python对手机号进行加密

    基础学的太枯燥了,当然需要用案例来实践一下,才能更好的巩固所学。   所以本次来个对手机号进行加密,检验我们所学~ 知识点: 文件读写 基础语法 字符串处理 正则表达式 代码部分 # 导入系统包 import platform import re print(“Hello,秀儿”) print(“简单的加密手机号 “) # 定义文本内容 # Python学习…

    2023年4月2日
    00
  • 重温Python基础——变量

    哈喽兄弟们,今天我们来复习下变量。 首先尝试在一个hello_world.py文件中使用变量,在文件开头添加一行代码,并对第二行代码进行修改,如下所示: message=”hello world” print(message) # Python源码/教程领取扣君羊:279199867 运行这个程序,会与 print(“hello world”) 相同。 我们…

    Python开发 2023年4月2日
    00
  • 8条非常实用的python代码案例,初学者必备知识点!

    给大家推荐八个非常实用的Python案例,希望大家看过后能够有所收获! 1、合并两个字典 Python3.5之后,合并字典变得容易起来,我们可以通过**符号解压字典,并将多个字典传入{}中,实现合并。 def Merge(dict1,dict2): res = {**dict1,**dict2} return res # 两个字典 # Python学习交流1…

    Python开发 2023年4月2日
    00
  • 文件太乱了?不要慌,教你用Python全自动整理

    文件太乱了?不要慌,教你用Python全自动整理到对应分类中~ 主要知识点 文件读写 基础语法 字符串处理 循环遍历 素材 先来看看我这乱七八糟的文件​ 这就看起来乱七八糟了,这要是手动整理,还好,哈哈~ 但是几百个上千个文件呢? 所以,还得是有个技能傍身才方便啊! 马上安排! 代码展示 # 我还给大家准备了海量资料:Python视频教程、100本Pytho…

    Python开发 2023年4月2日
    00
  • 重温Python基础——字典

    哈喽小伙伴们,今天咱们来复习一下Python基础中的字典,看看还记得多少! 使用字典 在python中,字典是一系列键值对。每个键都与一个值相关联,你可使用键值来访问相关联的值。与键相关联的值可以是数、字符串、列表、乃至字典。其实,可以将任何python对象用作字典的值。在python中字典放在花括号 { } 内的一系列键值对表示例如: a = {“anim…

    Python开发 2023年4月2日
    00
  • 网易云VIP歌曲没权限?还好我会Python,一分钟一个歌单,硬盘有点不够用了~

    人生苦短,我用Python 人之初,喜白嫖。大家都喜欢白嫖,我也喜欢,那么今天就来试试怎么白嫖抑云~       我不是,我没有,别瞎说~       一、你需要准备 1、环境 Python3.6以上 pycharm2019以上 2、模块 requests # 发送请求模块 第三方模块 exec js # 调用JS的模块   二、效果展示 可以看到,这两个是…

    2023年4月2日
    00
  • Python之字典遍历元素(4种方式)

    第一种:for in girl_dict= {“China”: “小美”, “Japan”: “图多天光”, “Korea”: “斯密达美”} for everyKey in girl_dict: print (“key:” + everyKey + “value:” + girl_dict[everyKey])   输出结果 key:japan value…

    Python开发 2023年3月31日
    00
合作推广
合作推广
分享本页
返回顶部