Python爬取安居客房源信息,轻松获取优质房源!

又到了所谓的金山银四就业季,那找工作的小伙伴宿舍住不惯的话,就会去租房子住,当然也不一定有宿舍,那么自己找房子的话,肯定是不知道哪哪好。

所以今天教大家用Python来采集本地房源数据,帮助大家筛选好房。

Python爬取安居客房源信息,轻松获取优质房源!

本文涉及知识点

  1. 爬虫基本流程
  2. requests 发送请求
  3. parsel 解析数据
  4. csv 保存数据

开发环境

Python 3.8
Pycharm

 

本文思路

一.、思路分析

找到数据来源
https://cs.anjuke.com/sale/p1/?from=navigation

二、代码实现

  1. 发送请求 & 获取数据
  2. 解析数据 (提取你想要的数据)
  3. 保存数据

代码展示

使用的模块

import requests 
import parsel
import csv

 

发送请求 & 获取数据

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36'
}
# 为了防止大家看不懂,我特地录制了视频详细讲解,包括完整代码都打包好了。
# 我还准备了数百本电子书,大量的视频教程,直接在这个Q裙:708525271 加它自取。
response = requests.get(url, headers=headers, proxies=get_proxies())
html_data = response.text

 

解析数据

selector = parsel.Selector(html_data)
divs = selector.xpath("//div[@class='property']")
for div in divs:
    # 单个房源去提取
    title = div.xpath(".//div[@class='property-content']//h3/text()").get().strip()
    house_type = ''.join(div.xpath(".//div[@class='property-content-info']//span/text()").getall()).strip()
    area = div.xpath(".//div[@class='property-content-info']/p[2]/text()").get().strip()
    direction = div.xpath(".//div[@class='property-content-info']/p[3]/text()").get().strip()
    floor = div.xpath(".//div[@class='property-content-info']/p[4]/text()").get("").strip()
    year = div.xpath(".//div[@class='property-content-info']/p[5]/text()").get("").strip()
    price_total = ''.join(div.xpath(".//div[@class='property-price']/p[1]/span/text()").getall()).strip()
    price_average = div.xpath(".//div[@class='property-price']/p[2]/text()").get().strip()
    print(title, house_type, area, direction, floor, year, price_total, price_average)

 

保存数据

csv_writer.writerow([title, house_type, area, direction, floor, year, price_total, price_average])

 

好了,今天的分享就到这里结束了,兄弟们快去试试吧!

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python爬取安居客房源信息,轻松获取优质房源! - Python技术站

(0)
上一篇 2023年3月31日 下午8:45
下一篇 2023年3月31日 下午8:45

相关文章

  • 20行Python代码实现爬取起点小说

    相信在座各位应该没有几个不看小说的吧,嘿嘿~一般来说咱们书荒的时候怎么办?自然是去起某点排行榜先找到小说名字,然后再找度娘一搜,哎 ,笔趣阁就出来答案了,美滋滋~ 但是那多麻烦,咱们直接用python,直接全部下载下来慢慢看不就好了~小孩子才做选择,成年人选择都要… 好了,不啰嗦了,等下大家要骂我了~ 准备工作 环境模块 咱们没装软件的装一下软件,没装模块的…

    Python开发 2023年4月2日
    00
  • 10个中文成语,10种Python初学者常见错误

    哈喽兄弟们,我总结了Python中十种新手常见的错误,每一个都可以用成语来形容,看看各位遇到过多少次了! 一、画蛇添足 多余的分号 Python语言与大多数编程语言不相同,它的语句后面不需要加分号结尾。有些 Python 新手具有编写其它语言的丰富经验,一时还适应不过来,经常习惯性的加上“分号”: a = 5 # 正确a = 5; # 错误   二、附赘悬疣…

    Python开发 2023年4月2日
    00
  • Python实现将文本数据批量导入Excel表格,并按格式保存

    本文实现用Python将文本文件自动保存到Excel表格里面去。 需求 将锦江区.txt 文件中的数据整理到 锦江区.xlsx 的 锦江区 sheet ; 将推荐菜字段丢弃(保留前面14个字段) ; 将人均消费中的 ¥ 符号去掉,如果价格为空整条数据都不要; 成果展示 txt文本部分数据 效果 稍微打了点码,尊重一下别人。 代码展示 import openp…

    Python开发 2023年4月2日
    00
  • 用Python计算从1到500之间偶数的和

    兄弟们,今天来实现一下用Python计算1到500的偶数总和,灰常简单,检验一下大家基础学的怎么样! 涉及到的知识点 range 使用 for 循环 推导式 函数调用 # 这应该都学过吧,如果刚刚接触Python,基础都还没怎么学的话,加Q群 279199867,领取2022最新的Python视频教程、100本Python电子书、基础、爬虫、数据分析、web…

    Python开发 2023年4月2日
    00
  • Python做游戏其实很简单,只是你觉得难…

    很多小伙伴都喜欢小游戏源码,想学一手Python做小游戏,问我做游戏难不难,要怎么做,接下来我就介绍一下,如何用Python做游戏。 游戏演示 2048小游戏 表白弹窗 贪吃蛇 五子棋 俄罗斯方块 超多小游戏,让你一个爽个够! 用PyGame做游戏非常简单,我们今天第一篇文章,让大家实现一个可以在地图上移动的小猪。 基本框架 首先,无论你是做什么游戏,别管三…

    Python开发 2023年4月2日
    00
  • 趁这个软件还没倒闭,我连夜用Python下载了所有壁纸…

    最近啊,有些人总是喜欢乱点一些七七八八的网站,没错,就是那个巳月,点完了又喊我爬,自己不爬! 就是这些,眼熟吗,反正我一个不认识!!一开始我是严词拒绝的!我是那样的人吗?要不是他请我喝奶茶让我来,我才不瞎搞呢!     软件环境 Python 3.8 解释器 Pycharm 编辑器 模块使用 requests 数据请求模块 re 正则 代码展示 代码仅做展示…

    Python开发 2023年4月2日
    00
  • Python采集疫情数据,绘制可视化动态地图,实时查询疫情数据!

    疫情尚未结束,我们需要做好自己,时刻防范,不给别人添麻烦。 今天我们来尝试用Python抓取世界疫情,实现可视化地图展示。 话不多说直接开搞! 采集数据 1、数据来源 数据来源于TX新闻,链接展示不了,就只贴图了。     2、模块 import requests import csv # Python学习交流君羊:279199867   requests …

    2023年4月2日
    00
  • 八个超级好用的Python自动化脚本,简直太好用了

    每天你都可能会执行许多重复的任务,例如阅读新闻、发邮件、查看天气、打开书签、清理文件夹等等,使用自动化脚本,就无需手动一次又一次地完成这些任务,非常方便。而在某种程度上,Python 就是自动化的代名词。 小编今天分享 8 个非常有用的 Python 自动化脚本。喜欢记得收藏、关注、点赞。 1、自动化阅读网页新闻 这个脚本能够实现从网页中抓取文本,然后自动化…

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部