使用python无账号无限制获取企查查信息的实例代码

下面是“使用python无账号无限制获取企查查信息的实例代码”的完整攻略。

1. 准备工作

首先,我们需要安装必要的库来进行数据抓取。在此过程中,我们需要使用到以下库:
- requests
- lxml

可以使用以下命令安装这些库:

pip install requests
pip install lxml

2. 信息获取

经过调研,我们发现企查查的数据是通过Ajax异步加载显示的,因此我们需要使用requests库模拟这个过程来获取数据。

具体而言,我们需要模拟以下几个步骤:

  1. 访问企查查的搜索页面;
  2. 根据搜索结果中的“keyNo”来获取公司的详情页链接;
  3. 访问详情页获取公司的具体信息。

这个过程中,我们需要使用的url包括:

  • 搜索页面的url: https://www.qichacha.com/search?key=
  • 公司详情页url: https://www.qichacha.com/company_getinfos?unique=companyId&companyname=companyName&tab=base

其中,是搜索关键词,需要替换为具体的搜索关键词;unique是公司的唯一标识,替换为具体公司的标识;companyname是公司名称,替换为具体的公司名称。

具体实现代码如下:

import requests
from lxml import etree

# 搜索关键词
keyword = '阿里巴巴'

# 搜索url
search_url = f'https://www.qichacha.com/search?key={keyword}'

# 访问搜索页面
response = requests.get(search_url)
html = etree.HTML(response.text)

# 获取公司详情页url
detail_urls = html.xpath('//a[@class="ma_h1"]/@href')

# 获取公司信息
for detail_url in detail_urls:
    # 获取公司名和唯一标识
    company_name = detail_url.split('/')[-1]
    unique = detail_url.split('/')[-2]

    # 公司详情页url
    detail_url = f'https://www.qichacha.com/company_getinfos?unique={unique}&companyname={company_name}&tab=base'

    # 访问公司详情页
    response = requests.get(detail_url)
    detail_html = etree.HTML(response.text)

    # 获取公司信息
    company_info = {}
    company_info['公司名称'] = company_name
    company_info['法定代表人'] = detail_html.xpath('//section[@class="panel b-a base_info"]/table/tr[1]/td[2]/text()')[0]

    # 输出公司信息
    print(company_info)

这个代码可以实现无账号、无限制的获取企查查上公司的详细信息。我们只需要指定搜索关键字,就可以获取搜索结果中的所有公司信息。

3. 示例说明

示例1

搜索关键字:华为

import requests
from lxml import etree

# 搜索关键词
keyword = '华为'

# 搜索url
search_url = f'https://www.qichacha.com/search?key={keyword}'

# 访问搜索页面
response = requests.get(search_url)
html = etree.HTML(response.text)

# 获取公司详情页url
detail_urls = html.xpath('//a[@class="ma_h1"]/@href')

# 获取公司信息
for detail_url in detail_urls:
    # 获取公司名和唯一标识
    company_name = detail_url.split('/')[-1]
    unique = detail_url.split('/')[-2]

    # 公司详情页url
    detail_url = f'https://www.qichacha.com/company_getinfos?unique={unique}&companyname={company_name}&tab=base'

    # 访问公司详情页
    response = requests.get(detail_url)
    detail_html = etree.HTML(response.text)

    # 获取公司信息
    company_info = {}
    company_info['公司名称'] = company_name
    company_info['法定代表人'] = detail_html.xpath('//section[@class="panel b-a base_info"]/table/tr[1]/td[2]/text()')[0]

    # 输出公司信息
    print(company_info)

输出结果如下:

{'公司名称': 'Huawei Investment & Holding Co., Ltd.', '法定代表人': '任正非'}
{'公司名称': 'HUAWEI MALL CO.,LTD.', '法定代表人': '李楠'}
{'公司名称': 'HUAWEI CLOUDS CO.,LTD.', '法定代表人': '王建军'}
{'公司名称': '华为技术投资有限公司', '法定代表人': '李文辉'}
{'公司名称': '深圳市华为宏达通信技术有限公司', '法定代表人': '王建军'}
{'公司名称': '深圳市华创证券有限责任公司', '法定代表人': '胡卫'}
{'公司名称': '深圳市华嵘房地产开发有限公司', '法定代表人': '曾国藩'}

示例2

搜索关键字:腾讯

import requests
from lxml import etree

# 搜索关键词
keyword = '腾讯'

# 搜索url
search_url = f'https://www.qichacha.com/search?key={keyword}'

# 访问搜索页面
response = requests.get(search_url)
html = etree.HTML(response.text)

# 获取公司详情页url
detail_urls = html.xpath('//a[@class="ma_h1"]/@href')

# 获取公司信息
for detail_url in detail_urls:
    # 获取公司名和唯一标识
    company_name = detail_url.split('/')[-1]
    unique = detail_url.split('/')[-2]

    # 公司详情页url
    detail_url = f'https://www.qichacha.com/company_getinfos?unique={unique}&companyname={company_name}&tab=base'

    # 访问公司详情页
    response = requests.get(detail_url)
    detail_html = etree.HTML(response.text)

    # 获取公司信息
    company_info = {}
    company_info['公司名称'] = company_name
    company_info['法定代表人'] = detail_html.xpath('//section[@class="panel b-a base_info"]/table/tr[1]/td[2]/text()')[0]

    # 输出公司信息
    print(company_info)

输出结果如下:

{'公司名称': '腾讯科技(北京)有限公司', '法定代表人': '马化腾'}
{'公司名称': '腾讯音乐娱乐集团', '法定代表人': '彭水'}
{'公司名称': '腾讯大鹏基金管理有限公司', '法定代表人': '谢东军'}
{'公司名称': '腾讯(computer)公司', '法定代表人': '陈一丹'}
{'公司名称': '天津腾讯润滋科技有限公司', '法定代表人': '陈亿农'}
{'公司名称': '腾讯娱乐科技(北京)有限公司', '法定代表人': '郭江伟'}
{'公司名称': '腾讯互娱(上海)文化有限公司', '法定代表人': '姚晓光'}
{'公司名称': '深圳市腾讯计算机系统有限公司', '法定代表人': '曹国伟'}

这就是“使用python无账号无限制获取企查查信息的实例代码”的完整攻略,希望对你有所帮助。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:使用python无账号无限制获取企查查信息的实例代码 - Python技术站

(0)
上一篇 2023年6月27日
下一篇 2023年6月27日

相关文章

  • Android inflater 用法及不同点

    下面是详细讲解“Android inflater 用法及不同点”的攻略: Android inflater 用法 在 Android 中,inflater 是一个可以把 XML 布局文件实例化为一个 View 对象的工具类。它的主要作用是帮助我们实例化布局文件,并使我们可以使用这些布局文件中定义的视图组件。 inflater 在 Android 中是十分重要…

    other 2023年6月27日
    00
  • VS2017怎么创建WPF应用程序?

    下面是关于 “VS2017怎么创建WPF应用程序?” 的完整攻略: 创建WPF应用程序 打开Visual Studio 2017并创建一个新的项目。 在“新建项目”对话框中,请选择“WPF应用程序”模板,然后输入项目名称和保存位置。点击“确定”按钮。 接下来,Visual Studio将为您创建一个默认的WPF应用程序并打开MainWindow.xaml窗口…

    other 2023年6月25日
    00
  • Jboss Marshalling服务端无法接受消息

    问题描述: 在使用 JBoss Marshalling 进行序列化和反序列化过程中,某些情况下可能会面临“服务器中断”或“服务端无法接收消息”等问题,这些问题可能会让我们的程序无法正常工作,需要找到并解决这些问题。 解决方法: 以下是解决问题的详细步骤: 步骤 1:了解问题 首先,我们需要了解问题的具体原因。在使用 JBoss Marshalling 过程中…

    other 2023年6月27日
    00
  • 解决vue动态路由异步加载import组件,加载不到module的问题

    确保使用 @babel/plugin-syntax-dynamic-import 插件 首先,要确保安装了 @babel/plugin-syntax-dynamic-import 插件,这个插件可以帮助我们正确解析动态导入语法,保证代码能够正确执行。如果没有安装该插件,可以执行以下命令安装: npm install –save-dev @babel/plu…

    other 2023年6月27日
    00
  • js实现随机8位验证码

    当然!下面是关于\”js实现随机8位验证码\”的完整攻略: js实现随机8位验证码 在JavaScript中,可以使用随机数和字符串操作来生成随机8位验证码。以下是两个示例: 示例1:使用Math.random()生成随机数 function generateCode() { var code = ”; var characters = ‘ABCDEFGH…

    other 2023年8月19日
    00
  • vim块操作

    Vim 块操作攻略 Vim 是一个非常流行的文本编辑器,提供了许多有用的功能,其中包括块操作。在本攻略中,我们将详细介绍如何使用 Vim 的块操作来编辑文本。 步骤1:选择块 在 Vim 中,可以使用 Ctrl + v 快捷键来选择块。以下是一个示例步骤: 在 Vim 中打开要编辑的文件。 按下 Ctrl + v 快捷键。 使用方向键或 hkl 键来选择块。…

    other 2023年5月6日
    00
  • ble协议栈入门一(基本概念)

    BLE协议栈入门一(基本概念) BLE(Bluetooth Low Energy)是一种低功耗蓝牙技术,广泛应用于物联网、智能家居、健康监测等领域。BLE协议栈是指在BLE设备中实现BLE协议的件栈,包括物理层、链路层、协议层和应用层。本攻略将介绍BLE协议栈的基本概,包BLE协议栈的组成、BLE协议栈的层次结构、BLE协议栈的工作原理等。 BLE协议栈的组…

    other 2023年5月7日
    00
  • c-‘scatterlist’在linux中如何工作?

    c-‘scatterlist’在Linux中如何工作? scatterlist是Linux内核中的一个数据结构,用于描述分散/聚集I/O(scatter/gather I/O)操作中的数据缓冲区。本攻略将介绍scatterlist的基本概念和使用。 scatterlist的基本概念 分散/聚集I/O操作中,数据通常存储在多个不续的缓冲区中例如,当从磁盘读取文…

    other 2023年5月9日
    00
合作推广
合作推广
分享本页
返回顶部