使用python无账号无限制获取企查查信息的实例代码

下面是“使用python无账号无限制获取企查查信息的实例代码”的完整攻略。

1. 准备工作

首先,我们需要安装必要的库来进行数据抓取。在此过程中,我们需要使用到以下库:
- requests
- lxml

可以使用以下命令安装这些库:

pip install requests
pip install lxml

2. 信息获取

经过调研,我们发现企查查的数据是通过Ajax异步加载显示的,因此我们需要使用requests库模拟这个过程来获取数据。

具体而言,我们需要模拟以下几个步骤:

  1. 访问企查查的搜索页面;
  2. 根据搜索结果中的“keyNo”来获取公司的详情页链接;
  3. 访问详情页获取公司的具体信息。

这个过程中,我们需要使用的url包括:

  • 搜索页面的url: https://www.qichacha.com/search?key=
  • 公司详情页url: https://www.qichacha.com/company_getinfos?unique=companyId&companyname=companyName&tab=base

其中,是搜索关键词,需要替换为具体的搜索关键词;unique是公司的唯一标识,替换为具体公司的标识;companyname是公司名称,替换为具体的公司名称。

具体实现代码如下:

import requests
from lxml import etree

# 搜索关键词
keyword = '阿里巴巴'

# 搜索url
search_url = f'https://www.qichacha.com/search?key={keyword}'

# 访问搜索页面
response = requests.get(search_url)
html = etree.HTML(response.text)

# 获取公司详情页url
detail_urls = html.xpath('//a[@class="ma_h1"]/@href')

# 获取公司信息
for detail_url in detail_urls:
    # 获取公司名和唯一标识
    company_name = detail_url.split('/')[-1]
    unique = detail_url.split('/')[-2]

    # 公司详情页url
    detail_url = f'https://www.qichacha.com/company_getinfos?unique={unique}&companyname={company_name}&tab=base'

    # 访问公司详情页
    response = requests.get(detail_url)
    detail_html = etree.HTML(response.text)

    # 获取公司信息
    company_info = {}
    company_info['公司名称'] = company_name
    company_info['法定代表人'] = detail_html.xpath('//section[@class="panel b-a base_info"]/table/tr[1]/td[2]/text()')[0]

    # 输出公司信息
    print(company_info)

这个代码可以实现无账号、无限制的获取企查查上公司的详细信息。我们只需要指定搜索关键字,就可以获取搜索结果中的所有公司信息。

3. 示例说明

示例1

搜索关键字:华为

import requests
from lxml import etree

# 搜索关键词
keyword = '华为'

# 搜索url
search_url = f'https://www.qichacha.com/search?key={keyword}'

# 访问搜索页面
response = requests.get(search_url)
html = etree.HTML(response.text)

# 获取公司详情页url
detail_urls = html.xpath('//a[@class="ma_h1"]/@href')

# 获取公司信息
for detail_url in detail_urls:
    # 获取公司名和唯一标识
    company_name = detail_url.split('/')[-1]
    unique = detail_url.split('/')[-2]

    # 公司详情页url
    detail_url = f'https://www.qichacha.com/company_getinfos?unique={unique}&companyname={company_name}&tab=base'

    # 访问公司详情页
    response = requests.get(detail_url)
    detail_html = etree.HTML(response.text)

    # 获取公司信息
    company_info = {}
    company_info['公司名称'] = company_name
    company_info['法定代表人'] = detail_html.xpath('//section[@class="panel b-a base_info"]/table/tr[1]/td[2]/text()')[0]

    # 输出公司信息
    print(company_info)

输出结果如下:

{'公司名称': 'Huawei Investment & Holding Co., Ltd.', '法定代表人': '任正非'}
{'公司名称': 'HUAWEI MALL CO.,LTD.', '法定代表人': '李楠'}
{'公司名称': 'HUAWEI CLOUDS CO.,LTD.', '法定代表人': '王建军'}
{'公司名称': '华为技术投资有限公司', '法定代表人': '李文辉'}
{'公司名称': '深圳市华为宏达通信技术有限公司', '法定代表人': '王建军'}
{'公司名称': '深圳市华创证券有限责任公司', '法定代表人': '胡卫'}
{'公司名称': '深圳市华嵘房地产开发有限公司', '法定代表人': '曾国藩'}

示例2

搜索关键字:腾讯

import requests
from lxml import etree

# 搜索关键词
keyword = '腾讯'

# 搜索url
search_url = f'https://www.qichacha.com/search?key={keyword}'

# 访问搜索页面
response = requests.get(search_url)
html = etree.HTML(response.text)

# 获取公司详情页url
detail_urls = html.xpath('//a[@class="ma_h1"]/@href')

# 获取公司信息
for detail_url in detail_urls:
    # 获取公司名和唯一标识
    company_name = detail_url.split('/')[-1]
    unique = detail_url.split('/')[-2]

    # 公司详情页url
    detail_url = f'https://www.qichacha.com/company_getinfos?unique={unique}&companyname={company_name}&tab=base'

    # 访问公司详情页
    response = requests.get(detail_url)
    detail_html = etree.HTML(response.text)

    # 获取公司信息
    company_info = {}
    company_info['公司名称'] = company_name
    company_info['法定代表人'] = detail_html.xpath('//section[@class="panel b-a base_info"]/table/tr[1]/td[2]/text()')[0]

    # 输出公司信息
    print(company_info)

输出结果如下:

{'公司名称': '腾讯科技(北京)有限公司', '法定代表人': '马化腾'}
{'公司名称': '腾讯音乐娱乐集团', '法定代表人': '彭水'}
{'公司名称': '腾讯大鹏基金管理有限公司', '法定代表人': '谢东军'}
{'公司名称': '腾讯(computer)公司', '法定代表人': '陈一丹'}
{'公司名称': '天津腾讯润滋科技有限公司', '法定代表人': '陈亿农'}
{'公司名称': '腾讯娱乐科技(北京)有限公司', '法定代表人': '郭江伟'}
{'公司名称': '腾讯互娱(上海)文化有限公司', '法定代表人': '姚晓光'}
{'公司名称': '深圳市腾讯计算机系统有限公司', '法定代表人': '曹国伟'}

这就是“使用python无账号无限制获取企查查信息的实例代码”的完整攻略,希望对你有所帮助。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:使用python无账号无限制获取企查查信息的实例代码 - Python技术站

(0)
上一篇 2023年6月27日
下一篇 2023年6月27日

相关文章

  • 在vscode成功配置python环境

    在VSCode成功配置Python环境 如果你是一名Python开发者,并且使用VSCode作为你的代码编辑器,那么你一定需要正确地配置Python环境。本文将指导你如何在VSCode中成功配置Python环境。 Step 1:安装Python 在成功配置Python环境之前,你需要先在你的计算机上安装Python。你可以在Python官网https://w…

    其他 2023年3月28日
    00
  • 深入理解JS中的变量及作用域、undefined与null

    深入理解JS中的变量及作用域、undefined与null 变量及作用域 在JavaScript中,变量是用于存储数据的容器。变量可以存储不同类型的数据,如数字、字符串、布尔值等。变量的作用域决定了它在代码中的可见性和访问性。 变量声明 在JavaScript中,可以使用关键字var、let或const来声明变量。其中,var是ES5中引入的声明变量的关键字…

    other 2023年7月29日
    00
  • Android控件之RatingBar自定义星级评分样式

    Android控件之RatingBar自定义星级评分样式攻略 RatingBar是Android中常用的评分控件,它可以让用户通过点击星星来进行评分。在本攻略中,我们将学习如何自定义RatingBar的样式,以满足特定的设计需求。 步骤一:创建自定义样式 首先,我们需要创建一个自定义的样式来定义RatingBar的外观。在res/values/styles.…

    other 2023年8月26日
    00
  • 华为v9怎么提速? 华为v9开发者模式的设置教程

    华为v9是一款优秀的智能手机,但是有时候会出现卡顿、慢等问题。如何提速呢?接下来我将为大家详细讲解华为v9的提速方法以及如何设置开发者模式。 华为v9的提速方法 关闭后台应用 后台应用是一个非常大的资源消耗器,关闭后台不使用的应用可以有效地提升手机的速度。方法如下: 1.进入手机的“设置”界面。 2.选择“应用管理”选项。 3.选择需要关闭的应用程序。 4.…

    other 2023年6月26日
    00
  • snowflakeid生成器

    snowflakeid生成器 什么是snowflakeid? Snowflakeid是Twitter的一个分布式唯一 ID 生成器,由于其高效和可靠性,已被广泛应用于许多领域的分布式系统中。它是一个64位整数,可以用于给分布式系统中的每一个数据记录生成唯一的标识符。 Snowflakeid 根据时间戳、数据中心 ID 和机器 ID 生成唯一 ID。其中,时间…

    其他 2023年3月28日
    00
  • 在 React 中使用 Redux 解决的问题小结

    在 React 中使用 Redux 解决的问题小结 Redux 是一个 JavaScript 状态管理库,它能够帮助我们更好地组织和管理应用程序的状态。在 React 应用中,Redux 通常用于管理应用程序的全局状态,以避免组件之间的深度嵌套和传递 Props 的复杂性。此外,Redux 还提供了强大的开发者工具,使得调试应用程序变得更加容易和高效。下面将…

    other 2023年6月20日
    00
  • Android开发之基本控件和四种布局方式详解

    Android开发之基本控件和四种布局方式详解 概述 本篇攻略主要介绍Android开发中常用的基本控件和四种布局方式,其中基本控件包括TextView、Button、EditText、ImageView、CheckBox、RadioButton、SeekBar、ProgressBar、Switch、Spinner等,四种布局方式包括线性布局(LinearL…

    other 2023年6月27日
    00
  • Android nonTransitiveRClass资源冲突问题浅析

    Android nonTransitiveRClass资源冲突问题浅析 在Android开发中,我们经常会遇到nonTransitiveRClass资源冲突的问题。这个问题通常发生在引入多个库或模块时,它们可能会包含相同的资源文件,导致编译时出现冲突。下面是对这个问题的详细分析和解决方法。 问题分析 当我们在项目中引入多个库或模块时,每个库或模块都会生成一个…

    other 2023年10月12日
    00
合作推广
合作推广
分享本页
返回顶部