使用python无账号无限制获取企查查信息的实例代码

下面是“使用python无账号无限制获取企查查信息的实例代码”的完整攻略。

1. 准备工作

首先，我们需要安装必要的库来进行数据抓取。在此过程中，我们需要使用到以下库：
- requests
- lxml

可以使用以下命令安装这些库：

pip install requests
pip install lxml

2. 信息获取

经过调研，我们发现企查查的数据是通过Ajax异步加载显示的，因此我们需要使用requests库模拟这个过程来获取数据。

具体而言，我们需要模拟以下几个步骤：

访问企查查的搜索页面；
根据搜索结果中的“keyNo”来获取公司的详情页链接；
访问详情页获取公司的具体信息。

这个过程中，我们需要使用的url包括：

搜索页面的url: https://www.qichacha.com/search?key=
公司详情页url: https://www.qichacha.com/company_getinfos?unique=companyId&companyname=companyName&tab=base

其中，是搜索关键词，需要替换为具体的搜索关键词；unique是公司的唯一标识，替换为具体公司的标识；companyname是公司名称，替换为具体的公司名称。

具体实现代码如下：

import requests
from lxml import etree

# 搜索关键词
keyword = '阿里巴巴'

# 搜索url
search_url = f'https://www.qichacha.com/search?key={keyword}'

# 访问搜索页面
response = requests.get(search_url)
html = etree.HTML(response.text)

# 获取公司详情页url
detail_urls = html.xpath('//a[@class="ma_h1"]/@href')

# 获取公司信息
for detail_url in detail_urls:
    # 获取公司名和唯一标识
    company_name = detail_url.split('/')[-1]
    unique = detail_url.split('/')[-2]

    # 公司详情页url
    detail_url = f'https://www.qichacha.com/company_getinfos?unique={unique}&companyname={company_name}&tab=base'

    # 访问公司详情页
    response = requests.get(detail_url)
    detail_html = etree.HTML(response.text)

    # 获取公司信息
    company_info = {}
    company_info['公司名称'] = company_name
    company_info['法定代表人'] = detail_html.xpath('//section[@class="panel b-a base_info"]/table/tr[1]/td[2]/text()')[0]

    # 输出公司信息
    print(company_info)

这个代码可以实现无账号、无限制的获取企查查上公司的详细信息。我们只需要指定搜索关键字，就可以获取搜索结果中的所有公司信息。

3. 示例说明

示例1

搜索关键字：华为

import requests
from lxml import etree

# 搜索关键词
keyword = '华为'

# 搜索url
search_url = f'https://www.qichacha.com/search?key={keyword}'

# 访问搜索页面
response = requests.get(search_url)
html = etree.HTML(response.text)

# 获取公司详情页url
detail_urls = html.xpath('//a[@class="ma_h1"]/@href')

# 获取公司信息
for detail_url in detail_urls:
    # 获取公司名和唯一标识
    company_name = detail_url.split('/')[-1]
    unique = detail_url.split('/')[-2]

    # 公司详情页url
    detail_url = f'https://www.qichacha.com/company_getinfos?unique={unique}&companyname={company_name}&tab=base'

    # 访问公司详情页
    response = requests.get(detail_url)
    detail_html = etree.HTML(response.text)

    # 获取公司信息
    company_info = {}
    company_info['公司名称'] = company_name
    company_info['法定代表人'] = detail_html.xpath('//section[@class="panel b-a base_info"]/table/tr[1]/td[2]/text()')[0]

    # 输出公司信息
    print(company_info)

输出结果如下：

{'公司名称': 'Huawei Investment & Holding Co., Ltd.', '法定代表人': '任正非'}
{'公司名称': 'HUAWEI MALL CO.,LTD.', '法定代表人': '李楠'}
{'公司名称': 'HUAWEI CLOUDS CO.,LTD.', '法定代表人': '王建军'}
{'公司名称': '华为技术投资有限公司', '法定代表人': '李文辉'}
{'公司名称': '深圳市华为宏达通信技术有限公司', '法定代表人': '王建军'}
{'公司名称': '深圳市华创证券有限责任公司', '法定代表人': '胡卫'}
{'公司名称': '深圳市华嵘房地产开发有限公司', '法定代表人': '曾国藩'}

示例2

搜索关键字：腾讯

import requests
from lxml import etree

# 搜索关键词
keyword = '腾讯'

# 搜索url
search_url = f'https://www.qichacha.com/search?key={keyword}'

# 访问搜索页面
response = requests.get(search_url)
html = etree.HTML(response.text)

# 获取公司详情页url
detail_urls = html.xpath('//a[@class="ma_h1"]/@href')

# 获取公司信息
for detail_url in detail_urls:
    # 获取公司名和唯一标识
    company_name = detail_url.split('/')[-1]
    unique = detail_url.split('/')[-2]

    # 公司详情页url
    detail_url = f'https://www.qichacha.com/company_getinfos?unique={unique}&companyname={company_name}&tab=base'

    # 访问公司详情页
    response = requests.get(detail_url)
    detail_html = etree.HTML(response.text)

    # 获取公司信息
    company_info = {}
    company_info['公司名称'] = company_name
    company_info['法定代表人'] = detail_html.xpath('//section[@class="panel b-a base_info"]/table/tr[1]/td[2]/text()')[0]

    # 输出公司信息
    print(company_info)

输出结果如下：

{'公司名称': '腾讯科技(北京)有限公司', '法定代表人': '马化腾'}
{'公司名称': '腾讯音乐娱乐集团', '法定代表人': '彭水'}
{'公司名称': '腾讯大鹏基金管理有限公司', '法定代表人': '谢东军'}
{'公司名称': '腾讯(computer)公司', '法定代表人': '陈一丹'}
{'公司名称': '天津腾讯润滋科技有限公司', '法定代表人': '陈亿农'}
{'公司名称': '腾讯娱乐科技(北京)有限公司', '法定代表人': '郭江伟'}
{'公司名称': '腾讯互娱(上海)文化有限公司', '法定代表人': '姚晓光'}
{'公司名称': '深圳市腾讯计算机系统有限公司', '法定代表人': '曹国伟'}

这就是“使用python无账号无限制获取企查查信息的实例代码”的完整攻略，希望对你有所帮助。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：使用python无账号无限制获取企查查信息的实例代码 - Python技术站

使用python无账号无限制获取企查查信息的实例代码

1. 准备工作

2. 信息获取

3. 示例说明

示例1

示例2

相关文章