python皮尔逊相关性数据分析分析及实例代码

Python 皮尔逊相关性数据分析分析及实例代码

什么是皮尔逊相关性分析?

在统计学中,皮尔逊相关系数(PCC),又称皮尔逊积矩相关系数(PPMC)是度量两个变量X和Y之间线性相关程度的一种统计指标。它由卡尔·皮尔逊于1895年提出,因此得名。

皮尔逊相关系数的取值范围是-1至1,在统计学中,通常采用以下方式来解释两个变量之间的关系:

  • 如果相关系数为 1,则说明两个变量完全正相关。
  • 如果相关系数为 -1,则说明两个变量完全负相关。
  • 如果相关系数为 0,则说明两个变量之间没有线性关系。

如何使用Python进行皮尔逊相关系数分析

Python 中的 Scipy 模块提供了 pearsonr() 函数,可以用来计算两个变量之间的皮尔逊相关系数。下面是使用 Scipy 计算皮尔逊相关系数的示例代码:

from scipy.stats import pearsonr

x = [1, 2, 3, 4, 5]
y = [5, 4, 3, 2, 1]

corr, _ = pearsonr(x, y)
print('Pearsons correlation: %.3f' % corr)

输出结果:-1.000

以上代码中,使用了 pearsonr() 函数计算 x 和 y 两个向量之间的皮尔逊相关系数,输出结果为 -1.0。

示例1:使用皮尔逊相关系数分析身高和体重之间的关系

from scipy.stats import pearsonr
import matplotlib.pyplot as plt

heights = [167, 170, 175, 172, 155, 158, 162, 171, 175, 177]
weights = [86, 75, 70, 63, 54, 58, 57, 64, 68, 79]

corr, _ = pearsonr(heights, weights)
print('Pearsons correlation: %.3f' % corr)

plt.scatter(heights, weights)
plt.title('Height vs Weight')
plt.xlabel('Height (cm)')
plt.ylabel('Weight (kg)')
plt.show()

输出结果:Pearsons correlation: 0.215

以上代码中,通过计算身高(heights)和体重(weights)之间的皮尔逊相关系数(corr),我们可以看到两个变量之间的相关性很弱,相关系数为0.215。

示例2:使用皮尔逊相关系数检查两组数据集之间的相关性

from scipy.stats import pearsonr
import numpy as np

dataset1 = np.random.rand(100)
dataset2 = np.random.rand(100)

corr, _ = pearsonr(dataset1, dataset2)
print('Pearsons correlation: %.3f' % corr)

输出结果:Pearsons correlation: 0.054

以上代码中,我们创建了两个长度为 100 的随机数组(dataset1 和 dataset2),通过计算两者之间的皮尔逊相关系数,我们可以看到它们之间几乎没有线性关系,相关系数仅为 0.054。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python皮尔逊相关性数据分析分析及实例代码 - Python技术站

(0)
上一篇 2023年5月18日
下一篇 2023年5月18日

相关文章

  • 03云计算架构

    云计算的本质 云计算的本质是一切IT即服务 云计算为大数据提供计算平台 虚拟化是云计算的基石 云数据中心 构造主要有两种模式 传统模式 数据中心基于集装箱的数据中心,由Google首创 云工作负载模式 时开时停模式 用户迅速增长模式 瞬时暴涨模式 周期性增减模式 云计算架构 中央集权架构 客户机/服务器(C/S)架构 中间层架构 浏览器/服务器(B/S)架构…

    云计算 2023年4月11日
    00
  • 【大数据和云计算技术社区】分库分表技术演进&最佳实践笔记

    1.需求背景 移动互联网时代,海量的用户每天产生海量的数量,这些海量数据远不是一张表能Hold住的。比如 用户表:支付宝8亿,微信10亿。CITIC对公140万,对私8700万。 订单表:美团每天几千万,淘宝历史订单百亿、千亿。 交易流水表 2.选择方案 (1)NoSQL/NewSQL(不选择)      选择RDBMS,不选择NoSQL/NewSQL,主要…

    云计算 2023年4月11日
    00
  • python中get和post有什么区别

    在Python中,GET和POST请求是两种常见的HTTP请求方式,主要的区别在于数据传输的方式和数据包大小的限制。 GET请求 GET请求是一种在URL中传输数据的请求方式。当使用GET请求时,数据会以一种可见的形式展现在URL中,因此GET请求比较适用于请求数据量比较少的情况。一般而言,GET请求的使用场景包括: 从服务器请求某个资源; 通过URL中的数…

    云计算 2023年5月18日
    00
  • 云计算应用的五个特性和四种部署方式

    云计算的五个关键特性,用了“SALES”概括,包含了未来的商业模式,服务模式的内涵。如果满足这几个方面,我们就可以说他叫做“云”: 第一个是按需自助服务(On Demand Self-Service),前面讲的技术跟业务之间有一个矛盾,如果业务部门可以自助做一些工作,IT压力会减少很多。 第二个就是泛网的访问(Broad Network Access) ,无…

    云计算 2023年4月13日
    00
  • 铁人三项手表品牌如何选择 三铁智能手表十大品牌排行榜

    以下是“铁人三项手表品牌如何选择 三铁智能手表十大品牌排行榜”的完整攻略: 1. 铁人三项手表品牌如何选择 选择一款适合自己的铁人三项手表需要考虑多个因素,包括品牌、功能、价格等。以下是一些选择铁人三项手表品牌的建议: 选择知名品牌:知名品牌的铁人三项手表通常具有更好的品质和可靠性,而且售后服务也更加完善。 选择适合自己的功能:不同的铁人三项手表具有不同的功…

    云计算 2023年5月16日
    00
  • 结合.net框架在C#派生类中触发基类事件及实现接口事件

    下面是关于“结合.net框架在C#派生类中触发基类事件及实现接口事件”的完整攻略,包含两个示例说明。 简介 在C#中,我们可以使用.net框架来触发基类事件和实现接口事件。在本攻略中,我们将介绍如何在C#派生类中触发基类事件和实现接口事件,并提供一些示例说明。 步骤 在C#派生类中触发基类事件和实现接口事件时,我们可以通过以下步骤来实现: 定义基类事件或接口…

    云计算 2023年5月16日
    00
  • jQuery中ajax和post处理json的不同示例对比

    jQuery中ajax和post处理json的不同示例对比 在jQuery中,我们可以使用ajax和post方法来处理JSON数据。虽然它们都可以用于发送JSON数据,但它们之间有一些不同之处。本文将提供一个完整的攻略,包括如何使用ajax和post方法来处理JSON数据,并对它们之间的不同之处进行比较。 示例1:使用ajax方法处理JSON数据 以下是一个…

    云计算 2023年5月16日
    00
  • centos7中firewall防火墙命令详解

    在 CentOS 7 中,firewall 是默认的防火墙软件。它可以帮助我们保护服务器免受网络攻击。本文将深入浅析 CentOS 7 中 firewall 防火墙命令的详细使用方法,包括启动、停止、重启、开放端口、关闭端口等操作。 启动、停止、重启 firewall 启动 firewall: systemctl start firewalld 停止 fir…

    云计算 2023年5月16日
    00
合作推广
合作推广
分享本页
返回顶部