python皮尔逊相关性数据分析分析及实例代码

Python 皮尔逊相关性数据分析分析及实例代码

什么是皮尔逊相关性分析?

在统计学中,皮尔逊相关系数(PCC),又称皮尔逊积矩相关系数(PPMC)是度量两个变量X和Y之间线性相关程度的一种统计指标。它由卡尔·皮尔逊于1895年提出,因此得名。

皮尔逊相关系数的取值范围是-1至1,在统计学中,通常采用以下方式来解释两个变量之间的关系:

  • 如果相关系数为 1,则说明两个变量完全正相关。
  • 如果相关系数为 -1,则说明两个变量完全负相关。
  • 如果相关系数为 0,则说明两个变量之间没有线性关系。

如何使用Python进行皮尔逊相关系数分析

Python 中的 Scipy 模块提供了 pearsonr() 函数,可以用来计算两个变量之间的皮尔逊相关系数。下面是使用 Scipy 计算皮尔逊相关系数的示例代码:

from scipy.stats import pearsonr

x = [1, 2, 3, 4, 5]
y = [5, 4, 3, 2, 1]

corr, _ = pearsonr(x, y)
print('Pearsons correlation: %.3f' % corr)

输出结果:-1.000

以上代码中,使用了 pearsonr() 函数计算 x 和 y 两个向量之间的皮尔逊相关系数,输出结果为 -1.0。

示例1:使用皮尔逊相关系数分析身高和体重之间的关系

from scipy.stats import pearsonr
import matplotlib.pyplot as plt

heights = [167, 170, 175, 172, 155, 158, 162, 171, 175, 177]
weights = [86, 75, 70, 63, 54, 58, 57, 64, 68, 79]

corr, _ = pearsonr(heights, weights)
print('Pearsons correlation: %.3f' % corr)

plt.scatter(heights, weights)
plt.title('Height vs Weight')
plt.xlabel('Height (cm)')
plt.ylabel('Weight (kg)')
plt.show()

输出结果:Pearsons correlation: 0.215

以上代码中,通过计算身高(heights)和体重(weights)之间的皮尔逊相关系数(corr),我们可以看到两个变量之间的相关性很弱,相关系数为0.215。

示例2:使用皮尔逊相关系数检查两组数据集之间的相关性

from scipy.stats import pearsonr
import numpy as np

dataset1 = np.random.rand(100)
dataset2 = np.random.rand(100)

corr, _ = pearsonr(dataset1, dataset2)
print('Pearsons correlation: %.3f' % corr)

输出结果:Pearsons correlation: 0.054

以上代码中,我们创建了两个长度为 100 的随机数组(dataset1 和 dataset2),通过计算两者之间的皮尔逊相关系数,我们可以看到它们之间几乎没有线性关系,相关系数仅为 0.054。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python皮尔逊相关性数据分析分析及实例代码 - Python技术站

(0)
上一篇 2023年5月18日
下一篇 2023年5月18日

相关文章

  • Python类属性与实例属性用法分析

    Python类属性与实例属性用法分析 在 Python 中,类属性和实例属性是面向对象编程中常用的概念。他们有着不同的用法和作用,下面将详细讲解类属性与实例属性的用法分析。 1. 类属性 类属性是属于类的属性,它没有被任何实例化对象所共有,而是为类本身所有,并在定义类时声明。即使没有通过类实例化对象,该属性也可以直接通过类名来访问。 1.1 类属性的定义和访…

    云计算 2023年5月18日
    00
  • 点云法线计算

    法线在点云的处理中有着重要的意义,大部分点云的处理都要用到法线如:点云平滑滤波、配准、特征计算与提取,曲率计算等都息息相关。关于法线的计算最早应该来源于“Surface Reconstruction from Unorganized Points” Hugues Hoppe的文章。 其中Hoppe关于法线的计算方法如下:         这个计算过程和方法对…

    云计算 2023年4月12日
    00
  • 五十二.用户配额管理 云主机类型管理 、 镜像管理 网络管理 案例和实例管理 、 安装额外计算节点

    1.用户和配额管理 创建myproject项目 通过Horizon创建user1用户 通过CLI创建user2用户,练习相关用户管理命令 通过Horizon和CLI对myproject进行配额调整   通过命令创建myproject项目 stack ~]# source ~/keystonerc_admin  //初始化环境变量 admin)]# opens…

    云计算 2023年4月10日
    00
  • Python实现的大数据分析操作系统日志功能示例

    安装Python相关库和工具 首先,我们需要安装Python及其相关的数据分析库和工具。本次示例中,我们需要的是pandas、numpy、matplotlib和seaborn这些库。如果你之前没有安装过这些库,可以采用以下命令进行安装: pip install pandas numpy matplotlib seaborn 加载日志数据 我们下载了一个名为”…

    云计算 2023年5月18日
    00
  • 1.3云计算融合存储产品及部署

    目标:描述Oceanstor V3系列存储产品系统组成及产品定位描述Oceanstor V3硬件结构及软件架构掌握存储系统与主机系统之间的连接一、存储型号低端型存储:Oceanstor 2200 2600 2800 V3/V5终端型存储:Oceanstor 5300 5500 5600 5800 6800 V3/V5高端型存储:Oceanstor 18000…

    云计算 2023年4月13日
    00
  • 云计算与虚拟化的区别

          1、传统数据中心面临的问题 在讲云计算和虚拟化之前,在没有云计算之前我们传统统数据中心面临的问题。 1.1、传统IDC托管 1 2 3 4 买台机器-放到IDC-安装系统-部署应用-买个域名-绑定上去-对外访问-ICP备案-ICP证(电子商务)—文网文(文化部备案)–公安局备案-接入备案(机房接入备案,备案现在机房管 ) 注销备案 — 各种坑…

    云计算 2023年4月13日
    00
  • 云计算撑起足球盛宴 阿里云CDN智能调度技术解读

    摘要: FIFA世界杯是4年一届的足球盛宴,全球的足球球迷们不管是真球迷还是泛球迷都乐在其中。今年世界杯很大的一个特色就是移动互联网直播,球迷朋友们可以在赛事期间通过手机、PAD、电视大屏来观看看高清比赛直播,特别是今年的优酷世界杯,大部分的用户对直播的清晰度和流畅度表示满意。 FIFA世界杯是4年一届的足球盛宴,全球的足球球迷们不管是真球迷还是泛球迷都乐在…

    云计算 2023年4月12日
    00
合作推广
合作推广
分享本页
返回顶部