sql 连续活跃天数

1. 背景

已知数据集为:
sql 连续活跃天数
目的:
计算每个uid的连续活跃天数,并且每一段活跃期内的开始时间和结束时间

2. 步骤

第一步:处理数据集
处理数据集,使其满足每个uid每个日期只有一条数据。
第二步:以uid为主键,按照日期进行排序,计算row_number.

SELECT  uid
          ,`征信查询日期`
          ,ROW_NUMBER() OVER(PARTITION BY uid ORDER BY `征信查询日期` ASC) AS `rn`
          ,first_value(`征信查询日期`)over(PARTITION BY uid ORDER BY `征信查询日期` ASC) `fir`
          ,first_value(`征信查询日期`)over(PARTITION BY uid ORDER BY `征信查询日期` desc) `las`
FROM   input

sql 连续活跃天数

两个关键点:

  1. 序号rn可以看做一直活跃的情况下,活跃日期最大值和活跃日期最小值之间的天数差。那么,日期最大值与日期最小值之差如果不等于序号,就表明中间有不连续。
  2. 用'征信查询日期' - rn 可以计算一列"关键列",连续时间段内,它的关键列值是一样的
select *,DATE_SUB(`征信查询日期`,`rn`) as `关键列` from (
SELECT  uid
          ,`征信查询日期`
          ,ROW_NUMBER() OVER(PARTITION BY uid ORDER BY `征信查询日期` ASC) AS `rn`
          ,first_value(`征信查询日期`)over(PARTITION BY uid ORDER BY `征信查询日期` ASC) `fir`
          ,first_value(`征信查询日期`)over(PARTITION BY uid ORDER BY `征信查询日期` desc) `las`
FROM   input)

sql 连续活跃天数
第三步:以uid和关键列作为主键。

select uid, `关键列`,count(*) as `连续活跃天数`, min(`征信查询日期`) as `活跃开始时间`, max(`征信查询日期`) as `活跃结束时间` from (
select *, DATE_SUB(`征信查询日期`,`rn`) as `关键列` from (
SELECT  uid
          ,`征信查询日期`
          ,ROW_NUMBER() OVER(PARTITION BY uid ORDER BY `征信查询日期` ASC) AS `rn`
          ,first_value(`征信查询日期`)over(PARTITION BY uid ORDER BY `征信查询日期` ASC) `fir`
          ,first_value(`征信查询日期`)over(PARTITION BY uid ORDER BY `征信查询日期` desc) `las`
FROM   input
  ) )group by uid, `关键列`

sql 连续活跃天数

原文链接:https://www.cnblogs.com/tian1022/p/17310496.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:sql 连续活跃天数 - Python技术站

(0)
上一篇 2023年4月17日
下一篇 2023年4月17日

相关文章

  • openEuler、龙蜥Anolis、统信UOS系统下编译GreatSQL二进制包

    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。 GreatSQL是MySQL的国产分支版本,使用上与MySQL一致。 作者: Yejinrong/叶金荣 文章来源:GreatSQL社区投稿 背景介绍 编译环境 编译前准备工作 编译GreatSQL 初始化并启动GreatSQL数据库 运行sysbench测试 附录:编译sysbe…

    MySQL 2023年4月17日
    00
  • 解决Navicat Premium 连接 MySQL 8.0 报错”1251″的问题分析

    以下是解决Navicat Premium 连接 MySQL 8.0 报错”1251″的问题分析的完整攻略。 问题分析 当我们使用Navicat Premium连接MySQL 8.0时,可能会出现如下报错信息: 1251 – Client does not support authentication protocol requested by server.…

    MySQL 2023年5月18日
    00
  • MySQL开启慢查询方法及实例

    我来为您详细讲解如何开启MySQL的慢查询功能及示例说明。 什么是MySQL的慢查询? MySQL的慢查询是一种用于检测和记录MySQL数据库性能的工具,它会对执行时间超过特定阈值的查询进行记录,方便定位和优化慢查询问题。 如何开启MySQL的慢查询功能? 以下是开启MySQL慢查询的步骤: 登录MySQL服务器,并进入到mysql命令行客户端; 执行如下命…

    MySQL 2023年5月19日
    00
  • MySQL慢查询日志(Slow Query Log)

    MySQL慢查询日志是MySQL默认开启的一种日志记录,它可以用来记录MySQL中执行查询语句过程中耗时长的查询语句,以便于后期对这些查询进行优化,以提高MySQL服务器的性能。 MySQL慢查询日志可以记录下查询的时间、执行的SQL语句、所用的索引、扫描的行数、返回的行数等信息,这些信息都可以用来帮助我们分析SQL语句的性能问题,以及查找潜在的性能瓶颈所在…

    MySQL 2023年3月10日
    00
  • 解决ubuntu 16.04安装mysql5.7.17后,登录时出现ERROR 1045 (28000): Access denied for user ‘root’@’localhost’问题

    问题背景:在安装Ubuntu 16.04操作系统后,安装mysql5.7.17,并使用root用户尝试登录mysql时显示”ERROR 1045 (28000): Access denied for user ‘root’@’localhost'”错误提示。 解决过程: 步骤1. 卸载mysql-server 在安装mysql5.7.17之前,如果已经安装了…

    MySQL 2023年5月18日
    00
  • 关于mysql主备切换canal出现的问题解决

    关于”关于mysql主备切换canal出现的问题解决”的攻略,我们可以分成以下几个步骤来进行解释。 1. 背景介绍 首先,我们需要了解一下什么是mysql主备切换以及canal,以及它们在系统中的作用和重要性。mysql主备切换是指当前业务时刻只有一个数据库实例在工作,而其他的数据库实例则在备份模式下工作。当主实例出现故障时,备份实例会接管服务。canal是…

    MySQL 2023年5月18日
    00
  • mysql优化之慢查询分析+explain命令分析+优化技巧总结

    下面是 “mysql优化之慢查询分析+explain命令分析+优化技巧总结” 的详细攻略。 什么是慢查询? 慢查询指的是在执行SQL语句时,执行时间超过了预期的时间范围,一般来说大于0.1秒的SQL可以看作是慢查询。 如何进行慢查询分析? 在MySQL中,可以通过设置参数 slow_query_log 来开启慢查询记录功能。开启该功能后,所有执行时间超过设置…

    MySQL 2023年5月19日
    00
  • MySQL MyISAM存储引擎详解

    MySQL的存储引擎是MySQL的一种优秀的技术,其中MyISAM是其最基本的存储引擎。MyISAM是MySQL支持的一种基于表的存储引擎,它支持高效的读取和快速的键值查找,并允许使用大型数据表。下面我们将详细解释MyISAM存储引擎的具体特点和使用方法。 索引类型 MyISAM支持B-tree索引,这种索引类型非常适合于一些快速的查找操作。B-tree索引…

    MySQL 2023年3月9日
    00
合作推广
合作推广
分享本页
返回顶部