GaussDB(DWS)字符串处理函数返回错误结果集排查

摘要:在使用字符串处理函数时,有时会出现非预期结果的场景。在排除使用问题后,应该从encoding和数据本身开始排查。

本文分享自华为云社区《GaussDB(DWS)字符串处理函数返回错误结果集排查》,作者: -CHEN111- 。

在使用字符串处理函数时,有时会出现非预期结果的场景。在排除使用问题后,应该从encoding和数据本身开始排查。

直接从案例出发。

(一)案例背景

客户执行instr查空格下标,子查询中查询结果与将子查询的结果粘出来单独执行结果集不一致。

SELECT instr((SELECT a FROM t1), ' ') xxxxx; 
SELECT a FROM t1; 的结果是a -> SELECT instr(a, ' ');

假设当前select a from t1;通过数据库连接客户端查询后显示结果集为“测试测 试 测试”

SELECT instr((SELECT a FROM t1), ' '); --结果为6
SELECT instr('测试测 试 测试', ' '); --结果为4

(二)问题排查

从上述结果集中可以看出,如果把SELECT a FROM t1;的结果集单独复制出来,则其结果4为预期结果,而当SELECT a FROM t1;作为子查询进行instr处理时,结果为6是不符合预期的。

排查主要从encoding和子查询结果集入手

1.先判断encoding

不同的编码类型下,字符串处理也不相同。

  • UTF8是按字符算个数
  • SQL_ASCII是按字节算个数

对于“测试测 试 测试”而言,按字符个数计算,SELECT instr('测试测 试 测试', ' ')的结果应为4;按字节个数计算,一个汉字占3个字节,SELECT instr('测试测 试 测试', ' ')的结果应为10。

查看当前库编放码类型

SHOW server_encoding;

结果为UTF8,故预期结果应该为4,但是SELECT instr((SELECT a FROM t1), ' ');结果却为6。

此时开始怀疑是否是客户端查询导致字符串结果集显示错误

2. 子查询结果集排查

通过编解码拿到字符串结果集的十六进制

SELECT encode(a, 'hex') AS res FROM t1;
                   res
------------------------------------------
 e6b58be8af95e6b58b0d0ae8af9520e6b58be8af95
(1 row)

在本地解码后结果集为

SELECT  convert_from(decode('e6b58be8af95e6b58b0d0ae8af9520e6b58be8af95','hex'),'utf8');
 convert_from
--------------
 测试测\r    +
 试 测试

可以看出,字符串结果集中,‘测试测’后并非空格,而是’\r +’。

3. 解决方案

将’\r +'按照编解码的形式替换空格

SELECT instr((SELECT a FROM t1), convert_from(decode('0d0a','hex'),'utf8'));

此时结果为4,为客户预期结果。

 

点击关注,第一时间了解华为云新鲜技术~

原文链接:https://www.cnblogs.com/huaweiyun/p/17377489.html

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:GaussDB(DWS)字符串处理函数返回错误结果集排查 - Python技术站

(0)
上一篇 2023年5月6日
下一篇 2023年5月6日

相关文章

  • 一文详解MySQL Join使用原理

    一文详解MySQL Join使用原理 MySQL Join 是 SQL 语言中相对复杂的一个命令,用于将不同表中的数据合并在一起。通过 Join 命令,可以将多个表中有关联的数据进行联合查询,从而更加快速、方便地获得我们所需的数据。本文将详细介绍 MySQL Join 的使用原理以及常见类型、操作方法。 Join 的基本概念 Join 是 MySQL 数据库…

    MySQL 2023年5月19日
    00
  • MySQL存储过程

    基本构造 delimiter $$ #定义终止符,可据习惯更换 CREATE PROCEDURE method_name() #创建方法 BEGIN #方法体开始 SELECT ‘code’; #方法体,写SQL语句 END #方法体终止 $$ #存储过程终止 基本语法 1.定义终止符 delimiter $$ #$$为自定义符,可据习惯更换 2.创建方法 …

    MySQL 2023年4月18日
    00
  • 一个 20 秒 SQL 慢查询优化处理方案

    一个 20 秒 SQL 慢查询优化处理方案 1. 确认慢查询 首先要确认该查询是慢查询,可以通过MySQL自带的slow query log来查看,也可以使用一些第三方工具,如pt-query-digest等。确认慢查询后,需要查看该SQL的执行计划,以确定具体的瓶颈和优化方向。 2. 分析执行计划 分析SQL的执行计划可以使用MySQL自带的explain…

    MySQL 2023年5月19日
    00
  • 在windows系统中设置MySQL数据库

    MySQL搭建 效果图 step1:下载安装包 https://downloads.mysql.com/archives/community/ step2:解压后即完成安装 step3:创建 my.ini 配置文件(注意路径) [mysqld] # 默认端口 port=3306 # mysql的安装目录,也是工作目录 basedir=”D:\\mysql-5…

    2023年4月8日
    00
  • MYSQL常见出错代码对照

    MySQL是一种广泛使用的关系型数据库管理系统。在进行数据库开发时,常常会遇到各种各样的错误码。本文将详细讲解“MYSQL常见出错代码对照”的攻略,让开发者们能够更好的预测和解决问题。 错误码的类型: MySQL的错误码主要分为以下两大类: 系统错误码 MySQL错误码 系统错误码 系统错误码通常是操作系统本身或与之相关的软件返回的错误代码, 常用的包括: …

    MySQL 2023年5月18日
    00
  • 由浅入深学MYSQL之–MySQL分组查询详解

    前言 从今天开始本系列文内容就带各位小伙伴学习数据库技术。数据库技术是Java开发中必不可少的一部分知识内容。也是非常重要的技术。本系列教程由浅入深, 全面讲解数据库体系。 非常适合零基础的小伙伴来学习。 全文大约 【1066】字,不说废话,只讲可以让你学到技术、明白原理的纯干货!本文带有丰富案例及配图,让你更好的理解和运用文中的技术概念,并可以给你带来具有…

    MySQL 2023年5月6日
    00
  • MySQL生成千万测试数据以及遇到的问题

    下面是关于“MySQL生成千万测试数据以及遇到的问题”的完整攻略。 一、背景介绍 在进行数据分析、测试或性能优化等操作时,通常需要使用一定量的测试数据来模拟真实场景。但手动添加大量数据很费时费力,因此本文介绍一种可以自动生成千万级别测试数据的方法。 二、使用工具 本文使用Faker库生成随机数据,并通过Python语言代码将随机数据导入到MySQL数据库中。…

    MySQL 2023年5月18日
    00
  • MySQL优化GROUP BY(松散索引扫描与紧凑索引扫描)

    MySQL中的GROUP BY语句可以用于将相似的数据分组并计算其汇总值。但是,当数据集很大时,GROUP BY语句对性能的影响也会很大。本文将详细讲解如何通过松散索引扫描和紧凑索引扫描来优化MySQL中的GROUP BY语句。 松散索引扫描优化 在MySQL中,使用GROUP BY语句分组时,如果不指定排序(ORDER BY)的话,MySQL会随机选择一个…

    MySQL 2023年5月19日
    00
合作推广
合作推广
分享本页
返回顶部