字符编码详解及由来(UNICODE,UTF-8,GBK) 比较详细

字符编码详解及由来(UNICODE, UTF-8, GBK)

什么是字符编码?

字符编码是将从键盘或其他输入设备输入的符号和文本转换为计算机可识别的格式的方法。每个字符在计算机内部都由二进制表示,字符编码则是将每个具体的字符映射到计算机内部的二进制表示。

UNICODE编码

UNICODE编码是一种用于表示字符的国际标准编码。它采用了统一的编码方案,把世界上各种文字的每个字符都映射到一个独一无二的数字,以便于计算机来识别和处理。UNICODE编码通常用16位或32位来表示一个字符。

Unicode编码大大简化了在计算机系统之间交换信息时的问题,可以说在国际信息交流和数据处理方面具有重要意义。

UTF-8编码

UTF-8编码是一种针对Unicode编码的可变长度字符编码,是由一些互联网先驱制定的编码方案。UTF-8编码使得表示任何字符变得可能,而且只需要占用1~4个字节,兼顾了可读性和可移植性。同时,UTF-8编码在全球范围内也得到了广泛的应用。

在UTF-8编码中,使用1~4个字节表示一个符号,其中英文字母和数字表示为1个字节,汉字占3个字节,而生僻字则可能占用4个字节。UTF-8编码为每个字符定义了一个唯一的二进制序列,从而使得在不同的计算机和平台之间传递文本变得更加容易。

示例1:

下面是字母“A”在UTF-8编码下的表示:

11100010 10000010 10100001

GBK编码

GBK编码是一种针对汉字的编码,它是在GB2312的基础上扩展而来,兼容了ASCII码,可以表示汉字和其他语言的字符。GBK编码采用双字节来编码汉字,因此不需要进行字符集转换(ASCII字符的编码与GBK相同),在国内广泛使用。

示例2:

下面是字母“A”在GBK编码下的表示:

01000001

总结

在计算机编程和Web开发中,必须理解和掌握字符编码相关的技术,包括Unicode、GBK和UTF-8等编码规范。同时需要了解不同编码之间的差异和特点,以便于在开发和交流中避免出错和误解。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:字符编码详解及由来(UNICODE,UTF-8,GBK) 比较详细 - Python技术站

(0)
上一篇 2023年5月26日
下一篇 2023年5月26日

相关文章

  • php生成0~1随机小数的方法(必看)

    PHP生成0~1随机小数的方法 在PHP中,生成0到1之间的随机小数可以使用rand()和mt_rand()函数。这两个函数可以返回一个介于0到PHP_INT_MAX之间的随机整数,因此可以将其除以PHP_INT_MAX,得到一个由0到1之间的随机小数。 使用rand()函数 $rand_num = rand(0, PHP_INT_MAX); $random…

    PHP 2023年5月26日
    00
  • PHP二进制与字符串之间的相互转换教程

    PHP二进制与字符串之间的相互转换教程 二进制和字符串是PHP中常见的数据类型,二者经常需要相互转换。本文将详细介绍PHP二进制与字符串之间的相互转换教程。 1.将二进制字符串转换为普通字符串 我们可以使用PHP的pack函数将二进制字符串转换为普通字符串。 例如,我们有一个二进制字符串,表示字母A的ASCII码: $binStr = ‘01000001’;…

    PHP 2023年5月26日
    00
  • PHP底层运行机制与工作原理详解

    PHP底层运行机制与工作原理详解 什么是PHP PHP是一种开源的服务器端脚本语言,可用于开发Web应用程序。 PHP与HTML一起使用,可以创建动态网页。它使用了很多语言,如C语言、Perl、Java、JavaScript、Tcl和Python,因此PHP代码语法有很多类似这些语言的特点。 PHP是被广泛使用的Web编程语言,目前市场上有很多使用PHP作为…

    PHP 2023年5月23日
    00
  • php匹配字符中链接地址的方法

    当我们需要从一段字符串中匹配出所有链接地址时,可以使用PHP正则表达式来实现。以下是具体步骤: 1.使用preg_match_all()函数进行字符串匹配,它返回一个包含所有匹配结果的数组。 2.所需的正则表达式可以使用已知的链接地址末端(.com、.cn等)或url特征(以http或www开头)来构建。可以使用以下正则表达式: $pattern = &qu…

    PHP 2023年5月26日
    00
  • php实现遍历多维数组的方法

    针对这个问题,我可以为大家提供一份“php实现遍历多维数组的方法”的完整攻略,具体内容如下: 一. 遍历多维数组方法 PHP中遍历多维数组有多种实现方法,这里主要介绍以下两种: 1. 使用array_walk_recursive函数 array_walk_recursive() 函数对多维数组中的每个元素应用用户自定义函数,该函数可递归到多层,与 array…

    PHP 2023年5月26日
    00
  • php 学习笔记

    为了学好 PHP,你需要掌握以下几个步骤: 1. 掌握 PHP 的基本语法 PHP 是一种服务端脚本语言,主要用于动态网页的开发。PHP 有自己的语法规则和关键字,因此你需要花一些时间来学习这些知识。 下面是一些基本的语法: <?php // 定义变量 $msg = "Hello, World!"; // 打印变量 echo $ms…

    PHP 2023年5月23日
    00
  • thinkphp中session和cookie无效的解决方法

    下面给出“thinkphp中session和cookie无效的解决方法”的完整攻略。 一、问题描述 在使用thinkphp开发过程中,我们经常会用到session和cookie,但有时它们可能会失效,导致数据无法正常保存和获取。常见的错误表现有:登录后无法保持登录状态、购物车数据无法保存等。 二、问题分析 session和cookie的失效可能是由于如下原因…

    PHP 2023年5月23日
    00
  • php一句话木马变形技巧

    PHP一句话木马指的是由一条PHP语句组成的一个后门程序,具有隐蔽性高、使用方便等优点。为了防止被杀软或网站审查系统检测出程序的特征,黑客们会进行木马变形。 一、基本架构 了解一句话木马变形技巧前,首先需要了解一句话木马的基本架构。一般情况下,它的基本架构由连接器和木马执行器两个部分组成: 连接器: 一句话木马变形技巧中最常见的是将连接器中‘eval($_P…

    PHP 2023年5月23日
    00
合作推广
合作推广
分享本页
返回顶部