【问题标题】:Detecting empty string when decoding byte array into unicode? (Python)将字节数组解码为 un​​icode 时检测空字符串? (Python)
【发布时间】:2023-04-07 23:55:01
【问题描述】:

我正在尝试逐字符读取字节数组并将其解码为 un​​icode 字符串,如下所示:

current_character = byte_array[0:1].decode("utf-8")

对于每个字符,我正在尝试检查 .decode("utf-8") 的结果是否等于空字符串,但我似乎无法检测到这一点。当我打印出解码结果时,我得到了空字符串。但是如何将这种检测转化为代码呢?

我试过了:

if not current_character

if current_character is u""

但它们都不起作用。有什么建议吗?

【问题讨论】:

  • current_character = byte_array.decode("utf-8")[0:1] 怎么样?
  • 他们不工作是什么意思?另外,您可以为byte_array 添加示例值吗?
  • 不相关:utf-8 是一种可变长度编码:如果允许任意 utf-8 编码输入,则一次解码单个字节是不正确的。

标签:
python
unicode