Python正则表达式反对Latin-1字符编码？

2023年4月6日上午12:00 • Python开发

yizhihongxing

【问题标题】：Python regex against Latin-1 character encoding?Python正则表达式反对Latin-1字符编码？
【发布时间】：2023-04-05 02:08:02
【问题描述】：

我有一个包含（我相信）latin-1 编码的文件。

但是，我无法将正则表达式与此文件匹配。

如果我 cat 文件，它看起来很好：

但是，我找不到字符串：

In [12]: txt = open("b").read()

In [13]: print txt
  <Vw_IncidentPipeline_Report>


In [14]: txt
Out[14]: '\x00 \x00 \x00<\x00V\x00w\x00_\x00I\x00n\x00c\x00i\x00d\x00e\x00n\x00t\x00P\x00i\x00p\x00e\x00l\x00i\x00n\x00e\x00_\x00R\x00e\x00p\x00o\x00r\x00t\x00>\x00\r\x00\n'

In [22]: txt.find("Vw_IncidentPipeline_Report")
Out[22]: -1

In [23]: txt.decode("latin-1")
Out[23]: u'\x00 \x00 \x00<\x00V\x00w\x00_\x00I\x00n\x00c\x00i\x00d\x00e\x00n\x00t\x00P\x00i\x00p\x00e\x00l\x00i\x00n\x00e\x00_\x00R\x00e\x00p\x00o\x00r\x00t\x00>\x00\r\x00\n'

In [25]: txt.decode("utf-16le")
Out[25]: u'\u2000\u2000\u3c00\u5600\u7700\u5f00\u4900\u6e00\u6300\u6900\u6400\u6500\u6e00\u7400\u5000\u6900\u7000\u6500\u6c00\u6900\u6e00\u6500\u5f00\u5200\u6500\u7000\u6f00\u7200\u7400\u3e00\u0d00\u0a00'

如何成功解码字符串，以便在其中找到字符串？

【问题讨论】：

文件开头是否有字节序标记（'\xff\xfe'或'\xfe\xff'）？
除非 OP 编辑了上述脚本，否则文件显然是尖叫的 (a) 以 UTF-16BE 编码 (b) 开头没有 BOM。

标签：
python
encoding
utf-8
character-encoding

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Python正则表达式反对Latin-1字符编码？ - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

使用 python 检索 MusicBrainz 指纹

上一篇 2023年4月6日

从 Pycharm Python 控制台写入远程 X 服务器时不显示任何内容

下一篇 2023年4月6日

python通过ssh-powershell监控windows的方法

下面是详细的“Python通过SSH-PowerShell监控Windows”的攻略。 1. 安装必要的工具在开始之前，我们需要安装一些必要的工具，包括SSH客户端、PowerShell、和Python的Paramiko、PyPSUtil模块。SSH客户端我们这里选择OpenSSH，这是一个开源的SSH客户端，可在Windows上安装和使用。PowerSh…

python 2023年6月3日
000
python数组排序方法之sort、sorted和argsort详解

Python数组排序方法之sort、sorted和argsort详解排序概述排序是将一组无序或者部分有序的数据按照一定的规则进行重新排列，使其成为有序的数据序列，便于查找、统计等操作。在Python中，对列表、元组和一维数组进行排序操作比较常见。排序方法 Python提供了多种排序方法，主要包括sort、sorted和argsort三种。下面我们分别进…

python 2023年6月5日
000
利用Python实现简单的Excel统计函数

以下是“利用Python实现简单的Excel统计函数”的完整实例教程： 1. 引言 Python可以很方便地对Excel文件进行读写和处理，本文将介绍如何使用Python实现简单的Excel统计函数。为了实现这个目标，我们将使用Pandas库，它是一个用于数据处理的强大的Python库。如果您还不熟悉Pandas库，可以先查看Pandas的官方文档。 2. …

python 2023年5月13日
000
Python代码调试的几种方法总结

Python代码调试的几种方法总结调试是软件开发中必不可少的一环，有了良好的调试习惯和技能，可以大大提高代码的开发质量。Python作为一种脚本语言，特别适合快速开发，但开发中难免会遇到一些bug，本篇文章将介绍几种Python代码调试的方法。方法一：print语句调试法这可能是一种最传统的调试方法了，通过在代码中添加print语句，输出变量的值或执行…

python 2023年5月13日
000
Python基于百度AI实现OCR文字识别

Python基于百度AI实现OCR文字识别攻略一、前置条件注册百度AI，获取API Key和Secret Key 安装 Python3，并安装所需第三方库 requests bash pip install requests 二、百度AI接口调用导入requests库 python import requests 设置请求url和headers信息 p…

python 2023年5月18日
000
Python中如何进行进程间通信？

Python中进行进程间通信的方式有多种，例如使用Queue、Pipe等方式。下面将分别介绍这些方式的使用方法。使用Queue进行进程间通信 Queue是Python内置的线程安全的队列，可以在多个进程间共享数据。使用Queue进行进程间通信，需要创建一个Queue对象，然后在不同的进程中使用put和get方法向和从队列中取出数据。以下是一个使用Queu…

python 2023年4月19日
000
详解Python如何生成词云的方法

下面是详解Python如何生成词云的方法的完整攻略。 1. 安装和导入必要的Python库在使用Python生成词云之前，我们需要先安装和导入必要的Python库，其中最主要的是wordcloud库和matplotlib库。安装可以通过pip命令进行，具体方法如下： pip install wordcloud matplotlib 导入wordcloud和…

python 2023年5月31日
000
Python Flask 搭建微信小程序后台详解

我来详细讲解一下“Python Flask 搭建微信小程序后台详解”的完整攻略。 1. 什么是Python Flask Python Flask是一个轻量级的 Web 框架，它基于 Python 语言开发，被广泛应用于 Web 应用开发。 2. 搭建Python Flask项目（1）安装Python环境由于Python Flask是基于Python语言开发…

python 2023年5月23日
000

合作推广

合作推广

返回顶部