java 逐行读取txt文本如何解决中文乱码

要想解决中文乱码问题，需要了解Java中文编码方式的特点。Java会默认使用UTF-8编码格式，而读取txt文本时可能会面对其他编码格式，因此需要进行适当的转码操作。

以下是逐行读取txt文本并解决中文乱码问题的步骤：

创建一个FileReader对象，用于读取txt文件，并指定编码格式为GBK。

FileReader fr = new FileReader("example.txt", "GBK");

创建一个BufferedReader对象，用于逐行读取txt文件。为了能够适应不同编码格式，需要使用InputStreamReader进行转码。

BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("example.txt"), "GBK"));

使用while循环逐行读取txt文本，直到读取到末尾。

String line;
while ((line = br.readLine()) != null) {
    // 处理每一行文本
}

在处理每一行文本时，可以通过将其转换为字节数组，再用指定的编码方式进行转码，来解决中文乱码问题。

String line;
while ((line = br.readLine()) != null) {
    byte[] bytes = line.getBytes("ISO-8859-1");
    line = new String(bytes, "GBK");
    // 处理每一行文本
}

示例一：

以下是一个简单的程序，用于读取txt文件并输出其中的内容，保证不会产生中文乱码问题。

import java.io.*;

public class Example {
    public static void main(String[] args) {
        try {
            BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("example.txt"), "GBK"));
            String line;
            while ((line = br.readLine()) != null) {
                byte[] bytes = line.getBytes("ISO-8859-1");
                line = new String(bytes, "GBK");
                System.out.println(line);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

示例二：

以下是另一个程序，用于读取txt文件并统计其中的中文字符数，同样保证不会产生中文乱码问题。

import java.io.*;

public class Example {
    public static void main(String[] args) {
        try {
            BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream("example.txt"), "GBK"));
            String line;
            int count = 0;
            while ((line = br.readLine()) != null) {
                byte[] bytes = line.getBytes("ISO-8859-1");
                line = new String(bytes, "GBK");
                for (int i = 0; i < line.length(); i++) {
                    char c = line.charAt(i);
                    if (c >= '\u4e00' && c <= '\u9fa5') {
                        count++;
                    }
                }
            }
            System.out.println("中文字符数为：" + count);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

以上两个示例代码可以解决中文乱码问题，逐行读取txt文本并且进行文本处理。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：java 逐行读取txt文本如何解决中文乱码 - Python技术站