关于java中FileInputStream读取文本文档时末尾的空白符

问题描述

如图,新建一个txt文本文档,里面存储了abcde五个字母

使用如下代码依次读取

public static void main(String[] args) throws IOException {
    FileInputStream fs = new FileInputStream("C:\\Program Files\\idea\\ideaProject\\test\\test.txt");
    byte[] bytes = new byte[2];
    int len = -1;
    while ((len = fs.read(bytes)) != -1){
        System.out.print(len + " -> ");
        String text = new String(bytes, 0, len);
        System.out.println(text);
    }
}

在大多数常见的字符编码中,如ASCII、UTF-8等,基本的字母、数字和一些特殊字符通常都是一个字节,而我们每次读取两个字节预期结果应该是刚好能读取三次,ab、cd、e

然而读取结果如下:

第三次读取的字节长度为2,并且读取了四次?为什么会产生这样的结果呢?

结果解释

使用文本编辑器,记事本、notepad++、vscode、idea等等编辑文本文档之后,通常在文件的最后会有一个空字符('\0')或换行符('\n'),这是因为大多数文本编辑器会自动在文件的末尾添加一个换行字符。这个字符不是文件内容的一部分,只是用于表示文件的结束。

不同的操作系统在文本文件的结束符上可能有所不同。在Unix/Linux系统中,通常只使用换行符('\n')表示行的结束,而在Windows系统中,通常使用回车符('\r')和换行符('\n')的组合("\r\n")来表示行的结束。

而'\r\n'占两个字节,并且为不可见字符,因此此时文件内容共有7个字节所以能读取4次,并且第4次读取的字节长度为1

验证

也很好验证,将末尾字符的编码打印出来

查阅编码得知,13和10分别对应'\r'和'\n'

InputStream是Java中用于从数据源读取数据的抽象类。它可以用于读取文件中的内容。在引用的代码中,通过创建一个FileInputStream对象,并将文件路径传入构造函数来打开与实际文件的连接。然后使用read()方法从输入读取数据,并将数据存储在字节数组中。当read()方法返回-1,表示已经读取到文件的末尾。为了释放系统资源,需要调用close()方法关闭。的代码中也展示了读取文件的示例。通过创建一个FileInputStream对象并传入文件路径,然后使用read()方法读取字节数据,并将其转换为字符输出。当read()方法返回-1,表示已经读取到文件的末尾。同样,需要使用close()方法关闭来释放资源。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [使用Inputstream读取文件](https://blog.youkuaiyun.com/weixin_33709609/article/details/86313238)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [字节输入【InputStream】(读文件)](https://blog.youkuaiyun.com/m0_56501550/article/details/128162722)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值