java读取文件生成字符串_如何从文件内容创建Java字符串?

从文件中读取所有文本

这是Java 7的一个紧凑,健壮的习惯用法,包含在一个实用程序方法中:static String readFile(String path, Charset encoding)

throws IOException {

byte[] encoded = Files.readAllBytes(Paths.get(path));

return new String(encoded, encoding);}

从文件中读取文本行

Java 7添加了一种方便的方法来将文件读取为文本行,表示为List。这种方法是“有损的”,因为行分隔符从每行的末尾剥离。List lines = Files.readAllLines(Paths.get(path), encoding);

Java 8添加了Files.lines()生成a 的方法Stream。同样,这种方法是有损的,因为剥离了行分隔符。如果IOException在读取文件时遇到a,则将其包装在一个中UncheckedIOException,因为Stream不接受抛出已检查异常的lambdas。try (Stream lines = Files.lines(path, encoding)) {

lines.forEach(System.out::println);}

这Stream确实需要一个close()电话; 这在API上记录很少,我怀疑很多人甚至没有注意到Stream有一种close()方法。请务必使用ARM块,如图所示。

如果您使用的是文件以外的源,则可以使用该lines()方法BufferedReader。

内存利用率

第一种保留换行符的方法可以暂时需要几倍于文件大小的内存,因为短时间内原始文件内容(一个字节数组)和解码后的字符(即使编码也是16位)因为文件中的8位)一次驻留在内存中。最安全的方法是应用于您知道相对于可用内存较小的文件。

读取行的第二种方法通常更有效,因为用于解码的输入字节缓冲区不需要包含整个文件。但是,它仍然不适合相对于可用内存非常大的文件。

对于读取大型文件,您需要为程序设计一个不同的设计,一个从流中读取一块文本,处理它,然后继续下一个,重用相同的固定大小的内存块。这里,“大”取决于计算机规格。如今,这个阈值可能是几千兆字节的RAM。Stream如果您的输入“记录”恰好是单独的行,则使用a的第三种方法是这样做的一种方法。(使用readLine()方法BufferedReader是程序等同于这种方法。)

字符编码

原始帖子中的示例中缺少的一件事是字符编码。在某些特殊情况下,平台默认值是您想要的,但它们很少见,您应该能够证明您的选择。

在StandardCharsets类中定义的所有Java运行时所需要的编码的一些常量:String content = readFile("test.txt", StandardCharsets.UTF_8);

该平台默认可从该Charset类本身:String content = readFile("test.txt", Charset.defaultCharset());

注意:这个答案很大程度上取代了我的Java 6版本。Java 7的实用程序安全地简化了代码,使用映射字节缓冲区的旧答案阻止了读取的文件被删除,直到映射的缓冲区被垃圾收集。您可以通过此答案中的“已编辑”链接查看旧版本。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值