<3> Filter Stream & Data Stream & Streams in memory

最新推荐文章于 2023-08-20 09:15:00 发布

最新推荐文章于 2023-08-20 09:15:00 发布 · 177 阅读

文章标签：

#Filter stream #Data stream #Streams in memory

java I/O 专栏收录该内容

6 篇文章

订阅专栏

本文详细介绍了 Java 中的 Filter Streams、Data Streams 和内存中的 Streams。包括如何通过 Filter Streams 进行数据预处理，Data Streams 如何处理各种数据类型，以及 SequenceInputStream、ByteArrayInputStream 和 Piped Streams 的使用。

[b]六、Filter Streams[/b]
Filter input Streams从[b]预先[/b]存在的输入流（比如FileInputStream）中读取数据，在把数据发送给客户端程序之前可以对数据进行[b]预处理[/b]。Filter output Streams把数据写到预先存在的输出流（比如FileOutputStream）里，可以在把数据写到底层的输出流[b]之前[/b]再加工数据。[color=red]一个底层的stream之上可以叠加多个filter[/color]。Filter Stream可以用来完成加密，压缩，缓存等操作。

Filter一词来源于滤水器（water filter）。滤水器位于水管和水源之间，[b]stream filter位于数据源和最终的目的地之间[/b]，在此间可以使用特定的算法处理数据。

[b]6.1 The Filter Stream Classes[/b]
java.io.FilterInputStream和java.io.FilterOutputStream是各具体filter stream实现类的父类。

public class FilterInputStream extends InputStream 
public class FilterOutputStream extends OutputStream

这两个类都有一个[b]protected[/b]的构造方法，必须指明要进行预处理的底层的stream(specify the underlying stream from which the filter stream reads or writes data)。
protected FilterInputStream(InputStream in)
protected FilterOutputStream(OutputStream out)
指定的底层stream会被分别保存到protected的成员变量里：
protected InputStream in
protected OutputStream out
[b][color=red]因为这两个类的构造方法是protected的，所以只能由子类来创建具体的对象(Filter Stream classes 的实现实际上是装饰器模式的应用)。[/color][/b]

FilterOutputStream的close()方法实现如下:

public void close() throws IOException 
{ 
    out.close(); 
}

[color=red]因此，关闭一个filter stream也就是关闭了底层实际的stream，无论是Filter inputstream还是OutputStream，也无论嵌套几层Filter stream都是这样。[/color]

[b]6.2 The Filter Stream Subclasses[/b]
java.io包里有很多有用的filter stream classes. BufferedInputStream和BufferedOutputStream类会把读和写的数据首先放到缓存里。因此，应用程序可以不用调用底层数据流的native方法就可以读或写数据。很多情况下这可以提高性能。

java.io.PrintStream类（System.out和System.err就是这个类型的）可以简单的打印出原始类型值，对象和字符串。这个类使用平台默认的字符编码来转换字符成bytes。我们也能用PrintStream当做过滤器作用在其他outputStream上，比如作用在FileOutputStream上就可以简单的输出文本到文件中。

DataInputStream和DataOutputStream类可以用机器独立（machine-independent way）的方式来读和写java原始数据类型。(Big-endian for integer types, IEEE-754 for floats and doubles, UTF-8 for Unicode)。

[b]6.3 Buffered Streams[/b]
Buffered input Streams会读比原始需要要多的数据到一个缓存里（[b]一个内部的byte数组[/b]）。当调用Stream的read()方法时，首先会从缓存里获取数据而不是底层的stream, 当缓存的数据用完时，buffered stream会再次从底层stream里读一块数据填满缓存。同样地，buffered output stream在一个内部byte数组里存储数据，[b]直到缓存满了或显式调用flush()方法数据才会一下子输出到底层output stream.[/b]

BufferedInputStream和BufferedOutputStream分别有两个构造方法：

public BufferedInputStream(InputStream in) 
public BufferedInputStream(InputStream in, int size) 
public BufferedOutputStream(OutputStream out) 
public BufferedOutputStream(OutputStream out, int size)

第一个参数是底层实际的stream, 第二个参数size就是缓存的大小。[b]如果不指定缓存size, 默认使用2048字节的缓存[/b]。缓存大小最好根据平台来定，或者最好跟硬盘的block大小相关。小于512字节可能会太小，大于4096可能会太多。对于不可靠的网络连接，最好使用较小的缓存大小：

URL u = new URL("http://java.developer.com"); 
BufferedInputStream bis = new BufferedInputStream(u.openStream(), 256);

[b]七、Data Streams[/b]
Data stream能读和写string,integer, float和其他数据类型数据。java.io.DataInputStream和java.io.DataOutputStream类以一种平台独立的方式读和写原始数据类型（boolean, int,double等）。

[b]7.1 The Data Stream Classes[/b]
java.io.DataInputStream和java.io.DataOutputStream类是FilterInputStream和FilterOutputStream的子类：

public class DataInputStream extends FilterInputStream implements DataInput 
public class DataOutputStream extends FilterOutputStream implements DataOutput

[b]7.1.1 The DataInput and DataOutput Interfaces [/b]
java.io.DataInput接口声明了15个读各种各样数据的方法：

public abstract boolean readBoolean() throws IOException 
public abstract byte readByte() throws IOException 
public abstract int readUnsignedByte() throws IOException 
public abstract short readShort() throws IOException 
public abstract int readUnsignedShort() throws IOException 
public abstract char readChar() throws IOException 
public abstract int readInt() throws IOException 
public abstract long readLong() throws IOException 
public abstract float readFloat() throws IOException 
public abstract double readDouble() throws IOException 
public abstract String readLine() throws IOException 
public abstract String readUTF() throws IOException 
public void readFully(byte[] data) throws IOException 
public void readFully(byte[] data, int offset, int length) throws IOException 
public int skipBytes(int n) throws IOException

类似地,java.io.DataOutput接口声明了14个方法，大部分是跟DataInput接口对应的：

public abstract void write(int b) throws IOException 
public abstract void write(byte[] data) throws IOException 
public abstract void write(byte[] data, int offset, int length) throws IOException 
public abstract void writeBoolean(boolean v) throws IOException 
public abstract void writeByte(int b) throws IOException 
public abstract void writeShort(int s) throws IOException 
public abstract void writeChar(int c) throws IOException 
public abstract void writeInt(int i) throws IOException 
public abstract void writeLong(long l) throws IOException 
public abstract void writeFloat(float f) throws IOException 
public abstract void writeDouble(double d) throws IOException 
public abstract void writeBytes(String s) throws IOException 
public abstract void writeChars(String s) throws IOException 
public abstract void writeUTF(String s) throws IOException

注意这里的writerBytes()和writeChars()方法跟DataInput的readBytes()和readChars()方法不是对应匹配的。下面是DataInput和DataOutput的方法的对应关系：

[img]http://dl2.iteye.com/upload/attachment/0098/1675/cbb4d983-a485-3f98-bdd5-f3ff4fd149bb.bmp[/img]
[img]http://dl2.iteye.com/upload/attachment/0098/1673/29bc96f7-daa4-3416-96c4-82859cf67868.bmp[/img]

[b]7.1.2 Constructors[/b]
DataInputStream和DataOutputStream的构造方法如下：

public DataInputStream(InputStream in) 
public DataOutputStream(OutputStream out)

使用示例：

DataInputStream dis = new DataInputStream(new FileInputStream("data.txt")); 
DataOutputStream dos = new DataOutputStream(new FileOutputStream("output.dat"));

[b]八、Streams in Memory[/b]
前面介绍的输入输出主要是在java程序和外部程序之间。本章再扩展三个类似的方法。[b]Sequence input streams能把好几个[/b]input streams串在一起好像是一个stream一样；
[b] Byte array streams[/b]能把数据存储在byte arrays里也能从byte arrays里读数据；
最后，[b]piped input and output streams[/b]可以让一个线程的输出称为一个线程的输入。

[b]8.1 Sequence input Streams[/b]
java.io.SequenceInputStream类以一定的顺序连接多个input stream:
public class SequenceInputStream extends InputStream
从SequenceInputStream里读数据会先从第一个stream里读取所有数据，然后读取第二个stream的所有数据，以此类推直到最后一个stream的所有数据，这个类有两个构造方法：

public SequenceInputStream(Enumeration e) 
public SequenceInputStream(InputStream in1, InputStream in2)

示例：

try
{ 
    URL u1 = new URL("http://java.sun.com/"); 
    URL u2 = new URL("http://www.altavista.com"); 
    SequenceInputStream sin = new SequenceInputStream(u1.openStream(), 
    u2.openStream()); 
} 
catch (IOException e)
{ //...

[b]8.2 Byte Array Streams[/b]
有时候使用stream的方法操作byte arrays里的数据很方便。比如，我们可能接收到一个原始字节的数组，里面的数据需要解释成double类型。最快的方式是使用DataInputStream,但是在创建DataInputStream之前，我们首先需要创建一个原始的byte流才能接收字节数据，这正是java.io.ByteArrayInputStream类提供的能力。

[b]8.2.1 Byte Array Input Streams[/b]
ByteArrayInputStream类使用InputStream的方法从byte array里读数据：
public class ByteArrayInputStream extends InputStream
此类有两个构造方法，参数就是数据源：

public ByteArrayInputStream(byte[] buffer) 
public ByteArrayInputStream(byte[] buffer, int offset, int length)

[b]8.2.2 Byte Array Output Streams[/b]
ByteArrayOutputStream类使用java.io.OutputStream的方法输出数据到byte array.
public class ByteArrayOutputStream extends OutputStream
它有两个构造方法：

public ByteArrayOutputStream() 
public ByteArrayOutputStream(int size)

无参构造方法使用一个32字节的buffer.使用toByteArray()方法能返回包含要输出数据的byte数组：
public synchronized byte[] toByteArray()

这个类也有toString()方法能把bytes转成string。无参的版本使用平台默认的编码，第二个方法可以自己指定编码。

public String toString() 
public String toString(String encoding) throws UnsupportedEncodingException

比如，一个把double转成bytes的方法就是用DataOutputStream过滤类嵌套在ByteArrayOutputStream外面，然后输出double到byte array:

ByteArrayOutputStream bos = new ByteArrayOutputStream(1024); 
DataOutputStream dos = new DataOutputStream(bos); 

for (int r = 1; r < 1024; r++)
{ 
    dos.writeDouble(r * 2.0 * Math.PI); 
}

[b]8.3 Communicating Between Threads with Piped Streams[/b]
java.io.PipedInputStream类和java.io.PipedOutputStream类提供了方便的方法来把stream在线程之间传递。
[img]http://dl2.iteye.com/upload/attachment/0098/1677/bd436f3c-d22d-30c9-8459-916eb8f29dd1.bmp[/img]


public class PipedInputStream extends InputStream 
public class PipedOutputStream extends OutputStream

PipedInputStream有两个构造方法：
public PipedInputStream()
public PipedInputStream(PipedOutputStream source) throws IOException
无参的构造方法创建一个还没有和一个piped outputStream关联的piped InputStream。第二个构造方法创建一个已经和一个output stream连接的piped input Stream。
同样，PipedOutputStream也有两个构造方法：
public PipedOutputStream(PipedInputStream sink) throws IOException
public PipedOutputStream()

使用示例：

PipedOutputStream pout = new PipedOutputStream(); 
PipedInputStream pin = new PipedInputStream(pout);
PipedInputStream pin = new PipedInputStream(); 
PipedOutputStream pout = new PipedOutputStream(pin);

或者创建两个都没有关联的输入输出之后再连接：

PipedInputStream pin = new PipedInputStream(); 
PipedOutputStream pout = new PipedOutputStream(); 
pin.connect(pout);

参考：
《java I/O》 Elliotte Rusty Harold