一、IO流初期理解
1.IO流的理解和分类
流是用来处理数据的。处理数据时,一定要先明确数据源,与数据目的地(数据汇)。数据源可以是文件,可以是键盘。数据目的地可以是文件、显示器或者其他设备。而流只是在帮助数据进行传输,并对传输的数据进行处理,比如过滤处理.转换处理等。
根据处理数据类型的不同分为:字符流和字节流,根据数据流向不同分为:输入流和输出流
2.字符流和字节流的区别
字符流的由来:因为数据编码的不同,而有了对字符进行高效操作的流对象。本质其实就是基于字节流读取时,去查了指定的码表。
字节流和字符流的区别:
读写单位不同:字节流以字节(8bit)为单位,字符流以字符为单位,根据码表映射字符,一次可能读多个字节。
处理对象不同:字节流能处理所有类型的数据(如图片、avi等),而字符流只能处理字符类型的数据。
二、字符流的知识框架:
(一)字符输出流Writer
1.Writer 是所有的输出字符流的父类,它是一个抽象类。
2.CharArrayWriter、StringWriter是两种基本的介质流,它们分别向Char 数组、String 中写入数据。PipedWriter 是向与其它线程共用的管道中写入数据,
3.BufferedWriter是一个装饰器为Writer提供缓冲功能。
4.PrintWriter 和PrintStream 极其类似,功能和使用也非常相似。
5.OutputStreamWriter是OutputStream到Writer转换的桥梁,它的子类FileWriter 其实就是一个实现此功能的具体类。
(二)字符输入流Reader
1.Reader是所有的输入字符流的父类,它是一个抽象类。
2.CharReader、StringReader是两种基本的介质流,它们分别将Char数组、String中读取数据。PipedReader是从与其它线程共用的管道中读取数据。
3.BufferedReader很明显就是一个装饰器,它和其子类负责装饰其它Reader对象。
4.FilterReader是所有自定义具体装饰流的父类,其子类PushbackReader 对Reader 对象进行装饰,会增加一个行号。
5.InputStreamReader 是一个连接字节流和字符流的桥梁,它将字节流转变为字符流。FileReader可以说是一个达到此功能、常用的工具类,在其源代码中明显使用了将FileInputStream 转变为Reader 的方法。我们可以从这个类中得到一定的技巧。Reader中各个类的用途和使用方法基本和InputStream中的类使用一致。
三、字节流的知识框架:
(一)输入字节流InputStream
1.InputStream 是所有的输入字节流的父类,它是一个抽象类。
2.ByteArrayInputStream、StringBufferInputStream、FileInputStream是三种基本的介质流,它们分别从Byte数组、StringBuffer和本地文件中读取数据。PipedInputStream是从与其它线程共用的管道中读取数据。
3.ObjectInputStream和所有FilterInputStream 的子类都是装饰流(装饰器模式的主角)。
4.键盘录入常见写法:
BufferedReader bufr = new BufferedReader(new InputStreamReader(System.in));
它包含三步:InputStream in = System.in;
InputStreamReader isr = new InputStreamReader(in);
BufferedReader bufr = new BufferedReader(isr);
(二)输出字节流OutputStream
1.OutputStream是所有的输出字节流的父类,它是一个抽象类。
2.ByteArrayOutputStream、FileOutputStream 是两种基本的介质流,它们分别向Byte 数组、和本地文件中写入数据。PipedOutputStream是向与其它线程共用的管道中写入数据,
3.ObjectOutputStream 和所有FilterOutputStream 的子类都是装饰流。
4.键盘录入常见写法:
BufferedWriter bufw = new BufferedWriter(new OutputStreamWriter(System.out));
此方法输出最后没有换行符,因此需添加:bufw.newLine()
四、字符流与字节流转换
1.转换流的特点:
(1)转换流其是字符流和字节流之间的桥梁
(2)转换流可对读取到的字节数据经过指定编码转换成字符
(3)转换流可对读取到的字符数据经过指定编码转换成字节
2.何时使用转换流?
(1)当字节和字符之间有转换动作时;
(2)流操作的数据需要编码或解码时。
具体的对象体现:InputStreamReader:字节到字符的桥梁;OutputStreamWriter:字符到字节的桥梁。
这两个流对象是字符体系中的成员,它们有转换作用,本身又是字符流,所以在构造的时候需要传入字节流对象进来。
五、流操作规律
流操作时最痛苦的就是流对象有很多,不知道该用哪一个。可根据四个明确来完成:
1.明确源和目的。
源:输入流 InputStream / Reader
目的:输出流 OutputStream / Writer
2.操作的数据是否是纯文本。
是:字符流。
不是:字节流。
3.当体系明确后,再明确要使用哪个具体的对象。
通过设备来进行区分:
源设备有:内存,硬盘,键盘
目的设备有:内存,硬盘,控制台
4.是否需要提高效率
是,加入缓冲区 BufferedReader / bufferWriter
不是,不操作此步
示例:将一个文本文件中数据存储到另一个文件中(复制文件)
读取文件:
1.源:因为是源,所以使用读取流。InputStream Reader
2.是不是操作文本文件。是!这时就可以选择Reader,这样体系就明确了。
3.接下来明确要使用该体系中的哪个对象。
明确设备:硬盘,一个文件。Reader体系中可以操作文件的对象是 FileReader
4.是否需要提高效率:是!加入Reader体系中缓冲区 BufferedReader。
FileReader fr = new FileReader("a.txt");
BufferedReader bufr = new BufferedReader(fr);
写入另一个文件:
1.目的:对应源,OutputStream Writer
2.是否是纯文本。 是!Writer。
3.设备:硬盘,一个文件。Writer体系中可以操作文件的对象FileWriter。
4.是否需要提高效率:是!加入Writer体系中缓冲区 BufferedWriter。
FileWriter fw = new FileWriter("b.txt");
BufferedWriter bufw = new BufferedWriter(fw);
六、File类
File类是对文件系统中文件以及文件夹进行封装的对象,可以通过对象的思想来操作文件和文件夹。 File类保存文件或目录的各种元数据信息,包括文件名、文件长度、最后修改时间、是否可读、获取当前文件的路径名,判断指定文件是否存在、获得当前目录中的文件列表,创建、删除文件和目录等方法。
七、字符编码
1.常见编码表
ASCII 美国标准编码表 一个字节的7位表示
ISO8859-1 拉丁编码表/欧洲编码表 一个字节8位表示
GB2312 中国中文编码表
GBK 中国中文编码表升级版 2个字节,开头都是1
Unicode 国际编码表 java使用此码表,融合多国文字,都用两个字节表示
UTF-8 针对Unicode的可变长度字符编码 最多三个字节表示,长度不固定,有1个字节、2个字节、3个字节表示的
注意:UTF-8的默认开头
1个字节长度时,默认0开头
2个字节长度时,默认第一个字节110开头,第二个字节10开头
3个字节长度是,默认第一个字节1110开头,第二个字节10开头,第三个字节10开头
因此GBK编码后,打开时默认UTF-8解读,因为文件中字符编码的开头复合了UTF-8的默认开头,例如:“联通”。
2.编程中调用编码表
示例:OutputStreamWriter(new FileOutoutStream("文件名","编码表"));
InputStreanReader(new FileInputStream("文件名","编码表"));