当学习了Java NIO和IO的API后,一个问题立即涌入脑海:
我应该何时使用IO。何时使用NIO呢?在本文中,我会尽量清晰地解析Java NIO和IO的差异、它们的使用场景,以及它们怎样影响您的代码设计。
Java NIO和IO的主要差别下表总结了Java NIO和IO之间的主要区别。我会更具体地描写叙述表中每部分的差异。
IO NIO 面向流 面向缓冲 堵塞IO 非堵塞IO 无 选择器 |
Java NIO和IO之间第一个最大的差别是。IO是面向流的,NIO是面向缓冲区的。
Java IO面向流意味着每次从流中读一个或多个字节。直至读取全部字节,它们没有被缓存在不论什么地方。此外,它不能前后移动流中的数据。
假设须要前后移动从流中读取的数据,须要先将它缓存到一个缓冲区。
Java NIO的缓冲导向方法略有不同。数据读取到一个它稍后处理的缓冲区,须要时可在缓冲区中前后移动。这就添加了处理过程中的灵活性。可是。还须要检查是否该缓冲区中包括全部您须要处理的数据。并且。需确保当很多其它的数据读入缓冲区时,不要覆盖缓冲区里尚未处理的数据。
堵塞与非堵塞IOJava IO的各种流是堵塞的。
这意味着。当一个线程调用read() 或 write()时,该线程被堵塞。直到有一些数据被读取。或数据全然写入。该线程在此期间不能再干不论什么事情了。
Java NIO的非堵塞模式。使一个线程从某通道发送请求读取数据,可是它仅能得到眼下可用的数据。假设眼下没有数据可用时。就什么都不会获取。
而不是保持线程堵塞。所以直至数据变的能够读取之前,该线程能够继续做其他的事情。
非堵塞写也是如此。一个线程请求写入一些数据到某通道,但不须要等待它全然写入。这个线程同一时候能够去做别的事情。
线程通常将非堵塞IO的空暇时间用于在其他通道上运行IO操作。所以一个单独的线程如今能够管理多个输入和输出通道(channel)。
选择器(Selectors)Java NIO的选择器同意一个单独的线程来监视多个输入通道,你能够注冊多个通道使用一个选择器。然后使用一个单独的线程来“选择”通道:这些通道里已经有能够处理的输入,或者选择已准备写入的通道。
这样的选择机制。使得一个单独的线程非常easy来管理多个通道。
NIO和IO怎样影响应用程序的设计不管您选择IO或NIO工具箱,可能会影响您应用程序设计的下面几个方面:
- 对NIO或IO类的API调用。
- 数据处理。
- 用来处理数据的线程数。
API调用
当然,使用NIO的API调用时看起来与使用IO时有所不同,但这并不意外。由于并非仅从一个InputStream逐字节读取,而是数据必须先读入缓冲区再处理。
数据处理
使用纯粹的NIO设计相较IO设计,数据处理也受到影响。
在IO设计中。我们从InputStream或 Reader逐字节读取数据。
如果你正在处理一基于行的文本数据流,比如:
1
2
3
4
|
Name:
Anna
Age: 25
Email:
anna @mailserver .com
Phone: 1234567890
|
该文本行的流能够这样处理:
1
2
3
4
5
6
7
8
|
InputStream
input = ... ; //
get the InputStream from the client socket
BufferedReader
reader = new BufferedReader( new InputStreamReader(input));
String
nameLine = reader.readLine();
String
ageLine = reader.readLine();
String
emailLine = reader.readLine();
String
phoneLine = reader.readLine();
|
请注意处理状态由程序执行多久决定。
换句话说,一旦reader.readLine()方法返回,你就知道肯定文本行就已读完。 readline()堵塞直到整行读完。这就是原因。你也知道此行包括名称;相同,第二个readline()调用返回的时候,你知道这行包括年龄等。
正如你能够看到,该处理程序仅在有新数据读入时执行,并知道每步的数据是什么。一旦正在执行的线程已处理过读入的某些数据。该线程不会再回退数据(大多如此)。下图也说明了这条原则:
Java IO: 从一个堵塞的流中读数据 |
而一个NIO的实现会有所不同,以下是一个简单的样例:
1
2
|
ByteBuffer
buffer = ByteBuffer.allocate( 48 );
int bytesRead
= inChannel.read(buffer);
|
注意第二行,从通道读取字节到ByteBuffer。当这种方法调用返回时。你不知道你所需的全部数据是否在缓冲区内。你所知道的是,该缓冲区包括一些字节。这使得处理有点困难。
如果第一次 read(buffer)调用后,读入缓冲区的数据仅仅有半行,比如,“Name:An”,你能处理数据吗?显然不能。须要等待,直到整行数据读入缓存,在此之前。对数据的不论什么处理毫无意义。
所以,你怎么知道是否该缓冲区包括足够的数据能够处理呢?好了,你不知道。
发现的方法仅仅能查看缓冲区中的数据。其结果是,在你知道全部数据都在缓冲区里之前。你必须检查几次缓冲区的数据。
这不仅效率低下。并且能够使程序设计方案杂乱不堪。比如:
1
2
3
4
5
6
7
8
9
|
ByteBuffer
buffer = ByteBuffer.allocate( 48 );
int bytesRead
= inChannel.read(buffer);
while (!
bufferFull(bytesRead) ) {
bytesRead
= inChannel.read(buffer);
}
|
bufferFull()方法必须跟踪有多少数据读入缓冲区。并返回真或假,这取决于缓冲区是否已满。
换句话说,假设缓冲区准备好被处理,那么表示缓冲区满了。
bufferFull()方法扫描缓冲区,但必须保持在bufferFull()方法被调用之前状态同样。
假设没有,下一个读入缓冲区的数据可能无法读到正确的位置。
这是不可能的,但却是须要注意的又一问题。
假设缓冲区已满,它能够被处理。
假设它不满,而且在你的实际案例中有意义,你也许能处理当中的部分数据。
可是很多情况下并不是如此。
下图展示了“缓冲区数据循环就绪”:
Java NIO:从一个通道里读数据,直到全部的数据都读到缓冲区里. |
NIO可让您仅仅使用一个(或几个)单线程管理多个通道(网络连接或文件),但付出的代价是解析数据可能会比从一个堵塞流中读取数据更复杂。
假设须要管理同一时候打开的成千上万个连接,这些连接每次仅仅是发送少量的数据,比如聊天server,实现NIO的server可能是一个优势。
相同,假设你须要维持很多打开的连接到其它计算机上,如P2P网络中,使用一个单独的线程来管理你全部出站连接。可能是一个优势。一个线程多个连接的设计方案例如以下图所看到的:
Java NIO: 单线程管理多个连接
假设你有少量的连接使用很高的带宽。一次发送大量的数据,或许典型的IOserver实现可能很契合。下图说明了一个典型的IOserver设计:
Java IO: 一个典型的IOserver设计- 一个连接通过一个线程处理.