我想知道什么是从Java InputStream多次读取字节并在流很大时仍然有效的最佳方法.
假设我有以下代码:
public void handleBytes(InputStream in) {
doStuff1(in);
doStuff2(in);
doStuff3(in);
}
其中doStuff1,doStuff2和doStuff3都需要在相同的字节上工作,但执行不同的操作.我也假设那些功能可以是异步的.
我知道可以标记然后重置流,但是我想知道当输入的数据很多时,这是否是可行的方法另外,如果我希望每个doStuff-X都有一个线程工作器,则我不能真正使用reset.
每个doStuff-X方法是否都应该有流的副本?但是话又说回来,我不确定它对于大量数据是否有效.
解决方法:
如果您知道三个doStuff()函数正在异步运行,则可以尝试使用Apache Commons IO TeeInputStream将初始InputStream的内容复制到PipedOutputStream,该PipedOutputStream连接到doStuff2()正在读取的PipedInputStream.同样,您可以设置第二个TeeInputStream,该第二个TeeInputStream使用连接到doStuff3()的第二个PipedInputStream的第二个PipedOutputStream构造.
此方法有一些限制:
1)doStuff1(),doStuff2()和doStuff3()必须在单独的线程上运行,否则在doStuff1()运行时以及doStuff2()和doStuff3()运行之前,您将缓冲整个文件两次.该方法假定doStuff2()和doStuff3()正在读取和处理数据,而doStuff1()最初正在读取数据.
2)doStuff1()不能使用skip(),mark()或reset(),因为这会弄乱下游函数(如TeeInputStream javadoc中所述.
只要这三个doStuff()函数都可以以大约相同的速率处理数据,则该方法应具有合理的内存效率.