我目前正在使用Docotic PDF库为托管大型扫描文档的PDF文件服务器编写压缩程序. (意图是获得最小的黑白尺寸,以保持可读的文件 – 主要是法律简报)
在测试中,我注意到某些文件对JPEG压缩的响应更好,而其他文件对Group3Fax或Flate的响应更好.是否有可能分析文件并对哪个算法生成最小的PDF做出明智的决定,或者我实际上是用三种算法压缩每个文件并选择最小的 – 这会产生大量额外的CPU开销.
非常感谢任何指导.谢谢
解决方法:
如果PDF中的图像是单色的,我建议使用JBIG2压缩(如果可以从PDF软件获得),它通常会超过组压缩.如果您使用有损JBIG2,请小心(请参阅我公司的blog,了解文本可能发生变化时可能出现的问题).
第3组压缩(虽然我建议使用第4组,如果可用,应提供更好的结果)仅适用于单色(1bpc)图像,JPEG适用于彩色或灰度图像(尽管并非所有PDF软件都支持灰度). Flate与单色,灰度或彩色图像兼容.
由于它们是扫描图像,JPEG通常应该超过Flate压缩,所以我会说你不需要压缩它们进行比较.在大多数情况下,JPEG2000(如果可从PDF软件获得)将超过JPEG.同样,在大多数情况下,组压缩应超过Flate.
除非图像本身很大或者压缩算法不是最理想的,否则压缩它们的开销不应该那么大.