平台在接入OCR识别接口时,会要求把需要识别的图片上传,但如果原图上传质量过高的图片,会对服务器造成很大的负担,图片压缩算法可以将大体积的图片压缩成合适的尺寸,同时还不会影响识别的清晰度,既减轻了服务器成本又提高了上传速度。
波浪纹消除
部分用户在使用ocr识别过程中,会上传用手机拍摄的图片,这类图片上通常会出现一串串波浪纹,看起来不太影响图片的质量,但对OCR识别造成了一定的干扰,这就要求在OCR技术开发过程中,需要考虑能消除此类波浪纹的算法,提升OCR识别的精准性。
无效背景要素消除
识别目标图片过程中,会遇到各种各样杂乱无章的背景,这些会和主体内容融合在一起,干扰OCR的精准识别,比如扫描图书,就会受到背面文字印迹的干涉,还有被识别图片存在脏污、破坏、不完整等情况,这些都是需要ocr识别技术能消除杂乱背景,完成精准识别。
自动分段和选区
假如设别目标是一张报纸后者图片,那么会遇到两个问题,一个是每篇文章都会有很多段落,但OCR一般都是一行行的识别返回内容,这就需要ocr能够实现自动分段排版的技术,方便后续工作人员的录入编辑工作;另一个是报纸每个版面都会有各种各样的排版,不同的文章都是小方块的形式展现,这就需要ocr能够实现自动选区功能,把需要识别的文章小方块单独识别出来。
常见API平台,提供各类诸如身份证OCR识别api、银行卡OCR识别api、营业执照OCR识别api等api接口接入服务,识别率高达99.5%。