在银行为代表的金融行业业务场景中,有大量影像文字信息录入需求,比如身份证识别、户口本识别、军官证识别、港澳通行证识别等各类证件识别都可通过标准OCR模型进行识别。但基于行内银行存单、支票、内外部凭证等影像信息人工分类与录入会消耗大量人力、物力和时间成本,严重影响业务流程的效率和用户体验。
达观数据基于深度学习渊识OCR平台通过简单易用的可视化配置,可快速实现对业务量繁多的银行存单、支票、内外部凭证等影像识别工作,从而实现这项业务的自动化处理,大大减少客户业务办理时间,同时也可以将柜员进一步解放出来,更多地从事服务与营销工作。
近年来,工商银行、建设银行、交通银行、华夏银行以及某些农村商业银行等均将OCR引入业务处理系统,并根据银行系统的业务处理特点进行流程改进,在提高自动化程度的同时,也扩展了业务范围,完善了管理机制。
根据目前银行会计核算数据集中系统人工录入模式,网点扫描上传的凭证影像经过切片拆分(部分影像无需拆分)后由专业录入人员录入,每一项要素至少经过两人录入,两人录入要素比对一致后方进入系统校验等自动环节,若两人录入要素不一致还需第三人进行补录再核对校验。这种人工录入模式因节点多、影像申领慢、易受人为延误影响而效率较低。OCR技术与银行会计核算数据集中系统业务的有机结合,将大幅提升业务的处理效率和精确度,增强系统的承载能力和自动化水平。
渊识OCR平台
模板标注平台
针对不同版式样本仅需1张训练图片,基于底层深度学习算法模型内嵌“预标注”和“预识别”功能,支持快速标注关键字段及全文本字段识别,显著提升标注效率,可应用于版式多样、识别特定字段、图像质量统一的场景,同时模型重训功能支持新增版式的快速扩充。
模型训练平台
基于端到端可训练的快速定向文本定位(FOTS)网络通过数据样本标注、模型训练、模型一键导出,一键部署功能,完成模型从0~1的发布。平台兼具有数据自动生成能力,可模拟各类真实场景中复杂数据状况,如模糊、变形、缺角等,少量标注数据即可获得更高的识别准确率。
数据校正平台
数据校验审核是弥补系统识别错误的有效环节,也是影像识别的最后关卡。一般来说,OCR识别无法达到100%准确率,对于不能完全确定或识别认为有误的字符,会对字符进行差异化显示。引入字符识别校正平台,可以通过OCR识别返回置信度、候选集等信息,设置阈值来自动推送至人工判断或补充识别结果。
达观OCR应用价值
大幅降低经济成本
以银行集中运营业务为例,假定一张凭证可拆分为10个切片,每个切片6个字,按照国际打字速度评级标准,专业人员每分钟仅能输入150-240个字,按照240个字/分钟,一个人录完一张凭证需要15秒;OCR每分钟识别6000个字,一张凭证转换不到1秒。效果非常可观,其所释放的机械劳动工时可用于更富有创造力、更复杂的工作。
减少人工差错率
OCR识别引擎长期稳定运行、不受人类情绪影响的特性可保证其在长期重复的工作过程中少犯错,有效减少各类可能的业务差错,提升工作质量。
优化业务流程,提高处理时效
目前,业务处理流程包括影像扫描上传、影像拆分、影像切片录入、业务撮合校验、账务处理等。通过引入OCR识别技术,将改进处理流程为影像扫描上传、OCR影像识别、要素信息输入、业务撮合校验以及账务处理等,不需“影像拆分”环节,业务处理环节减少,处理时效大为提高。尽管OCR识别需要“人工校正”辅助处理,但基本实现了柜台扫描发起后,系统的全自动化业务处理。