馆藏是档案事业管理的第一个环节,是公共档案馆获取和积累档案的一种手段。随着计算机技术和网络技术的发展,出现了大量的电子档案,这是一种“通过计算机磁盘等设备进行存储,与纸质档案相对应、相互关联的通用电子图像文件集合”,它的爆炸式增长、广泛式分布为公共档案馆带来了极大的压力。因此,利用智能OCR识别技术可以有效提高收集环节效率,实现电子档案的智能收集及分类。
OCR文字识别软件,是一种利用OCR(Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。识别语言种类涵盖中英文语种,便于之后档案分类和内容分析。有些档案因光线不足或逆光、分辨率不足等因素导致模糊,可利用基于信号处理和深度学习的图像处理技术,为其提供图像低光照增强、去雾、超分辨率重建等能力,美化图像.
档案信息的数字化、网络化、社会化是“互联网+”时代对档案管理的新要求,方便使用者更快、更准地查找所需档案和资料是服务社会服务民众的关键。我国档案的检索分类根据《中国档案分类法》类目细分规则,档案使用者往往不熟悉这些档案分类的类别。基于人工智能技术的智能检索同时考虑相关性和重要性,同时还可以采用各字段加权混合索引,获得的排序结果更加准确,可以把最相关的信息列在最前面,提高了检索速度和准确率。
总之,随着人工智能的智能化和学习化,可以给档案管理带来方便和效率。在大数据时代,档案管理中的数据信息量巨大。人工智能的智能化和自动化可以弥补人工档案管理的不足。智能分类、智能检索、智能安全保护,可以提高档案管理的质量和效率,更好地为用户利用档案,厦门云脉推出的云脉文档管理系统很好承接了这部分的创新工作,该系统不仅能用于图书馆、档案馆,也可广泛应用于教育机构、*机关、企业、系统集成商等。