云小课 | 一个三分钟快速定制OCR应用的神器,要不?

摘要:ModelArts Pro提供了文字识别套件,基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务。三分钟即可快速定制OCR服务,实现多种版式图像的文字信息结构化提取。

本文分享自华为云社区《【云小课】EI第15课 ModelArts Pro 文字识别套件,三分钟快速定制OCR服务》,原文作者: Hi,EI 。

云小课 | 一个三分钟快速定制OCR应用的神器,要不?

ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。

ModelArts Pro提供了文字识别套件,基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务。三分钟即可快速定制OCR服务,实现多种版式图像的文字信息结构化提取。

接下来就是见证奇迹的时刻~

预置工作流

文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。

  • 通用单模板工作流

通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。

  • 多模板分类工作流

支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。通常适用于物流行业。

特色优势

  • 领先的AI开发平台

底层依托ModelArts提供的领先的算法技术,保证AI应用开发的高效和推理结果的准确,同时减少人力投入。

  • 简单的流程式开发

无需人工智能专业知识,用户可借助预置的行业工作流,全流程可视化完成完成AI应用开发以及持续迭代。

  • 高效的行业算法

领先人工智能技术结合行业专家经验,构建出优质高效的行业预置算法,行业AI应用开发者仅需少量标注数据,就能获得高精度的AI应用。

  • 支持复杂场景

旋转、褶皱等不利的图片质量下,能做到高精度的有效识别。

5步上手文字识别套件

第一步:开通套件

目前ModelArts Pro 文字识别套件处于公测阶段,首次使用文字识别套件需要开通公测权限。

登录ModelArts Pro控制台,选择行业套件卡片并单击“申请公测”,在申请公测页面根据界面提示填写所需信息。

云小课 | 一个三分钟快速定制OCR应用的神器,要不?

申请公测操作完成后,单击“前往我的公测”,进入“我的公测”页面。当“审批状态”显示为“审批通过”时,表示您已经获得了该行业套件的公测权限。

第二步:委托授权

在您使用ModelArts Pro过程中,ModelArts Pro需要进行委托授权,用于访问ModelArts服务的云资源。如果没有授权,相关功能将不能正常使用。

如果未获得ModelArts委托授权和访问秘钥(AK/SK)授权,当进入ModelArts Pro控制台的行业套件时,会弹出“访问授权”对话框。

在弹出的“访问授权”对话框填写授权信息,然后单击“同意授权”,完成访问授权的配置。

  • “用户名”为当前需要授权的用户名,保持默认值。
  • “委托”选择“modelarts_agency”。
  • 勾选“我已经详细阅读并同意《ModelArts服务声明》”。

云小课 | 一个三分钟快速定制OCR应用的神器,要不?

详情请见配置访问权限

第三步:创建应用

根据您的行业和应用场景,选择匹配的工作流,创建您的应用。

1、在ModelArts Pro控制台界面,单击“文字识别”套件卡片的“进入套件”。

进入文字识别套件控制台。

云小课 | 一个三分钟快速定制OCR应用的神器,要不?

2、在左侧导航栏选择“应用开发>工作台”。

默认进入“我的应用”页签。

3、在“我的应用”页签下,单击“新建应用”。

进入“新建应用”页面。

您也可以单击“我的工作流”,切换至“我的工作流”页签,选择工作流并单击卡片中的“新建应用”。

云小课 | 一个三分钟快速定制OCR应用的神器,要不?

4、根据业务需求填写“应用名称”、“应用负责人”和“应用描述”,选择“所属行业”及工作流。

云小课 | 一个三分钟快速定制OCR应用的神器,要不?

5、确认信息后,单击“确定”。

成功新建应用。

第四步:开发并上线应用

根据流程指引完成工作流,并将应用发布上线。

通用单模板工作流:

云小课 | 一个三分钟快速定制OCR应用的神器,要不?

多模板分类工作流:

云小课 | 一个三分钟快速定制OCR应用的神器,要不?

第五步:迭代优化

维护应用,不断优化迭代。

物流+ModelArts Pro 文字识别套件

物流企业源自全球各地的单据板式数以万计,物流参与各方需要耗费人力执行大量的纸质单证信息的手工录入等操作。

传统方式开发文字识别需要7天,使用ModelArts Pro 文字识别套件的预置工作流完成新版式票证结构提取接口开发仅需3分钟。

那么,实践一下,教您五步上手文字识别套件~

详情请戳这里了解。

 

点击关注,第一时间了解华为云新鲜技术~

上一篇:python+selenium+Tesseract-OCR识别图片验证码


下一篇:【AI in 美团】深度学习在OCR中的应用