“妈妈,这个字念什么?”“爸爸,这本书生字好多,我看不下去了。”在识字之初,孩子们难免会高频率地拉着妈妈爸爸反复“考”问,常常问出“直击心灵”的崩溃感。另一方面,当孩子们得不到实时反馈,也会丧失学习新字和阅读的兴趣。而教育问题永远牵动人心,对此深耕教育行业21年的“老牌子”读书郎,专门在学生平板中接入百度大脑OCR文字识别技术,探索着用新方式来解决问题。
(图:拍照并框选生字后,读书郎利用百度大脑OCR文字识别技术进行识别)
作为K12教育智能硬件领域处于领先地位,同时也是国内颇具实力和品牌影响力的教育科技企业之一,读书郎一直保持着对技术方面的灵敏度。孩子们需要什么?哪些能用技术解决?这种技术领域中的“思变能力”,就是对孩子们与家长的助力。
对于低龄学生而言,父母们不仅要做家长还要做“家教”,本身就已“压力山大”。而当孩子们在学习新课本、做作业和进行课外阅读时,三番五次的对同一个字反复询问,就可能让家长们忘记了“耐心和温柔”,甚至出现家庭矛盾。因此,读书郎便开始寻求一项可以帮助中小学生提高识字阅读效率的技术。
而想要为孩子们提供准确的信息,就需要机器首先能精准的识别文字,OCR技术让这一想法成为可能。光学字符识别(Optical Character Recognition,简称OCR)是人工智能技术之一,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式。它让“计算机”和“人”一样看图识字,最大化地方便了信息以“更*地”方式进行快速高效转换。其中,百度大脑OCR基于深度学习技术,更是突破了很多外在环境限制,在教育领域中极大地促进了信息多样化地转化和传播。
在接触到百度大脑后,读书郎发现,百度大脑OCR技术具备识别准确率高、场景覆盖多、语种丰富、兼容性强等特性,这对于学生平板这种学习工具来说非常重要。百度大脑OCR技术针对图片模糊、倾斜、翻转等情况进行了优化,鲁棒性强,识别速度快,总体识别准确率高达99%。同时还支持对中、英、法、俄、西、葡、德、意、日、韩、中英混合等多语种内容的识别,并支持中、英、日、韩四语种的类型检测,十分适用于教育场景。
(图:百度大脑AI开放平台通用文字识别页)
在与百度大脑OCR技术的合作下,“轻松一点”的拍照识字功能全面上线读书郎学生平板系列。学生只需用读书郎对纸质书本拍照,并框取图片上的生字区域进行快速识别,学生平板便会将生字的读音、解形、结构、笔画、释义、组词等一一展现出来。为了加强记忆,学生能对照临摹,整个过程生动有趣。不仅解决了查字典的繁琐,对于不认识的生字还可以着重学习,让“机械化”的识字过程通过丰富多彩的体验学习,变得不再枯燥。
事实上,除了教育场景外,百度大脑OCR技术也已在文档电子化、卡证核验、财会报销、交通物流、内容审核等各类文字识别场景中应用。例如效率工具“白描”借助OCR技术实现了对读书笔记摘录,纸质文件转录成电子版,购物小票电子化存储等的批量文字识别。在识别准确度,识别速度和操作体验上均获得广泛好评, 成为文字识别软件里脱颖而出的黑马。物流行业中的百世汇通借助OCR技术首创智能寄件,可便捷地将图片中的文字信息提取出来方便后续处理。极大提高了用户填写收、寄件人信息的效率,提升了用户体验。
(图:白描APP进行文字识别)
目前,百度大脑OCR技术已通过百度大脑AI开放平台全面开放给第三方使用,积极推动技术在场景中的落地。