前言
今天分享的是两款OCR识别软件
PandaOCR:OCR文字识别翻译、游戏机翻
懒人视频字幕提取:字幕提取、语音识别转字幕
一般OCR识别工具都用的是大厂识别引擎,如百度、搜狗、阿里……
而这些引擎厂商中又属百度最财大气粗,个人只要5月27号前申请并实名便有5W次/天的免费OCR识别额度,之后申请的会调整为1000次/月虽然今天介绍的软件都内置了演示版接口可以直接使用,但由于是公共接口,使用人数多,精度也差,所以强烈建议大家都自己申请一个接口(免费的,操作也很简单)
自己的还可以使用高精度的文字识别API,错过这村没这店了啊
PandaOCR
这是小编一直在用的OCR识别工具,开源免费,非常好用
支持近20款OCR识别引擎,识别后可以直接翻译朗读,同时还支持公式识别与表格识别。
由于是免费的,所以内置的接口也是演示版,不过如果你使用频次不高,对精度要求也没那么高又嫌自己申请麻烦的话,演示版其实也够用。。。
小编之前就用了很久演示版本,嘿嘿
但是自己申请的接口使用体验会更好,精度高,还没人跟你抢资源
可以看下面手写文字的识别率,虽然不是100%但也很不错了
百度OCR接口申请配置
给你们放一个B站声音很好听的小姐姐录得视频教程~~
文字不如视频直观,在P1里还有游戏机翻教程哈
视频地址:https://www.bilibili.com/video/BV1Vt4y1U7Es?p=2
申请地址:https://cloud.baidu.com
申请方法没什么变化,不过配置文件由于更新了很多版本了,略微有点变化
这里的百度OCR版本可以选择项变多了,小编用的2高精度版本,每天可以用500次,一般也够用
下面是百度OCR的额度调整信息,调整前与调整后便是以27号为界限的,申请后记得实名一下
公告地址:https://ai.baidu.com/support/news?action=detail&id=2390
还有记得在填KEY的时候竖杠两侧都有空格,要把原来的全删了
使用配置
如果你的电脑屏幕分辨率比较高,直接使用截图识别的话,可能截不到全部的屏幕
有两种配置方法
1.在高级配置中选择“高级截图”,这样界面会变小,看起来没那么舒适
2.修改“CONFIG.ini”配置文件“DPI参数=3”小编选择的是这种,不会让界面变得很小
点击程序界面左上角的教程还有许多详细的说明,会让你使用这款OCR工具更加的得心应手
最后一个小彩蛋:不要点左上角的熊猫图标哦~
懒人视频字幕提取工具
https://www.52pojie.cn/thread-1443661-1-1.html
这是一款吾爱论坛大佬开发的视频字幕提取工具
1.支持本地视频文件式快速识别
2.支持外部播放器,比如网页播放,腾讯视频 爱奇艺,截图识别
3.支持暂停以及拖动进度条具体位置进行定位打击
4.支持记录时间可以勾选
5.支持绝大多数的视频格式以及尺寸(仅中英和数字)
6.支持语音识别
上面申请的百度OCR的KEY可以直接填在程序主界面里
然后语音识别是用的腾讯的,每月免费10小时,程序界面右侧给了申请地址,这个申请比百度的还简单
使用步骤界面上都有写,也不多赘述了
原理上还是图片识别文字,不过框选了文字的范围
效果嘛小编感觉还是某映好用,你们有兴趣可以都对比一下
某映如果想导出字幕的话需要参照这篇文章:某映字幕导出