科大讯飞开放平台-python语音转文字教程

文章目录

        • 简介
        • 实际使用
        • 代码coding

简介

科大讯飞的语音转写(Long Form ASR)——基于深度全序列卷积神经网络,将长段音频(5小时以内)数据转换成文本数据,为信息处理和数据挖掘提供基础。

转写的是已录制音频(非实时),音频文件上传成功后进入等待队列,待转写成功后用户即可获取结果,返回结果时间受音频时长以及排队任务量的影响。 如遇转写耗时比平时延长,大概率表示当前时间段出现转写高峰,请耐心等待即可,我们承诺有效任务耗时最大不超过5小时,详情请参考SLA协议。

另外,为使转写服务更加通畅,请尽量转写5分钟以上的音频文件,上传大量的短音频易引起网络和服务器资源紧张,从而导致任务排队积压。

实际使用

可以免费注册并领取5个小时的使用时长,包括普通语音转写、极速语音转写和实时语音转写等功能。

注册成功并开通后即可获得对应API接口的APPIDSecretKey

代码coding
上一篇:【目标检测】2. RCNN


下一篇:Css提高——Css3的新增选择器