科大讯飞开放平台-python语音转文字教程

2024-04-18 21:20:25

文章目录

- - - 简介
    - 实际使用
    - 代码coding

简介

科大讯飞的语音转写（Long Form ASR）——基于深度全序列卷积神经网络，将长段音频（5小时以内）数据转换成文本数据，为信息处理和数据挖掘提供基础。

转写的是已录制音频（非实时），音频文件上传成功后进入等待队列，待转写成功后用户即可获取结果，返回结果时间受音频时长以及排队任务量的影响。如遇转写耗时比平时延长，大概率表示当前时间段出现转写高峰，请耐心等待即可，我们承诺有效任务耗时最大不超过5小时，详情请参考SLA协议。

另外，为使转写服务更加通畅，请尽量转写5分钟以上的音频文件，上传大量的短音频易引起网络和服务器资源紧张，从而导致任务排队积压。

实际使用

可以免费注册并领取5个小时的使用时长，包括普通语音转写、极速语音转写和实时语音转写等功能。

注册成功并开通后即可获得对应API接口的APPID和SecretKey

代码coding

语