Android 开发框架系列百度语音合成

2023-08-13 12:02:16

官方文档：http://ai.baidu.com/docs#/TTS-Android-SDK/6d5d6899

官方百度语音合成控制台：https://cloud.baidu.com/product/speech/tts

步骤一申请授权

在百度语音控制台中申请使用语音合成的授权，填入相关数据后（注意：一定要选择Android填入正确的包名，不然可能会影响使用离线语音合成）。得到相应的APP_ID，APP_KEY，SECRET_KEY；然后在下载语音包SDK。

步骤二导入依赖

这里有三组文件需要分别存放到指定目录（这些文件在语音包的sdk里都有）：

第一 libs里的jar

请将这个jar导入libs文件夹里

第二 assets里的离线语音包dat与离线文字识别dat文件

注意这5个文件在代码里还要进行复制操作，将这些文件复制到外部存储的指定目录才能正常使用。

第三 jniLibs里的语音合成os文件

步骤三个人的封装

使用方法可以参考百度，也可以参考我这个封装，但是请要多调试。因为百度的sdk经常变动，有时效性的。

接口class

/**

 *@content:百度语音合成的接口class

 *@time:2018-9-10

 *@build:

 */

public interface SpeechListener {

    void onInitFinish();

    void onStart(Context context,String resultValue);

    void onProgress(Context context,String resultValue,int current);

    void onFinish(Context context,String resultValue);

    void onError(Context context,String resultValue, SpeechError speechError);

}

配置信息class

/**

 *@content:百度语音合成的数据管理class

 *@time:2018-9-8

 *@build:

 */

public class VoiceConfigData {

    /**

     * 账号组

     */

    public static final String APP_ID = "请输入你的app id";

    public static final String APP_KEY =  "请输入你的app key";

    public static final String SECRET_KEY = "请输入你的 secret key";

    /**

     * 模式   TtsMode.MIX; 离在线融合，在线优先； TtsMode.ONLINE 纯在线； 没有纯离线

     */

    public static final TtsMode TTS_MODE = TtsMode.MIX;

    /**

     *离线资源文件名称与离线资源转存路径

     */

    public static final String TEMP_DIR = Environment.getExternalStorageDirectory() +"/"+"baiduTTS";//转存路径

    //离线度丫丫

    public static final String OFFLINE_FILE_ONE = "bd_etts_common_speech_as_mand_eng_high_am_v3.0.0_20170516.dat";

    //离线女声

    public static final String OFFLINE_FILE_TWO = "bd_etts_common_speech_f7_mand_eng_high_am-mix_v3.0.0_20170512.dat";

    //离线男声

    public static final String OFFLINE_FILE_THREE = "bd_etts_common_speech_m15_mand_eng_high_am-mix_v3.0.0_20170505.dat";

    //yyjw 度逍遥

    public static final String OFFLINE_FILE_FOUR = "bd_etts_common_speech_yyjw_mand_eng_high_am-mix_v3.0.0_20170512.dat";

    //离线文字识别文件

    public static final String TEXT_FILENAME = "bd_etts_text.dat";

}

百度语音合成工具class

package com.yt.owl.utils.BaiduVoiceUtil;

import android.content.Context;

import android.media.AudioManager;

import android.util.Log;

import android.util.Pair;

import com.baidu.tts.auth.AuthInfo;

import com.baidu.tts.chainofresponsibility.logger.LoggerProxy;

import com.baidu.tts.client.SpeechError;

import com.baidu.tts.client.SpeechSynthesizeBag;

import com.baidu.tts.client.SpeechSynthesizer;

import com.baidu.tts.client.SpeechSynthesizerListener;

import com.yt.owl.utils.FileHandleUtil;

import java.util.ArrayList;

import java.util.List;

/**

 *@content:百度语音合成工具class

 *@time:2018-9-10

 *@build:

 * 使用说明：先使用getI方法得到单例，在使用init方法初始化，初始化完成后在调用语音合成等等方法。

 * 最后注意！请不要忘记了使用Destroy方法释放资源

 */

public class SpeakVoiceUtil {

    private static final String TAG = "SpeakVoiceUtil";

    private SpeechSynthesizer mSpeechSynthesizer;

    private Context mContext;

    private static SpeakVoiceUtil mSpeakVoiceUtil;

    private SpeechListener mSpeechListener;

    private SpeechSynthesizerListener mSpeechSynthesizerListener;

    private SpeakVoiceUtil(){}

    public static SpeakVoiceUtil getI(){

        if (mSpeakVoiceUtil == null){

            mSpeakVoiceUtil = new SpeakVoiceUtil();

        }

        return mSpeakVoiceUtil;

    }

    /**

     * 初始化

     * @param context 外部上下文

     */

    public void init(Context context){

        this.mContext = context;

        if (mSpeakVoiceUtil == null){

            Log.e(TAG, "Error SpeakVoiceUtil is null");

            return;

        }

        initFile();

        initTTs();

        checkAuth();

        if (mSpeechListener !=null) {

            mSpeechListener.onInitFinish();

        }

    }

    /**

     * 合成语音并且播放

     * @param text 要合成的text文本

     */

    public void speak(String text){

        if (mSpeechSynthesizer == null) {

            Log.e(TAG, "Error speak:mSpeechSynthesizer is null.");

            return;

        }

        int result = mSpeechSynthesizer.speak(text);

        checkResult(result, "speak");

        Log.i(TAG, "播放语音："+text);

    }

    /**

     * 停止语音合成和播放,清空列队

     */

    public void stop() {

        if(mSpeechSynthesizer == null){

            Log.e(TAG, "Error stop:mSpeechSynthesizer is null.");

            return;

        }

        int result = mSpeechSynthesizer.stop();

        checkResult(result, "stop");

        Log.i(TAG, "停止语音");

    }

    /**

     * 暂停播放。仅调用speak后生效

     */

    public void pause() {

        if(mSpeechSynthesizer == null){

            Log.e(TAG, "Error pause:mSpeechSynthesizer is null.");

            return;

        }

        int result = mSpeechSynthesizer.pause();

        checkResult(result, "pause");

        Log.i(TAG, "暂停语音");

    }

    /**

     * 继续播放。仅调用speak后生效，调用pause生效

     */

    public void resume() {

        if(mSpeechSynthesizer == null){

            Log.e(TAG, "Error resume:mSpeechSynthesizer is null.");

            return;

        }

        int result = mSpeechSynthesizer.resume();

        checkResult(result, "resume");

        Log.i(TAG, "恢复语音");

    }

    /**

     * 批量播放

     *

     * 使用demo

     * List<SpeechSynthesizeBag> list = new ArrayList<>();

     * SpeechSynthesizeBag s1 = new SpeechSynthesizeBag();

     * s1.setText("开始批量播放");

     * s1.setUtteranceId("1");

     * list.add(s1);

     * SpeechSynthesizeBag s2 = new SpeechSynthesizeBag();

     * s2.setText("批量播放成功");

     * s2.setUtteranceId("2");

     * list.add(s2);

     * SpeakVoiceUtil.getI().batchSpeak(list);

     */

    public void batchSpeak(List<SpeechSynthesizeBag> list) {

        if(mSpeechSynthesizer == null){

            Log.e(TAG, "Error batchSpeak:mSpeechSynthesizer is null.");

            return;

        }

        int result = mSpeechSynthesizer.batchSpeak(list);

        checkResult(result, "batchSpeak");

    }

    /**

     * 释放资源

     */

    public void Destroy() {

        if (mSpeechSynthesizer != null) {

            mSpeechSynthesizer.stop();

            mSpeechSynthesizer.release();

            mSpeechSynthesizer = null;

        }

    }

    public int setVoice(float leftVoice,float rightVoice){

        if (mSpeechSynthesizer == null){

            Log.e(TAG, "Error setVoice: mSpeechSynthesizer is null");

            return -;

        }

        int result = mSpeechSynthesizer.setStereoVolume(leftVoice,rightVoice);

        return result;

    }

    /**

     * 语音播放监听接口回调

     * @param SpeechListener 接口类

     */

    public void onSpeechListener(SpeechListener SpeechListener){

        this.mSpeechListener = SpeechListener;

    }

    /**

     * 初始化语音参数

     */

    private void initTTs(){

        LoggerProxy.printable(true); // 日志打印在logcat中

        mSpeechSynthesizer = SpeechSynthesizer.getInstance();

        mSpeechSynthesizer.setContext(mContext);

        getSpeechSynthesizerListener();

        mSpeechSynthesizer.setSpeechSynthesizerListener(mSpeechSynthesizerListener);

        int result =  mSpeechSynthesizer.setAppId(VoiceConfigData.APP_ID);

        checkResult(result,"setAppId");//检查结果

        result = mSpeechSynthesizer.setApiKey(VoiceConfigData.APP_KEY,VoiceConfigData.SECRET_KEY);

        checkResult(result,"setApiKey");

        mSpeechSynthesizer.auth(VoiceConfigData.TTS_MODE);

        // 文本模型文件路径 (离线引擎使用)， 注意TEXT_FILENAME必须存在并且可读

        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_TTS_TEXT_MODEL_FILE,

                VoiceConfigData.TEMP_DIR+"/"+VoiceConfigData.TEXT_FILENAME);

        // 声学模型文件路径 (离线引擎使用)， 注意TEXT_FILENAME必须存在并且可读

        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_TTS_SPEECH_MODEL_FILE,

                VoiceConfigData.TEMP_DIR+"/"+VoiceConfigData.OFFLINE_FILE_TWO);

        // 以下setParam 参数选填。不填写则默认值生效

        // 设置在线发声音人： 0 普通女声（默认） 1 普通男声 2 特别男声 3 情感男声<度逍遥> 4 情感儿童声<度丫丫>

        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEAKER, "");

        // 设置合成的音量，0-9 ，默认 5

        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_VOLUME, "");

        // 设置合成的语速，0-9 ，默认 5

        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEED, "");

        // 设置合成的语调，0-9 ，默认 5

        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_PITCH, "");

        // 设置参数的组合模式

        // 该参数设置为TtsMode.MIX生效。即纯在线模式不生效。

        // MIX_MODE_DEFAULT 默认 ，wifi状态下使用在线，非wifi离线。在线状态下，请求超时6s自动转离线

        // MIX_MODE_HIGH_SPEED_SYNTHESIZE_WIFI wifi状态下使用在线，非wifi离线。在线状态下， 请求超时1.2s自动转离线

        // MIX_MODE_HIGH_SPEED_NETWORK ， 3G 4G wifi状态下使用在线，其它状态离线。在线状态下，请求超时1.2s自动转离线

        // MIX_MODE_HIGH_SPEED_SYNTHESIZE, 2G 3G 4G wifi状态下使用在线，其它状态离线。在线状态下，请求超时1.2s自动转离线

        mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_MIX_MODE, SpeechSynthesizer.MIX_MODE_DEFAULT);

        mSpeechSynthesizer.setAudioStreamType(AudioManager.MODE_IN_CALL);//设置音频流出口

        mSpeechSynthesizer.setStereoVolume(1f,1f);//设置音量

        result = mSpeechSynthesizer.initTts(VoiceConfigData.TTS_MODE);//初始化在线模式:TtsMode.MIX; 离在线融合，在线优先； TtsMode.ONLINE 纯在线； 没有纯离线

        checkResult(result, "initTts");

    }

    /**

     * 初始化文件,将assets目录的离线语音包复制到sd卡中

     */

    private void initFile(){

        Log.i(TAG, "开始初始化离线文件");

        String [] files = {VoiceConfigData.OFFLINE_FILE_ONE,

                VoiceConfigData.OFFLINE_FILE_TWO,

                VoiceConfigData.OFFLINE_FILE_THREE,

                VoiceConfigData.OFFLINE_FILE_FOUR,

                VoiceConfigData.TEXT_FILENAME};

        if (FileHandleUtil.isCanUseSD()){//判断sd卡是否可用

            for (String file : files){

                String filePath = VoiceConfigData.TEMP_DIR+"/"+file;

                if (!FileHandleUtil.isFileExist(filePath)){

                    Log.i(TAG, "initFile 准备复制文件file:"+file+" 到指定目录:"+filePath);

                    FileHandleUtil.copyFromAssetsToSdcard(mContext,file,VoiceConfigData.TEMP_DIR);

                }else {

                    Log.i(TAG, "initFile "+file+"文件存在不需要复制");

                }

            }

        }else {

            Log.e(TAG, "sdcard is null ...");

            return;

        }

    }

    private void checkResult(int result, String method) {

        if (result != ) {

            Log.e(TAG, "error code :" + result + "   method:" + method + ", 错误码文档:http://yuyin.baidu.com/docs/tts/122");

        }

    }

    /**

     * 检查appId ak sk 是否填写正确，另外检查官网应用内设置的包名是否与运行时的包名一致。本demo的包名定义在build.gradle文件中

     *

     * @return

     */

    private boolean checkAuth() {

        AuthInfo authInfo = mSpeechSynthesizer.auth(VoiceConfigData.TTS_MODE);

        if (!authInfo.isSuccess()) {

            // 离线授权需要网站上的应用填写包名。本demo的包名是com.baidu.tts.sample，定义在build.gradle中

            String errorMsg = authInfo.getTtsError().getDetailMessage();

            Log.e(TAG, "error 鉴权失败 errorMsg=" + errorMsg);

            return false;

        } else {

            Log.e(TAG, "验证通过，离线正式授权文件存在" );

            return true;

        }

    }

    /**

     * 语音合成监听接口回调方法

     */

    private void getSpeechSynthesizerListener(){

        if (mSpeechSynthesizerListener == null) {

            Log.e(TAG, "初始化SpeechSynthesizerListener");

            mSpeechSynthesizerListener = new SpeechSynthesizerListener() {

                @Override

                public void onSynthesizeStart(String s) {

                    Log.i(TAG, "onSynthesizeStart合成启动:返回码=" + s);

                }

                @Override

                public void onSynthesizeDataArrived(String s, byte[] bytes, int i) {

                    Log.i(TAG, "onSynthesizeDataArrived合成数据到达:" + "返回码=" + s + "; 字节=" + bytes + "; current=" + i);

                }

                @Override

                public void onSynthesizeFinish(String s) {

                    Log.i(TAG, "onSynthesizeFinish合成完成:返回码=" + s);

                }

                @Override

                public void onSpeechStart(String s) {

                    Log.i(TAG, "onSpeechStart语音开始:返回码=" + s);

                    if (mSpeechListener != null) {

                        mSpeechListener.onStart(mContext, s);

                    }

                }

                @Override

                public void onSpeechProgressChanged(String s, int i) {

                    Log.i(TAG, "onSpeechProgressChanged语音播放中:返回码=" + s + "; current=" + i);

                    if (mSpeechListener != null) {

                        mSpeechListener.onProgress(mContext, s, i);

                    }

                }

                @Override

                public void onSpeechFinish(String s) {

                    Log.i(TAG, "onSpeechFinish语音播放结束:返回码=" + s);

                    if (mSpeechListener != null) {

                        mSpeechListener.onFinish(mContext, s);

                    }

                }

                @Override

                public void onError(String s, SpeechError speechError) {

                    Log.e(TAG, "onError异常:返回码=" + s + "; SpeechError=" + speechError);

                    if (mSpeechListener != null) {

                        mSpeechListener.onError(mContext, s, speechError);

                    }

                }

            };

        }

    }

}

另外还有一些复制文件的的简单方法，我就不贴出来了。可以自行编写方法用于复制文件

码农公寓

步骤一 申请授权

步骤二 导入依赖