接触SPPAS有一段时间了,总是不得要领,实话讲,总是运行不出来,最近发现更新后,又试了一下,终于运行成功!但是目前只是试验的英语,使用这个工作对于标注工作有一个很大的效率提升,但是后期还要有更多的要学习的地方,比如汉语的使用?是否可以自己制作词典?比如标注后的标注方式转化,因为这里用的是SAMPLE标注,是否可以使用PRAAT本身的标注?在此只是把自己如何安装,以及如何使用的过程记录下来。未完持续。
1. 安装过程
安装之前需要安装4个环境组件,包括:(以下选自SPPAS的官方网站:http://aune.lpl.univ-aix.fr/~bigi/sppas)
- Python
- wxPython
- sox
- Julius
Python
- If you have a 32-bits computer, download and execute Python 2.7.3 Windows x86 Installer.
- Else if you have a 64-bits computer, download and execute Python 2.7.3 Windows x86-64 Installer.
During the installation, click three times on the "Next" button and then on "Finish".
WxPython
Click here to download wxPython
- If you have a 32-bits computer, download and execute wxPython 2.8-win32-unicode-py27.
- Else if you have a 64-bits computer, download and execute wxPython 2.8-win64-unicode-py27.
During the installation, click on the "Next" button and then on "Finish".
Sox
Click on the sox-VERSION-win32.exe. Click Next, Install and Close. Then, open the Explorer and go to into the sox installation directory location. Select the file "sox.exe" and the .dll files. Copy these files into C:\WINDOWS\
Julius installation:
Choose the "Binary for Windows (zip)" file in the "Quick download" menu.
Extract the archive (in the "C:\WINDOWS\Programs Files" directory for example). Then, open the Explorer and go to into the installation directory. Open the "bin" directory then select the file "julius.exe". Copy this file into C:\WINDOWS\ .
以上四种组件按要求安装完成并设置完毕。
2.然后在http://aune.lpl.univ-aix.fr/~bigi/sppas/download.php里下载最新版本的SPPAS工具,并解压缩。解压之后,打开目录里的sppas.bat,就可以运行了。
使用:
1. 打开之后的界面是这样的,有一个SPPAS的主窗口,另外有一个Python的运行监视窗口,主要的操作在SPPAS的主窗口里。
2. 准备声音文件和文本文档,声音文件就是普通的录音文件,.wav格式,最好是以句子的形式,至于对于篇章的声音文件,效果如何,在此并未测试。另外每一个声音文件同文件名对应一个文本文档,里面是这句话的文本,格式为UTF-8。
3. 添加声音文件至SPPAS主窗口里,然后选择右下角的几个选项,Tokenization,PHonetizatiion, Alignment里都选择EN,代表是英语句子。然后点最右下角的执行按钮。和声音文件同目录里就会产生标注好的文件。