前端多媒体-音频

概览

基本概念

采样率、采样大小、比特率、压缩率

容器格式

WAV、AIFF、AMR、MP3、Ogg

编码格式

PCM、AAC-LC、AAC-LD、FLAC

采样率

  定义

  • 音频采样率是指录音设备在一秒内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。

  常见采样率

  • 8,000 Hz - 电话所用采样率

  • 11,025 Hz-AM调幅广播所用采样率

  • 22,050 Hz和24,000 Hz- FM调频广播所用采样率

  • 32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率

  • 48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率

采样大小

  • 一秒钟所采的样本数为比特率,每个样本中信息的比特数就是位深,即采样精度,单位为Bit。

  • 用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数,有8位、16位、24位等,数值越大,解析度就越高,录制和回放的声音就越真实。

  • 计算公式:Bits = 采样率 * 位深 * 通道 * 时长 (s)

  • 应用场景:

    1. 16Bit:动态范围大概是96db,适用于普通的流行歌曲。
    2. 24Bit:动态范围大概是144db,一般用于电影配乐,交响乐团等。

比特率

  • 比特率(bit rate) 又称“二进制位速率”,俗称:码率,比特率越高,表示单位传输的数据越多。

  • 单位:bit/s 或 bps、kbit/s 或 kbps、Mbit/s 或 Mbps

  • 单位时间内采样率越大,精度就越高,处理出来的文件就越接近原始文件。

  • 一般我们用的单位是 kbps 即 千位每秒。

  比特率计算公式

  • 比特率(kbps) = 量化采样点(kHZ) * 位深(bit/采样点) * 声道数量(一般为2)

  对应的音频质量

  • 96 kbps — FM 质量

  • 128 ~ 160 kbps — 相当好的质量,有时有明显差别

  • 192 kbps — 优良质量,偶尔有差别

  • 8 kbps — 电话质量(使用语音编码)

压缩率

  • 音频压缩率:原始音频数据与通过PCM等压缩编码技术压缩后的数据大小的比率。

  • 压缩率一般用 10:1 来表示,这种表示也称为压缩系数。10代表未压缩的数据大小。

容器格式

  WAV

  • WAVE (Waveform Audio File Format),是由微软和IBM公司共同开发的音频编码格式,广泛用于Windows平台,因为文件后缀名为.wav而被称为WAV。

  • 通常用来保存PCM格式的原始音频数据,所以通常被称为无损音质。

  • WAV也可以存储其它压缩格式的音频数据。

  AIFF

  • AIFF是Audio Interchange File Format(音频交互文件格式) 的缩写。

  • 用于存储和传输高质量的采样音频数据。支持各种位分辨率,采样率和音频频道。

  • 文件是未压缩的,相比MP3格式文件非常大。质量高,非常适合刻录到CD。

  • 还有一种压缩变体,称为AIFF-C或AIFC,具有各种定义的压缩编解码器。

  AMR

  • AMR (Adaptive Multi-Rate) 自适应多速率,是一种音频编码文件格式,专用于有效地压缩语音频率。

  • 主要用于移动设备的音频压缩,压缩比非常高,但音质比较差,主要用于语音类的音频压缩。不适合对音质要求高的音乐类音频的压缩。

  MP3

  • MP3的全称为Moving Picture Experts Group Audio Layer III(动态影像专家压缩标准音频层面3)

  • 是一种高效的计算机音频编码方案,以比较大的压缩比将音频文件转换成较小的扩展名为 .mp3 的文件,基本保持原文件的音质。

前端多媒体-音频

  Ogg

  • OGG文件是一种压缩的音频文件,它使用免费的 Ogg Vorbis 音频压缩。

  • 类似 .MP3 文件,用于存储音频数据的容器。

编码格式

  PCM

  • PCM编码:脉冲编码调制(Pluse Code Modulation,PCM),PCM是数字通信的编码方式之一。

  • PCM音频数据是未经压缩的音频采样数据裸流,是无法通过播放器播放的。

  • PCM俗称无损编码,代表了数字音频中最佳的保真水准。也只能做到最大程度的无限接近。

  AAC-LC

  • MPEG AAC Low Complexity (AAC-LC) MPEG AAC 低复杂度编解码器 (AAC-LC —— 低复杂度高级音频编码) 是低比特率、优质音频 的高性能音频编码解码器。
品质: 达到统计学标准的清晰度
比特率: 最高每通道256kbit/s
采样率: 8至96kHz
声道: 单声道、立体声、多声道
应用: 苹果 iPod、iTunes、QuickTime、AV 接收器、汽车收音机、移动音乐播放器、移动电话、日本ISDB

  AAC-LD

  • AAC-LD (又名AAC 低延迟或MPEG-4低延迟音频编码器),为电话会议和OTT服务量身打造的低延迟音频编解码器。

  • AAC Low Delay 已经被广泛应用于专业和民用通信领域,是最先进的MPEG-4音频编解码方式,可在极低编码延迟的条件下实现最佳语音和音频质量。

  • 支持 20 kHz 全音频带宽,能够为IP通信应用软件和设备带来 Full-HD Voice 音频质量。

声道: 单声道、立体声、多声道
应用: 视频通话: Apple FaceTime
视频会议/远程视频 Cisco、Tandberg、Polycom
操作系统 iOS、Android、Mac OS
广播内内容交换 Telos
标准 TIP、ETSI/Dect、OIPF、N/ACIP
  • 特征:
    1. 完全符合ISO MPEG-4 低延迟编解码器标准
    2. 支持的配置文件:LD
    3. 低CPU使用率和内存占用率
    4. 采样率从 22.05 到 48 kHZ
    5. 单声道的比特率从 8 kbps 到288 kbps,立体声信号的比特率从16 Kbps 到 576 Kbps

  FLAC

  • 免费无损音频编解码器,是一套著名的*音频压缩编码,特点是无损压缩。

  • 开源且免版税的音频文件格式

  • 可以还原音乐光盘音质,而不会丢失任何数据。

上一篇:【初学音视频】解码aac编码格式音频转pcm(使用faad2库)


下一篇:mkv转换mp4 无损转换