初识有损压缩格式!PSP音频全攻略
作为一部Protable Audio,其解码芯片的能力将影响整体的效果。PSP并不是专业的Protable Audio,所以对机器的原声不能要求过高,但SONY的功力深厚,PSP的音频潜力还是很大的。在此,我不想评论PSP的原音音质,这是有局限性的。因 为音质的好坏往往带有主观性,而没有编码算法来的这么客观。我想告诉大家的就是,在有限的条件下,发挥PSP的最大潜力。
PSP的音频解码为软件解码,但就其效果来看,与普通的Protable Audio有的一拼。作为一部Protable Audio,数字音频格式是他的灵魂,而数字音频格式的核心就是算法。PSP的储存介质空间有限,如果用无损压缩格式(WAV/*.plm)聆听音乐,就 因其体积较大而显得捉襟见肘。所以,在此我主要介绍有损压缩格式——MP3( MP3PRO\MP3 SURROUND)、AAC(*.3gp/*.mp4/*.m4v)、ATRAC3/ATRAC3+(*.aa3)。
先来明白音频压缩的原理:利用人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性等)以及 人耳对信号幅度、频率、时间的有限分辨能力,编码时凡是人耳感觉不到的频率不编码、不传送,即凡是对人耳辨别声音信号的强度、声调、方位没有贡献的部分 (称为不相关部分或无关部分)都不编码和传送。对感觉不到的部分进行编码时,允许有较大的量化失真、并使其处于听阈(即人耳所能听到的最低音量)以下,人 耳仍然感觉不到。音频的压缩就是利用这些特点来工作的。
一个音乐文件从录制到播放,有3个重要环节:编码(算法)、解码(硬件解码器)、输出(耳 机、耳塞)。这每个环节都对最终我们聆听到的声音音质有着重要的意义,缺一不可。今天,我谈的是基础的编码(算法),希望大家能找到最适合你的编码,我个 人的看法是AAC 256Kbps 和ATRAC3plus 256Kbps 。AAC的算法是“精致”,ATRAC的算法是“巧妙”。

心理声学的几个基本概念
1、等响度曲线
人的听觉的灵敏度随着频率而改变。即通常两个功率一样但频率不同的音调听起来并不一样响。通 过等响度曲线,我们可以看出,人耳对4KHz的频率最灵敏,即在4KHz下能被察觉出来的声音压力水平(响度),在其他频率下并不能被察觉。这就给在一些 不太灵敏的频率下失真提供了条件。
2、屏蔽
我们上高中物理时学过屏蔽。就是强的声音信号把弱的声音信号覆盖,导致我们无法察觉。而且,当两个声音在时间和频率上很接近时,屏蔽效应就会很强。因此,我们可以在编码时对被屏蔽的部分不编码、不传送。这样,音质依然没有大的损失,人耳也不易察觉。
3、临界频带
对于人类的听觉来说,对声音的感知特性并不是以线形频率为尺度来变化的(人的听觉还没那么好),而是可以用被称为临界频带的一系列有限的频段来表达。简单的说,把整个频带划分成几段,在这每个频段里,人耳的听觉感知是相同的,即心理声学特性都是一样的。
ATRAC3/ATRAC3+(*.aa3)
我想早年玩MD的朋友都知道SONY专为MD量身定做的ATRAC音频格式算法,后来又广泛 应用于SONY的 Network Walkman和其他便携音频设备。"ATRAC3plus"代表“自适应转换声音编码3+”,是一套基于心理声学原理的音频压缩技术,从ATRAC3格 式发展而来,到2002年这项技术才日趋完美。这一技术是把MD随身听的体积缩小到很小的理论基础。
要分析 ATRAC3/ATRAC3+,我们先要谈谈它的大哥——ATRAC算法。当数字音频数据被压缩时,通常都会把一定数量的量化噪音带入信号。为了不让这些 信号被人耳感知,通常的做法是,音频编码把信号分解为一组单元,每组单元都对应着特定的时间频率范围。编码器会依据前文提到的心理声学原理来分析,对重要 的单元进行高精度编码,对不敏感的单元可以保留一些量化的噪音但不影响人耳的感知质量。解码时,量化频谱会根据比特分配重新建立,然后合成音频信号。
当ATRAC算法发展了10年,已经满足不了市场的需求,SONY于2002年8月推出了新 的算法—— ATRAC3/ATRAC3+。其核心算法较ATRAC没有本质的大改变,只是采用了改进的频带分离过滤和MDCT,并使用增益调节、音调成分分离、联合 立体声(Joint-Stereo)等技术,使得音频压缩数据的体积进一步缩小。
下面我介绍一下听ATRAC3音乐的最简方法:

用sonicstage CP(或sonicstage)将CD音轨(或MP3、WMA文件)转换为ATRAC文件,其中包括ATRAC3、ATRAC3plus两种格式。注意: 在转换时千万不要选择添加复制保护,否则由于版权保护信息不正确,PSP将不能播放文件。这是关键的操作!!!!!!!!!!!!!生成的ATRAC文件 的后缀为.oma ,我们只要将后缀改为.aa3即可。然后将ATRAC 文件拷贝到[MUSIC]目录(或其子目录)里,这时你的PSP将能够完美播放ATRAC3音乐。
AAL(ATRAC Advanced Lossless)
AAL是ATRAC Advanced Lossless(自适应声学转换高级无损编码)的缩写,是SONY新开发的一个音频压缩格式其特点是无损压缩,不损失一点音频信息,一张CD可以压缩到 原来的30%--80%但目前PSP还不支持ATRAC Advanced Lossless,但我相信在PSP3.0里极有可能对其支持。目前,其技术资料我还没有见到,所以暂不作分析。
MP3( MP3PRO \ MP3 SURROUND)
MP3应该算目前应用最广泛的有损压缩数字音频格式了。它的全称是MPEG(Moving Picture Experts Group)Audio Layer-3。1987年德国Fraunhofer研究院研制成功的一种有损压缩数字音频格式,并于1989年取得专利。起初,它并不完善,它更像一个 编码标准框架,留待人们去完善。1992年,这一技术并入了MPEG规范,并有了正式名号——MP3。 MP3的音质达到现在的水平有两次飞跃:人体听觉心理学模型(Perceptual Model)的导入和VBR技术的应用。
PS: VBR是variable bitrate的缩写,意思是可变比率, 就是MP3文件压制的时候声音元素较多,比率较高时,将自动减低压缩比特率,在比特率需求比较低时自动升高比特率,这样做的目的是在保证音质基本不被损害 的情况下增加文件在线播放时的速度,和减少在本机播放时所占的系统资源……这是Xing发展的算法,他们将一首歌的复杂部分用高Bitrate编码,简单 部分用低Bitrate编码。主意虽然不错,可惜Xing编码器的VBR算法很差,音质与CBR相去甚远。幸运的是,Lame完美地优化了VBR算法,使 之成为MP3的最佳编码模式。这是以质量为前提兼顾文件大小的方式,推荐编码模式。
MP3能生存到今天,它的发展仍未止步。2001年6月14日,法国汤姆森与美国RCA两家 公司联合推出了一种新的压缩格式:MP3PRO。MP3PRO是基于MP3技术改良而来,它利用了Coding Technologies公司开发的编解码增强技术,该术称为SBR(Spectral Band Replication)。当制作MP3PRO文件时,编码器将音频分为两部分。一部分是将音频数据中的低频部分分离出来,通过传统的MP3技术编码得出 正常的MP3音频流。此举使MP3编码器专注于低频段信号的压缩从而获得更好的质量,而且使原来的MP3播放器也能播放MP3PRO文件。另一部分则是将 分离出来的高频信号进行编码并嵌入MP3流中。传统的MP3播放器会将其忽略掉,而新的MP3PRO播放器会将其还原出来并进行组合,得到高质量的全带宽 的声音。通过这项技术,使得MP3PRO 64Kbps 的编码率便可提供128Kbps的MP3相同的质量,且具有相差无几的音质,而体积只有MP3 的一半大小。
PSP就支持MP3PRO,而且支持MP3PRO的格式转换软件也很多,大家可以去网上找找。有兴趣的话可以试试,绝对比mp3强啊。
Thomson在2004年12月初正式宣布世界上最流行的音乐压缩格式MP3迈进多声道时 代。MP3 SURROUND是由Fraunhofer IIS和Agere联合开发的,使用了binaural Cue Coding(BCC)技术心理声学编码,可以在实现多声道环绕的同时保证文件的大小。同时加入的Agere Systems公司则主要负责将多声道MP3格式——MP3 SURROUND进行推广。 MP3 SURROUND技术实现了5.1声道环绕的高品质音频,应用范围相当广泛,可以在网络音乐发布、广播系统、PC视听应用、游戏音效、消费电子产品和车载 音响等方面发挥作用。尽管集成了多个声道,但是Thomson表示MP3 SURROUND文件相对于普通MP3(采样率相当)并没有太大的增加,相对于其他环绕多声道音频格式就只有它们的一半了。更为重要的,MP3 SURROUND提供了良好的兼容性,可以在现有的MP3软件、MP3播放器上正常使用。
目前网上出现了MP3 SURROUND的专门网站( http://www.mp3surround-format.com ),大家从这里可以下载到MP3 SURROUND的解码/编码工具以及已经做好的MP3文件,对MP3 SURROUND有兴趣的朋友还可以下载到技术文档。psp2.80支持7.1声道,2.80的玩家不妨体验一下MP3 SURROUND的魅力!
AAC(*.3gp/*.mp4/*.m4v)
AAC是高级音频编码(Advanced Audio Coding)的缩写,它是由Fraunhofer研究院、杜比和AT&T共同研发的。AAC是MPEG-2规范的一部分,它适用于从速率 8Kbps的单声道电话音质到160Kbps多声道的超高质量音频范围内的编码。AAC与MP3相比,增加了诸如对立体声的完美再现、码流效果音扫描、多 媒体控制、降噪优化等MP3音频格式所没有的特性,使得在音频压缩后仍能完美地再现CD音质。它还同时支持多达48个音轨、15个低频音轨、更多种采样率 和比特率、多种语言的兼容性、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。



