realaudio

更新时间:2022-12-30 00:45:00 阅读: 评论:0


2022年12月30日发(作者:wait and e)

⾳频及常⽤的格式

WAV

WAV是最接近⽆损的⾳乐格式,所以⽂件⼤⼩相对也⽐较⼤。

MP3

MP3是利⽤⼈⽿对⾼频声⾳信号不敏感的特性,将时域波形信号转换成频域信号,并划分成多个频段,对不同的频段使⽤不同的压缩率,对⾼频

加⼤压缩⽐(甚⾄忽略信号)对低频信号使⽤⼩压缩⽐,保证信号不失真。这样⼀来就相当于抛弃⼈⽿基本听不到的⾼频声⾳,[1]只保留能听

到的低频部分,从⽽将声⾳⽤1∶10甚⾄1∶12的压缩率压缩。由于这种压缩⽅式的全称叫MPEGAudioPlayer3,所以⼈们把它简称为MP3。

根据MPEG规范的说法,MPEG-4中的AAC(Advancedaudiocoding)将是MP3格式的下⼀代。MP3还分为⽿机MP3和外放MP3两⼤类,传

统MP3需要带⽿机才有很好的⾳质,但是对⼈们的⽿膜有所伤害,新型的MP3主要⽅向是外放MP3,对⽿膜⼏乎没有任何伤害,从⽽得到⼈们的

喜爱。

最⾼参数的MP3(320Kbps)的⾳质较之CD的,FLAC和APE⽆损压缩格式的差别不多,其优点是压缩后占⽤空间⼩,适⽤于移动设备的存储和使

⽤。

MP3PRO

MP3Pro是新⼀代的MP3格式,是Mp3编码格式的升级版本。MP3Pro是由瑞典Coding科技公司开发的,在保持相同的⾳质下同样可以把声⾳⽂

件的⽂件量压缩到原有MP3格式的⼀半⼤⼩。⽽且可以在基本不改变⽂件⼤⼩的情况下改善原先的MP3⾳乐⾳质。它能够在⽤较低的⽐特率压缩

⾳频⽂件的情况下,最⼤程度地保持压缩前的⾳质。

通常收听的mp3⾳乐⽂件⼀般都以128kbps的⽐特率压缩⽽成的。但如果采⽤更低的⽐特率(如96kbps或64kbps),我们可以⾮常明显的感觉

到声⾳的⾼频部分丢失现象明显,严重时声⾳还会产⽣扭曲现象。这其中的原因在于,以这些低⽐特率压缩⽽成的mp3在编码时⽆法对声⾳的整

个频带进⾏压缩,从⽽丢失了⾼频段⼀些重要的声⾳信息。

为了能够在低⽐特率下获得更⾼⾳质的mp3⽂件,⼀项称作SBR(SpectralBandReplication)的技术被⽤于新的mp3PRO编码中,其主要的

⽤处在于保留了声⾳中的⾼频⾳,使得以低⽐特率压缩的mp3⽂件⾳质得到显著的增强。

mp3PRO在进⾏编码时,mp3PRO编码器将⾳频的录⾳分成两个部分:mp3部分和PRO部分。mp3部分分析低频段(LowFrequencyBand)

信息,并将其编码成通常的mp3⽂件数据流。这就使得编码器能够集中编码更少的有⽤信息,获得更佳品质的编码效果。同时,这也保证了

mp3PRO⽂件同⽼的mp3播放器的兼容性。PRO部分分析的则是⾼频段(HighFrequencyBand)信息,并将其编码成mp3数据流的⼀部分,

⽽这些通常在⽼的mp3解码器⾥是被忽略的。新的mp3PRO解码器会有效地利⽤这部分数据流,将两段(⾼频段和低频段)合并起来产⽣完全的

⾳频带,达到增强⾳质的效果。

既然MP3存在的好好的,为什么会有MP3Pro的出现呢??这要从⽹络流媒体格式的出现说起。由于要在⽹络上收看声⾳和视频的需求不断增

加,⽹络流媒体real和windowsmedia格式慢慢兴起。随着这些媒体的编码器不断改进,他们的质量已经不断提升,已经能够做到⽂件尺⼨⼜⼩,

质量⼜好,⼤有赶超MP3之势。以前MP3所倍受推崇的⾼压缩⽐,低质量损失已经不再是⼀张王牌,昔⽇辉煌的地位正在不断受到威胁。⾯对这

⼀情况,ThomsonMultimedia,⼀个制作mp3编码格式的公司现今推出了⼀个MP3格式的升级版本----Mp3Pro。

2001年6⽉14⽇,美国汤姆森多媒体公司(ThomsonMultimediaSA)与佛朗赫弗协会(FraunhoferInstitute)于6⽉14⽇发布了⼀种新的⾳乐

格式版本,名称为mp3PRO,这是⼀种基于mp3编码技术的改良⽅案,从官⽅公布的特征看来确实相当吸引⼈。从各⽅⾯的资料显⽰,mp3PRO

并不是⼀种全新的格式,完全是基于传统mp3编码技术的⼀种改良,本⾝最⼤的技术亮点就在于SBR(SpectralBandReplication频段复

制),这是⼀种新的⾳频编码增强算法。它提供了改善低位率情况下⾳频和语⾳编码的性能的可能。这种⽅法可在指定的位率下增加⾳频的带宽或

改善编码效率。SBR最⼤的优势就是在低数据速率下实现⾮常⾼效的编码,与传统的编码技术不同的是,SBR更像是⼀种后处理技术,因此解码

器的算法的优劣直接影响到⾳质的好坏。⾼频实际上是由解码器(播放器)产⽣的,SBR编码的数据更像是⼀种产⽣⾼频的命令集,或者称为指

导性的信号源,这有点駇idi的⼯作⽅式。我们可以看到,mp3PRO其实是⼀种mp3信号流和SBR信号流的混合数据流编码。有关资料显⽰,SBR

技术可以改善低数据流量下的⾼频⾳质,改善程度约为30%,我们不管这个30%是如何得来的,但可以事先预知这种改善可以让64kbps的mp3

达到128kbps的mp3的⾳质⽔平(注:在相同的编码条件下,数据速率的提升和⾳质的提升不是成正⽐的,⾄少⼈⽿听觉上是这样的),这和官

⽅声称的64kbps的mp3PRO可以媲美128kbps的mp3的宣传基本是吻合的。

APE

APE是流⾏的数字⾳乐⽆损压缩格式之⼀,因出现较早,在全世界特别是中国⼤陆有着⼴泛的⽤户群。与MP3这类有损压缩格式不可逆转地删除

(⼈⽿听⼒不敏感的)数据以缩减源⽂件体积不同,APE这类⽆损压缩格式,是以更精炼的记录⽅式来缩减体积,还原后数据与源⽂件⼀样,从

⽽保证了⽂件的完整性。APE由软件Monkey'saudio压制得到,开发者为d,源代码开放,因其界⾯上有只“猴⼦”标志⽽

出名。相较同类⽂件格式FLAC,ape有查错能⼒但不提供纠错功能,以保证⽂件的⽆损和纯正;其另⼀个特⾊是压缩率约为55%,⽐FLAC⾼,

体积⼤概为原CD的⼀半,便于存储。

APE作为⼀种⽆损压缩⾳频格式,通过Monkey'sAudio这个软件可以将庞⼤的WAV⾳频⽂件压缩为APE,,体积虽然变⼩了,但⾳质和原来⼀

样。通过Monkey'sAudio解压缩还原以后得到的WAV⽂件可以做到与压缩前的源⽂件完全⼀致。所以APE被誉为“⽆损⾳频压缩格

式”,Monkey''sAudio被誉为“⽆损⾳频压缩软件”。

简单来讲,APE压缩与WinZip或WinRAR这类专业数据压缩软件压缩原理类似,只是APE等⽆损压缩数字⾳乐之后的APE⾳频⽂件是可以直接被

播放的。APE的压缩速率是动态的,压缩时只压缩可被压缩部分,不能被压缩的部分还是会保留下来。

FLAC

FLAC中⽂可解释为⽆损⾳频压缩编码。FLAC是⼀套著名的⾃由⾳频压缩编码,其特点是⽆损压缩。不同于其他有损压缩编码如MP3及AAC,

它不会破坏任何原有的⾳频资讯,所以可以还原⾳乐光盘⾳质。2012年以来它已被很多软件及硬件⾳频产品(如CD等)所⽀持.

FLAC与MP3不同,MP3是⾳频压缩编码,但FLAC是⽆损压缩,也就是说⾳频以FLAC编码压缩后不会丢失任何信息,将FLAC⽂件还原为WAV

⽂件后,与压缩前的WAV⽂件内容相同。这种压缩与ZIP的⽅式类似,但FLAC的压缩⽐率⼤于ZIP和RAR,因为FLAC是专门针对PCM⾳频的特

点设计的压缩⽅式。⽽且可以使⽤播放器直接播放FLAC压缩的⽂件,就象通常播放你的MP3⽂件⼀样(近⼏年已经有许多汽车播放器和家⽤⾳响

设备⽀持FLAC,在FLAC的⽹站上你可以找到这些设备⼚家的链接)。

FLAC是免费的并且⽀持⼤多数的操作系统,包括Windows,基于UnixLike内核((Linux,BSD,Solaris,IRIX,AIX等)⽽开发的系

统,BeOS,OS/2,Amiga。并且FLAC提供了在开发⼯具autotools,MSVC,WatcomC,ProjectBuilder上的build系统。

AAC

AAC实际上是⾼级⾳频编码的缩写,苹果ipod、诺基亚⼿机也⽀持AAC格式的⾳频⽂件。AAC是由FraunhoferIIS-A、杜⽐和AT&T共同开发

的⼀种⾳频格式,它是MPEG-2规范的⼀部分。AAC所采⽤的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能来提⾼编码效

率。AAC的⾳频算法在压缩能⼒上远远超过了以前的⼀些压缩算法(⽐如MP3等)。它还同时⽀持多达48个⾳轨、15个低频⾳轨、更多种采样

率和⽐特率、多种语⾔的兼容能⼒、更⾼的解码效率。总之,AAC可以在⽐MP3⽂件缩⼩30%的前提下提供更好的⾳质。

RealMedia

从1997年RM出现算起,RealMedia到现在已经陪伴我们⼗数个年头了。互联⽹⼤⾏其道之后,RealMedia出现了。这种⽂件格式⼏乎成了⽹

络流媒体的代名词。RM/RMVB皆为封装RealMedia编码的特有格式(包括RealVideo和RealAudio),RA/RMA这两个⽂件类型就是Real

Media⾥⾯向⾳频⽅⾯的格式。它们是由RealNetworks公司发明的,特点是可以在⾮常低的带宽下(低达28.8kbps)提供⾜够好的⾳质让⽤户

能在线聆听。这⼀特点在互联⽹的早期简直是⼴⼤⽹⾍的福⾳。也就是因为出现了RealMedia之后,相关的应⽤⽐如⽹络⼴播,⽹上教学,⽹上

点播等等才浮出⽔⾯,形成了⼀个新的⾏业。

⽹络流媒体的道理其实⾮常简单,简单说就是将原来连续不断的⾳频分割成⼀个⼀个带有顺序标记的⼩数据包,将这些⼩数据包通过⽹络进⾏传

递,在接收的时候再将这些数据包重新按顺序组织起来播放。如果⽹络质量太差,有些数据包收不到或者延缓了到达,它就跳过这些数据包不播

放,以保证⽤户在聆听的内容是基本连续的。就是这么简单的道理,促成了⽹络上的⼜⼀个传奇。

WindowsMedia

MIDI

MIDI(MusicalInstrumentDigitalInterface)乐器数字接⼝,是20世纪80年代初为解决电声乐器之间的通信问题⽽提出的。MIDI是编曲界最

⼴泛的⾳乐标准格式,可称为“计算机能理解的乐谱”。它⽤⾳符的数字控制信号来记录⾳乐。⼀⾸完整的MIDI⾳乐只有⼏⼗KB⼤,⽽能包含数

⼗条⾳乐轨道。⼏乎所有的现代⾳乐都是⽤MIDI加上⾳⾊库来制作合成的。MIDI传输的不是声⾳信号,⽽是⾳符、控制参数等指令,它指⽰

MIDI设备要做什么,怎么做,如演奏哪个⾳符、多⼤⾳量等。它们被统⼀表⽰成MIDI消息(MIDIMessage)。传输时采⽤异步串⾏通信,标准

通信波特率为31.25×(1±0.01)KBaud。

MIDI发明者,是美国的加州⾳乐⼈,DaveSmith。

三⼗年前,⾳乐⼈没法同时操纵多个乐器,因为当时各种乐器是不可连接的。需要左右⼿同时弹奏两个键盘。此后,合成器制造商DaveSmith,

说服了唱⽚商采⽤了⼀种叫做“乐器数字接⼝”(MusicalInstrumentDigitalInterface,MIDI)的通⽤格式,这种格式能够让合成器受到外部键

盘信号控制,可以由唱⽚商的竞争对⼿制作,甚⾄直接从电脑输出。使运算速度⾜够快的电脑处理⾳符采样,并能同时控制多个键盘和⿎机。

MIDI标准能让⼈们在⾃⼰家⾥进⾏⾳乐创作,使⼈们终于能够把合成器和⿎机连接到电脑上。于是,MIDI很快变成了连接各种型号的合成器、⿎

机、采样数据和计算机的产业标准。

MIDI⽆论放置在哪⾥,都能在⼀个合成器上演奏些东西,并能在另外⼀个合成器上播放完全⼀样的声响。复杂⽽精⼼控制的的合成器声效、⿎机

和采样样本见证了编曲技术从不可能到可能的转变。随着这种全新定义的制作⽅式,舞曲这种新的⾳乐类型诞⽣了。

第⼀台能够兼容MIDI格式的是⼀个由DaveSmith制作、叫做Prophet-900的合成器。它在1982年12⽉退役。在当时的青少年游戏玩家中流⾏

的Atari以及Commodore64型计算机也能通过⼀个5针的线缆控制另⼀端的MIDI乐器。

MIDI⾳乐格式,带有强烈的电⼦感,以及⼴泛适⽤性和便利性,催⽣了那个年代众多的⾳乐类型。重塑了1980年代的流⾏乐。

MIDI格式早期的的“开源精神”概念,让每个⼈都能创作”复杂的⾳乐⽚段”,MIDI标准的⽀持者推动它成为连接着着全世界的⾃由纽带。三⼗

年以后,MIDI仍然强劲不衰,作为专业⾳乐录制和制作的关键组件⽽存续着。

OGG

Ogg全称是OGGVobis(oggVorbis)是⼀种⾳频压缩格式,类似于MP3等的⾳乐格式。Ogg是完全免费、开放和没有专利限制的。OggVorbis⽂

件的扩展名是".ogg"。Ogg⽂件格式可以不断地进⾏⼤⼩和⾳质的改良,⽽不影响旧有的编码器或播放器。

MP3是有损压缩格式,因此压缩后的数据与标准的CD⾳乐相⽐是有损失的。VORBIS也是有损压缩,通过使⽤更加先进的声学模型去减少损失,

因此,同样位速率(BitRate)编码的OGG与MP3相⽐听起来更好⼀些。另外,还有⼀个原因,MP3格式是受专利保护的(mp3专利费已经极低,

诞⽣近20年快该过保护期了)。如果你想使⽤MP3格式发布⾃⼰的作品,则需要付给Fraunhofer(发明MP3的公司)专利使⽤费。⽽VORBIS

就完全没有这个问题。对于乐迷来说想要⾼品质的⾳频,使⽤FLAC是个更好的选择,因为FLAC是⽆损压缩⾳频,⼜没有专利授权费⽤,现在很

多播放器都加⼊了FLAC的⾏列,就连sony的顶级⾼解析⾳频播放器都已经⽀持。

优点1:OggVorbis的⾳质和MP3不相上下,但⽆法和FLAC⽐。

由于Vorbis使⽤了与MP3相⽐完全不同的数学原理,因此在压缩⾳乐时受到的挑战也不同。在聆听测试中,同样位速率编码的Vorbis和MP3⽂

件具有同等的声⾳质量。

如果两个⽂件都是以同样的位速率和CBR(常量位速率,指⽂件从头到尾都是⼀种位速率)⽅式来编码的话,那他们的⼤⼩肯定相同。当前

Vorbis是以VBR⽅式编码的,(很久以前MP3也可以⽤VBR⽅式编码,除此以外还⽀持ABR(平局码率)⽅式,ABR⽅式可以事先确定⼤⼩的

情况下获得尽可能好的⾳质,并且MP3⽀持通过左右声道联合⽴体声编码⽅式提⾼⾳质。)这使得Ogg的⽂件可以更⼩,因为VBR⽅式可以处理

能⼤幅度进⾏压缩的⾳频数据(⽐如⽆声的时段)⽽节省空间。

优点2:OggVorbis⽀持类似于MP3的ID3信息

Vorbis格式中包括有⼀个灵活⽽⼜完整的注释栏,可⽤于填写各种相关信息。

优点3:OggVorbis格式⽀持流式播放

⾳频流是Vorbis的⼀个重要组成部分.vorbis格式从设计的⼀开始就是⽴⾜于可以容易地进⾏流式处理。并且,Vorbis的设计者正与Icecast流媒

体软件的创造者⼀起使Icecast兼容Vorbis。

优点4:OggVorbis避免了像MP3⽂件的ID3标记那样烦琐的操作(有很多针对MP3的ID3修改软件标记早已不繁琐)

Vorbis具有⼀个设计良好、灵活的注释,避免了像MP3⽂件的ID3标记那样烦琐的操作;Vorbis还具有位速率缩放:可以不⽤重新编码便可调节

⽂件的位速率。Vorbis⽂件可以被分成⼩块并以样本粒度进⾏编辑;Vorbis⽀持多通道;Vorbis⽂件可以以逻辑⽅式相连接等。

缺点1:播放兼容性差。mp3已经成了便携随⾝听的代名词。绝⼤多数播放器、包括⼿机、pad等设备都⽀持mp3格式

(其实mp3专利芯⽚授权费极低),⽽⽀持ogg格式的播放器很少。

缺点2:mp3是1997年以前就已经诞⽣,将近20年垄断了消费机市场。ogg⾳频普及性⾮常差,相对于mp3⽽⾔⾳质

也没有竞争⼒,普及的可能性极低。

缺点3:相对于已经普及的微软WMA格式,ogg没有任何优势。不管是播放软件兼容性,码率,流媒体等⽅⾯。

缺点4:多声道系统已经由DOLBY、DTS两家公司垄断,他们都有完整的制作发⾏体系。⼤型多声道电影、电视、⾳乐

制作都是基于这两家公司的技术和标准。ogg只能望洋兴叹了。

缺点5:很多专业⾳频制作软件不⽀持ogg⽂件格式。

缺点6:现今HIFI已经被HIRES(⾼解析)代替,随着存储、⽹速等限制,⽤户的聆听设备已经上了⼀个台阶,有损格式

已经渐渐失去市场。

VQF

VQF指的是TwinVQ(Transform-domainWeightedINterleaveVectorQuantization),VQF是⼀种⾳频压缩技术。VQF所采⽤的是⼀种

称为“⽮量化编码(vectorquantization)”的压缩技术。对计算机的配置要求为奔腾75或更⾼。

VQF格式实际指的是TwinVQ(transform-domainweightedinterleavevectorquantization),是⽇本ntt(nippontelegraphand

telephone)集团属下的ntthumaninterfacelaboratories开发的⼀种⾳频压缩技术。VQF格式技术受到yamaha公司的⽀持,vqf是其⽂件的

扩展名。VQF格式和mp3的实现⽅法相似,都是通过采⽤有失真的算法来将声⾳进⾏压缩,不过VQF格式与mp3的压缩技术相⽐却有着本质上的

不同:VQF格式的⽬的是对⾳乐⽽不是声⾳进⾏压缩,因此,VQF格式所采⽤的是⼀种称为“⽮量化编码(vectorquantization)”的压缩技

术。该技术先将⾳频数据⽮量化,然后对⾳频波形中相类似的波形部分统⼀与平滑化,并强化突出⼈⽿敏感的部分,最后对处理后的⽮量数据标量

化再进⾏压缩⽽成。

VQF使⽤范围从电话、AM短波乃⾄⾳频CD;从单声道信号到⽴体声信号,它都能提供了很好的编码/压缩⽀持。还有纠错能⼒。VQF特别提供了

⼀个纠错环境来处理数据错误及帧丢失的情况。它使⽤修正帧频率技术,然后强化⽮量量化以保证⾳质。

MOD

MOD是⼀种类似波表的⾳乐格式,但它的结构却类似MIDI,使⽤真实采样,体积很⼩,在以前的DOS年代,MOD经常被作为游戏的背景⾳乐。

现在的MOD可以包含很多⾳轨,⽽且格式众多,如S3M、NST、669、MTM、XM、IT、XT和RT等。

Module(简称mod)是数码⾳乐⽂件,由⼀组samples(乐器的声⾳采样)、曲谱和时序信息组成,告诉⼀个mod播放器何时以何种⾳⾼去演

奏在某条⾳轨的某个样本,附带演奏⼀些效果⽐如颤⾳等。因⽽mod与纯正的象WAV或AU那样的没有包含时序信息的样本⽂件不同,与象MIDI

⽂件那样的不携带任何附加样本/乐器的⽂件也不同(与现在⽀持DLS技术的MIDI倒是有点相似,不过mod的体积要⽐DLSMIDI⼩得多。)。

mod起源于Amiga计算机,当时的⽂件扩展名是MOD,为了区分具体的类型和整个结构体系,通常使⽤MOD来表⽰整个Module格式体系。

由于该格式起源很早,因此曾经⾮常流⾏,因为mod提供了⼀种具有可以接受的⾳质⽔平⽽⼜⾮常廉价的制作⾳乐的⽅法。⽽且这种⽂件的⾳质

效果对于当时的电脑硬件⽔平来说效果⽐MIDI要好,⽂件的体积也不⼤,好处是显⽽易见的。随着⾼质量的⾳响硬件的使⽤,新⼀代的mod的声

⾳质量甚⾄可以提升到接近专业设备的⽔平。这使得mod成为⼀种介乎于象WAV或VOC那样的纯正样本数据⽂件和象GeneralMIDI那样的纯正

时序信息⽂件之间的混合体,成为⼀种⽐较灵活的⾳频格式。

但是,mod的最⼤缺点是具体的格式变化太多。由于原本的MOD格式只⽀持4条⾳轨,⽽且MOD格式并没有版权限制,导致后来涌现了⼀⼤堆在

MOD的基础上改进⽽来的格式,⽐如xm这种⽀持⾼达32条⾳轨128种采样的格式。但由于mod格式的不统⼀,最终结果就是这种格式在商业领

域没有多⼤的作为。Windows平台上曾经有⼀个⾮常好的播放器名为MOD4WIN,后来也停⽌了开发。⽬前⽀持播放Mod的播放器主要有

WinAMP。

Monkey'saudio

Monkey'sAudio这款软件并不是由什么⼤公司发明的,完全是⼀个个⼈业余兴趣作品。

Monkey'sAudio的压缩效果⼤约在2:1左右,也就是说压缩结果是原来的⼆分之⼀⼤⼩。⼀张CD的存储空间⼤约在680MB左右,在经过

Monkey'sAudio压缩之后的⽂件⼤约需要330MB左右的空间存放,相⽐之下还是⽐较占空间的。由于这个原因,所以对⾳质要求不是太⾼的⼈

通常都选择VBR⽅式的mp3⽽不是选择它。

与Monkey'sAudio类似的编码格式还包括WavPack、RKAU、Shorten等等。由于相对不是那么出名,⼜或者在某些⽅⾯不够Monkey's

Audio做得好,因此获得的关注程度就逊⾊很多。

AIFF

MusicCodec。据官⽅资料介绍,QDesignMusic

Codec2能在全带宽⽴体声的设置下将⾳频压缩为原来的百分之⼀⼤⼩。与其他纯粹基于知觉⾳频编码技术(mp3等)不同的是,QDesign

MusicCodec2使⽤了新的专利的算法技术,因此,可以在modem的速度上达到相当的⾳频质量。该技术最⼤⽀持128kbps。

AU

voc

本文发布于:2022-12-30 00:45:00,感谢您对本站的认可!

本文链接:http://www.wtabcd.cn/fanwen/fan/90/56451.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:fm88 5
下一篇:rzm
标签:realaudio
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图