[不指定 2007/08/23 14:26 | by 逍遥花主 ]

iDCT & Wavelet iDCT和小波

MPEG文件中的视频信息是存储于频域而非空间域(即我们看到的图象)中的。信息通过这种方式得到压缩从而减少了信道中传播的信息量。MPEG通过离散余弦变换DCT(Discrete Cosine Transform)把空间域的信息变换到频域的信息。从MPEG流中提取出空间域的信息时,我们需要使用反离散余弦变换(IDCT)来抵消编码时做的离散余弦变换。
 

DCT和IDCT

其实就是一种离散傅立叶变换(DFT),只不过我们通过DFT得到的是复数,而DCT/IDCT变换的结果是整数。我们可以在DSP,通信系统等领域的大学课本中查到更详尽的相关信息。
小波是一种基空间。小波基可以有无穷种(比如Daubechies, Haar, Mexican Hat, "Spline", Zebra等等),但小波基的主要特性是它是局部化的。傅立叶函数跨越了整个空间(从负无穷到正无穷),而小波实际上是不同位置、不同尺度上的脉冲波。

压缩以后的数据分成了两部分。一般来说90%以上的数据通过低通滤波器,而高通滤波器会滤出数值非常小的细节数据(当然,如果信息源噪音很大的话这个自然不成立)。对于图像来说,使用这种方法的最大价值在于基的局部化,因此我们可以用小波来很好的模拟像边缘这些非连续的部分。使用小波以后就不会再出现那些奇怪的JPEG光环了。

IFO 文件

信息文件 (InFOrmation file) 通常存在与DVD中。这些文件包含了为DVD播放器导航的信息。

Interlaced 隔行扫描

Interlaced (隔行扫描)是一种视频存储模式一个交错的视频流不包含帧而是一些场,每个场包含了一帧里的一半数量的行(全部是odd或全部是even)。

Interleaving 交错
想象一下在一个特定点把音频和视频结合在一起,就是我们所说的交错。播放器会识别交错点,确保音频和视频在整部电影中按照粘合的点的规律来播放。

更详细地解释:假设我们有10秒钟的视频和10秒钟的音频片断。每一秒钟的视频用V表示 ,音频用A表示,那么如果你的交错设置为10秒,磁盘上的文件将是VVVVVVVVVVAAAAAAAAAA的形式。如果交错设置为1秒这里将是:VAVAVAVAVAVAVAVAVA。

Inverse Telecine
Telecine 的反向工程。此过程将29.97fps的片源还原为本来的24fps。

Keyframe 关键帧
一个完整的帧 (frame),但是此帧被尽可能的压缩了。

m1v/m2v

这两个术语分别被作为MPEG-1和MPEG-2视频数据的扩展(仅仅是视频,不包含任何音频)。

MPEG

MPEG意思是动态影像专家组 (Motion Picture Expert Group),通常它是视频格式的来源。这个专家组解释数字视频的标准(或规范),包括MPEG1标准(VCD)、MPEG2标准(用于DVD以及SVCD)、MPEG4标准以及若干音频标准包括MP3和AAC。使用MPEG-1或者MPEG-2标准的视频通常以.mpg或者.mpeg作为扩展名。

MPEG4

MPEG4是MPEG专家组 (MPEG Group) 所确定的一系列标准(或者规范),它将成为数字视频的下一标准(主要用于视频电话、因特网上的流媒体以及更多方面)。MPEG4允许运用多种编码方式,比如一个关键帧可以使用 ICT 或者 小波 以得到不同的输出质量。

MPG

MPG可以看作 MPEG 的缩写,也可以作为MPEG-1以及MPEG-2视频数据的扩展名。

MM4

Multiple MPEG 4: 不同比特率编码文件的组合.比如你能把2000kbit/s和910kbit/s编码的文件组合起来,采用比特率较低的文件,取代文件中由于和2000kbit/s的部分作用太多而导致严重失真的画面.这里也可以是两种DIVX编码的组合:你可以把低MOTION和高MOTION的文件合并起来(这里也可以使用不同的比特率)。
内文分页: [1] [2] [3] [4] [5] [6]
『技术文摘』 | Tags:| 评论(0) | 引用(0) | 阅读(8856)



发表评论
昵称 [注册]
网址
打开HTML 打开UBB 打开表情 隐藏 记住我