FMUSER更轻松地传输视频和音频!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org ->荷兰语
sq.fmuser.org ->阿尔巴尼亚人
ar.fmuser.org ->阿拉伯语
hy.fmuser.org - >亚美尼亚
az.fmuser.org ->阿塞拜疆
eu.fmuser.org ->巴斯克
be.fmuser.org ->白俄罗斯语
bg.fmuser.org - >保加利亚
ca.fmuser.org ->加泰罗尼亚语
zh-CN.fmuser.org ->中文(简体)
zh-TW.fmuser.org - >中国(繁体)
hr.fmuser.org ->克罗地亚语
cs.fmuser.org ->捷克
da.fmuser.org ->丹麦语
nl.fmuser.org - >荷兰
et.fmuser.org ->爱沙尼亚语
tl.fmuser.org ->菲律宾
fi.fmuser.org ->芬兰语
fr.fmuser.org - >法国
gl.fmuser.org ->加利西亚语
ka.fmuser.org ->乔治亚
de.fmuser.org ->德语
el.fmuser.org - >希腊
ht.fmuser.org ->海地克里奥尔语
iw.fmuser.org ->希伯来语
hi.fmuser.org ->印地语
hu.fmuser.org - >匈牙利
is.fmuser.org ->冰岛语
id.fmuser.org ->印尼语
ga.fmuser.org ->爱尔兰
it.fmuser.org - >意大利
ja.fmuser.org ->日语
ko.fmuser.org ->韩文
lv.fmuser.org ->拉脱维亚
lt.fmuser.org - >立陶宛
mk.fmuser.org ->马其顿语
ms.fmuser.org ->马来语
mt.fmuser.org ->马耳他语
no.fmuser.org - >挪威
fa.fmuser.org ->波斯语
pl.fmuser.org ->波兰语
pt.fmuser.org ->葡萄牙语
ro.fmuser.org - >罗马尼亚
ru.fmuser.org ->俄语
sr.fmuser.org ->塞尔维亚语
sk.fmuser.org ->斯洛伐克
sl.fmuser.org - >斯洛文尼亚
es.fmuser.org ->西班牙语
sw.fmuser.org ->斯瓦希里语
sv.fmuser.org ->瑞典语
th.fmuser.org - >泰国
tr.fmuser.org ->土耳其语
uk.fmuser.org ->乌克兰语
ur.fmuser.org ->乌尔都语
vi.fmuser.org - >越南
cy.fmuser.org ->威尔士语
yi.fmuser.org - >意第绪语
(1)视频信号冗余信息
以记录数字视频的YUV分量格式为例,YUV分别代表亮度和两个色差信号。 例如,对于现有的pal TV系统,亮度信号的采样频率为13.5MHz。 色度信号的频带通常是亮度信号的一半或更少,即6.75mhz或3.375mhz。 以4:2:2的采样频率为例,Y信号采用13.5mhz,色度信号U和V以6.75mhz采样,采样信号以8bit量化,则可以计算出数字视频的编码率。如下:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216兆位/秒
如果直接存储或传输如此大量的数据,将很难使用压缩技术来降低比特率。 可以根据两个基本条件压缩数字视频信号:
L.数据冗余。 例如,空间冗余,时间冗余,结构冗余,信息熵冗余等,即,图像的像素之间存在很强的相关性。 消除这些冗余不会导致信息丢失,而是无损压缩。
L.视觉冗余。 人眼的某些特征(例如亮度判别阈值,视觉阈值)在亮度和色度灵敏度上有所不同,这使得不可能在编码中引入适当的错误,并且不会被检测到。 人眼的视觉特性可用于交换具有某些客观失真的数据压缩。 这种压缩是有损的。
基于上述两个条件的数字视频信号的压缩,使得视频数据大大压缩,有利于传输和存储。 数字视频压缩的常用方法是混合编码,即将变换编码,运动估计和运动补偿以及熵编码相结合以进行压缩编码。 通常,使用变换编码来消除图像的帧内冗余,并且使用运动估计和运动补偿来消除图像的帧间冗余,并且使用熵编码来进一步提高压缩效率。 简要介绍以下三种压缩编码方法。
(a) 压缩编码方式
(b) 变换编码
变换编码的功能是将在空间域中描述的图像信号变换到频域,然后对变换后的系数进行编码。 一般而言,图像在空间上具有很强的相关性,向频域的变换可以实现去相关和能量集中。 常见的正交变换包括离散傅里叶变换,离散余弦变换等。 离散余弦变换被广泛用于数字视频压缩中。
离散余弦变换称为DCT变换。 它可以将L * l的图像块从空域转换到频域。 因此,在基于DCT的图像压缩和编码过程中,需要将图像划分为非重叠的图像块。 假设图像的大小为1280 * 720,则将其分为160 * 90个图像块,其大小为8 * 8,而不会以网格形式重叠。 然后,可以对每个图像块执行DCT变换。
在分割块之后,将每个8 * 8点图像块发送到DCT编码器,并将8 * 8图像块从空间域转换到频域。 下图显示了一个8 * 8图像块的示例,其中数字代表每个像素的亮度值。 从图中可以看出,该图像块中每个像素的亮度值相对均匀,尤其是相邻像素的亮度值不是很大,说明图像信号具有很强的相关性。
实际的8 * 8图像块
下图显示了上图中图像块的DCT转换结果。 从图中可以看出,经过DCT变换后,左上角的低频系数集中了很多能量,而右下角的高频系数上的能量很小。
DCT变换后的图像块系数
DCT转换后需要对信号进行量化。 由于人眼对图像的低频特性(例如对象的整体亮度)敏感,而对图像中的高频细节不敏感,因此在传输过程中,高频信息只能或少或少地传输低频部分。 量化过程通过对低频区域的系数进行量化以及对高频区域的系数进行粗量化来减少信息传输,从而去除了对人眼不敏感的高频信息。 因此,量化是有损压缩过程,并且是视频压缩编码中质量受损的主要原因。
量化过程可以用以下公式表示:
其中,FQ(U,V)表示量化后的DCT系数; f(U,V)表示量化前的DCT系数; Q(U,V)代表量化权重矩阵; q是量化步长; round是指合并,将要输出的值作为最接近的整数值。
合理选择量化系数,对变换后的图像块进行量化后的结果如图所示。
量化后的DCT系数
量化后,大多数DCT系数都更改为0,而只有少数系数是非零值。 此时,仅需要压缩和编码这些非零值。
(b)熵编码
之所以命名为熵编码,是因为编码后的平均编码长度接近于源的熵值。 熵编码是通过VLC(可变长度编码)实现的。 基本原理是在源中将短代码赋予符号高概率,而对出现概率小的符号赋予长码,从而从统计上获得较短的平均码长。 可变长度编码通常包括霍夫曼码,算术代码,运行代码等。运行长度编码是一种非常简单的压缩方法,其压缩效率不高,但编解码速度较快,仍然得到广泛应用,特别是编码转换后,使用游程编码,效果很好。
首先,紧随量化器输出直流系数之后的交流系数应以Z型扫描(如箭头线所示)。 Z扫描将二维量化系数转换为一维序列,然后进行游程编码。 最后,在运行编码(例如霍夫曼编码)之后,使用另一个可变长度代码对数据进行编码。 通过这种可变长度编码,编码效率进一步提高。
(c)运动估计和运动补偿
运动估计和运动补偿是消除图像序列时间方向相关性的有效方法。 上述的DCT变换,量化和熵编码方法是基于一帧图像的。 通过这些方法,可以消除图像中像素之间的空间相关性。 实际上,除了空间相关性之外,图像信号还具有时间相关性。 例如,对于新闻联播等背景静态的数字视频,以及图片主体的移动很小,每张图片之间的差异很小,图像之间的相关性也很大。 在这种情况下,我们不需要分别对每个帧图像进行编码,而只能对相邻视频帧的变化部分进行编码,以进一步减少数据量。 这项工作是通过运动估计和运动补偿来实现的。
运动估计技术通常将当前输入图像分为几个彼此不重叠的小图像子块,例如,帧图像的大小为1280 *720。首先,将其分为40 * 45个图像块,其中16 *不以网格形式相互重叠的16个大小,然后在前一个图像或后一个图像的搜索窗口范围内,为每个图像块找到一个块,以在一个图像范围内找到一个图像块搜索窗口最相似的图像块。 搜索过程称为运动估计。 通过计算最相似的图像块和图像块之间的位置信息,可以获得运动矢量。 这样,可以从参考图像运动向量所指向的最相似的图像块中减去当前图像块,并且可以获得残留图像块。 因为残留图像块中的每个像素值非常小,所以在压缩编码中可以获得更高的压缩率。 该减法过程称为运动补偿。
由于在编码过程中需要将参考图像用于运动估计和运动补偿,因此选择参考图像非常重要。 通常,编码器根据不同的参考图像将输入的每个帧图像划分为三种不同的类型:I(内部)帧,B(指导预测)帧和P(预测)帧。 如图所示。
典型的I,B,P帧结构顺序
如图所示,I帧仅使用该帧中的数据进行编码,并且在编码过程中不需要运动估计和运动补偿。 显然,由于I帧没有消除时间方向的相关性,因此压缩率相对较低。 在编码过程中,P帧使用前I帧或P帧作为运动补偿的参考图像,实际上,它对当前图像和参考图像之间的差异进行编码。 B帧的编码方式类似于P帧,唯一的区别是在编码过程中需要使用前I帧或P帧以及后I帧或P帧进行预测。 因此,每个P帧编码需要使用一个帧图像作为参考图像,而帧B需要两个帧作为参考。 相反,B帧具有比P帧更高的压缩率。
(d)混合编码
本文介绍了视频压缩和编码中的几种重要方法。 在实际应用中,这些方法不是分开的,通常将它们组合在一起以获得最佳的压缩效果。 下图显示了混合编码的模型(即,变换编码+运动估计和运动补偿+熵编码)。 该模型在MPEG1,MPEG2,H.264等标准中得到了广泛的应用,从图中可以看出,当前输入图像必须先划分为块,再从该块中减去该块获得的图像块。运动补偿后的预测图像以获得差分图像x,然后对差分图像块进行DCT变换和量化。 量化后的输出数据有两个不同的位置:一个是将其发送到熵编码器进行编码,而编码后的代码流则输出到设备中的缓存Save并等待传输。 另一个应用是对信号x'进行反量化和反向变化,这将图像块输出与运动补偿相加以获得新的预测图像信号,并将新的预测图像块发送到帧存储器。
|
输入电子邮件以获取惊喜
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org ->荷兰语
sq.fmuser.org ->阿尔巴尼亚人
ar.fmuser.org ->阿拉伯语
hy.fmuser.org - >亚美尼亚
az.fmuser.org ->阿塞拜疆
eu.fmuser.org ->巴斯克
be.fmuser.org ->白俄罗斯语
bg.fmuser.org - >保加利亚
ca.fmuser.org ->加泰罗尼亚语
zh-CN.fmuser.org ->中文(简体)
zh-TW.fmuser.org - >中国(繁体)
hr.fmuser.org ->克罗地亚语
cs.fmuser.org ->捷克
da.fmuser.org ->丹麦语
nl.fmuser.org - >荷兰
et.fmuser.org ->爱沙尼亚语
tl.fmuser.org ->菲律宾
fi.fmuser.org ->芬兰语
fr.fmuser.org - >法国
gl.fmuser.org ->加利西亚语
ka.fmuser.org ->乔治亚
de.fmuser.org ->德语
el.fmuser.org - >希腊
ht.fmuser.org ->海地克里奥尔语
iw.fmuser.org ->希伯来语
hi.fmuser.org ->印地语
hu.fmuser.org - >匈牙利
is.fmuser.org ->冰岛语
id.fmuser.org ->印尼语
ga.fmuser.org ->爱尔兰
it.fmuser.org - >意大利
ja.fmuser.org ->日语
ko.fmuser.org ->韩文
lv.fmuser.org ->拉脱维亚
lt.fmuser.org - >立陶宛
mk.fmuser.org ->马其顿语
ms.fmuser.org ->马来语
mt.fmuser.org ->马耳他语
no.fmuser.org - >挪威
fa.fmuser.org ->波斯语
pl.fmuser.org ->波兰语
pt.fmuser.org ->葡萄牙语
ro.fmuser.org - >罗马尼亚
ru.fmuser.org ->俄语
sr.fmuser.org ->塞尔维亚语
sk.fmuser.org ->斯洛伐克
sl.fmuser.org - >斯洛文尼亚
es.fmuser.org ->西班牙语
sw.fmuser.org ->斯瓦希里语
sv.fmuser.org ->瑞典语
th.fmuser.org - >泰国
tr.fmuser.org ->土耳其语
uk.fmuser.org ->乌克兰语
ur.fmuser.org ->乌尔都语
vi.fmuser.org - >越南
cy.fmuser.org ->威尔士语
yi.fmuser.org - >意第绪语
FMUSER更轻松地传输视频和音频!
联系我们
分类目录
订阅电子邮件