随着信息技术的不断发展,人们将计算机技术引入视频采集、制作领域,传统的视频领域正面临着模拟化向数字化的变革,过去需要用大量的人力和昂贵的设备去处理视频图像,如今已经发展到在家用计算机上就能够处理。用计算机处理视频信息和用数字传输视频信号在很多领域有着广泛的应用前景。
1视频模型
中国和欧洲采用的电视制式是PAL制(逐行倒相制),美国和日本采用的NTSC制,一个PAL信号有25fb/s的帧率,一个NTSC制信号有30fb/s的帧率。
视频信号在质量上可区分为复合视频(Composite),S-Vide,YUV和数字(Digital)4个级别。复合视频,SHS,VHS-C和Video8都是把亮度、色差和同步信号复合到一个信号中,当把复合信号分离时,滤波器会降低图像的清晰度,亮度滤波时的带宽是有限的,否则就会无法分离亮度和色差,这样亮度的分离受到限制,对色差来讲也是如此。因此复合信号的质量比较一般,但他的硬件成本较低,目前普遍用于家用录像机。S-Vide,S-VHS,S-VHS-C和Hi8都是利用2个信号表现视频信号,即利用Y表现亮度同步,C信号是编码后的色差信号,现在很多家用电器(电视机,VCD,SHVCD,DVD)上的S端子,是在信号的传输中,采用了Y/C独立传输的技术,避免滤波带来的信号损失,因此图像质量较好。YUV视频信号是3个信号Y,U,V组成的,Y是亮度和同步信号,U,V是色差信号,由于无需滤波、编码和解码,因而图像质量极好,主要应用于专业视频领域。数字及同步信号利用4个信号:红、绿、蓝及同步信号加于电视机的显像管,因此图像质量很高。还有一种信号叫射频信号,他取自复合视频信号,经过调制到VHF或UHF(UltraHighFrequency),这种信号可长距离发送。现在电视台就采用这种方式,通过使用不同的发射频率同时发送多套电视节目。
模拟视频信号携带了由电磁信号变化而建立的图像信息,可用电压值的不同来表示,比如黑白信号,0V表示黑,0.7V表示白,其他灰度介于两者之间;数字视频信号是通过把视频帧的每个象素表现为不连续的颜色值来传送图像资料,并且由计算机使用二进制数据格式来传送和储存象素值,也就是对模拟信号进行A/D转换后得到的数字化视频信号。数字视频信号的优点很多:
(1)数字视频信号没有噪声,用0和1表示,不会产生混淆,而模拟信号要求屏蔽以减少噪声。
(2)数字视频信号可利用大规模集成电路或微处理器进行各类运算处理,而模拟信号只能简单地对亮度、对比度和颜色等进行调整。
(3)数字视频信号可以长距离传输而不产生损失,可以通过网络线、光纤等介质传输,很方便地实现资源共享,而模拟信号在传输过程中会产生信号损失。
2数字化视频采集
NTSC和PAL视频信号是模拟信号,但计算机是以数字方式显示信息的,因此NTSC和PAL信号在能被计算机使用之前,必须被数字化(或采样)。一个视被用来数字化视频模拟信号,并将之转换为计算机图形信号。视频信号的数字记录需要大量的磁盘空间,例如,一幅640×480中分辨率的彩色图像(24b/pixel),其数据量约为0.92Mb/s,如果存放在650MB的光盘中,在不考虑音频信号的情况下,每张光盘也只能播放24s,使用如此巨大的磁盘空间存储数字视频,是大多数计算机用户所无法接受的。在这种情况下,将视频带到计算机上,以有效的帧率播放存储信息,是使用计算机处理视频能力的最大障碍,鉴于此种情况,我们采用数据压缩系统和帧尺寸、色彩深度和图像精度折衷的办法,对视频数据进行压缩,以节省磁盘存储空间,数字化视频采集技术也就变成了现实。
数字化视频的过程,通常被叫做数字化视频采集。模拟信号到数字信号的转换中通常用8b来表示,对于专业或广播级的信号转换等级会更高。对于彩色信号,无论是RGB还是YUV方式,只需用24b来表示。因此采样频率的高低是决定数字化视频图像质量的重要指标,如表1所示。 [nextpage]
由于显示时采用了4∶3方式,所以PAL制方阵的图像大小是768×576,因为768∶576=4∶3,YUV信号在数字化过程中可以采用不同的采样频率,如4∶4∶4,4∶2∶2或4∶1∶0,由于色差信号用较低的采样频率不会影响到整体的图像效果,通常是降低U,V的采样频率以减少数据量。4∶1∶0方式指U,V的采样频率是Y的1/4,而且是隔行采样,也就是第1行采U,第2行采V,第3行采U等,这样可以大大减少数据量,这对JPEG和MPEG编码是很重要的。
视频采集中计算机的处理设备通常有3种类型,即帧采集卡、动态图像连续采集卡、电视节目接受卡。帧采集卡的工作原理是把偶合视频信号解码成RGB或YUV,RGB或YUV信号经过A/D转换后进入帧存体,帧存体内的数据根据同步信号不断被刷新。帧存体内的数据需要保存时,计算机给出控制信号,帧存体数据不再被刷新,这时计算机可以读出帧存体数据传送到计算机内存或存放到硬盘中。由于视频信号是隔行扫描,在数字化过程中每帧图像分成两场,每场的分辨率是228行,因此高速运动的图像采集后有抖动的感觉,要解决这一问题可以只采集一场或缩短快门时间。采集连续图像到计算机中是比较困难的,因为单一帧静止图像的数据量已经很大,而动态图像是25~30帧/s,模拟的视频图像数字化后所得到的量数据巨大,使传输、存储和处理很困难。解决这一问题的办法一般有3种:
(1)利用局部数据总线,提高数据传输速度;
(2)大大降低分辨率;
(3)采用压缩编码。
对视频图像进行压缩编码,是目前最流行的方法,过去需要昂贵的设备才能处理的视频图像,如今已经发展到家用计算机就能处理。在实际工作中,对数字视频信号的质量要求也不尽相同。在军事和医学领域,对图像信号的采集要求高分辨率且不允许压缩;在广播级的视频制作上,要求高质量但允许压缩,例如,MPEG1,MPEG2;在普通的家用录像带或VCD,DVD光盘制作上,由于存储空间的限制,分辨率要求高但允许压缩。
3几种压缩算法
目前,流行的压缩算法主要有以下几种:
(1)JPEG(JointPhotographicExpertsGroup)
他是用于静态图像压缩的标准,主要方法是把一幅图像分成8×8的方阵并进行离散余弦变换(DCT),把图像变换成频率,提高压缩比的方法就是去掉高频部分。原则上讲JPEG标准是静态压缩标准,并不适合连续图像采集。JPEG定义了2种基本压缩算法:一种是基于差分脉冲码调制(DPCM)的无失真压缩算法;另一种是基于离散余弦(DCT)的有失真压缩算法。JPEG的压缩算法流程图如图1所示。
从RGB到YUV的彩色空间的变换,对减少数据冗余很有益,但最重要的是DCT离散余弦变换,基于DCT的JPEG压缩算法可分成以下几步进行:
①通过DCT映射变换减少数据的冗余量。
②利用人的视觉加权函数,对DCT的变换系数进行量化。
③差分编码和行程编码,把原始图像数据分成一系列的8×8子块进行DCT变换,对于每个8×8子块的64个系数中的直流系数DC采用DPCM编码或差分编码,其余63个交流系数采用零行程长度编码,即“zig-zag”之字形扫描。
④熵编码,是JPEG压缩编码的最后一步,他是基于量化系数统计特性所进行的无失真编码,通常采用游程长度编码或Huffman(哈夫曼)编码。
(2)M-JPEG(MotionJPEG)
他是利用JPEG算法把一系列图像存于硬盘,目前用于视频制作的非线性编辑系统,广泛采用的算法就是M-JPEG,这种压缩方法对活动的视频图像通过实时帧内编码过程单独地压缩每一帧,在编辑过程中可以随机存取压缩视频的任意帧,而与其他帧不相关,这对精确到帧的后期编辑是非常理想的,该系统的M-JPEG采集编辑卡对图像的采集分辨率均可达到768×576,25帧/s(PAL制)或640×480,30帧/s(NTSC制)。M-JPEG的优点很多,由于算法不太复杂,只是在频域里对人眼不敏感的高频分量进行取舍,而在时域里能量仍能均匀分布,可以用很小的压缩比(如2∶1)全帧采集,从而实现广播级指标所要求的无损压缩。[nextpage]
(3)MPEG(MotionPictureExpertsGroup)
有MPEG1和MPEG2两种压缩编码方式,MPEG1采用动态图像编码的的方法,目前在计算机和电视视频制作领域获得广泛的应用,他的视频压缩算法的核心是处理帧间冗余,即在帧之间保持不变的图像信息来更好地压缩数据。而M-JPEG只压缩单独的帧,帧与帧之间并不压缩,这就决定了他所形成的数据流是高质量且庞大,必须由专门的硬件来实现,在实际应用上受到了很大限制。MPEG1依赖于2个基本技术:一是基于16×16块的运动补偿;二是帧内图像的JPEG压缩。所谓运动补偿就是为了寻找冗余,软件通常把这2个帧分成象素块,在两帧之间寻找相似的象素块,并且只存储在两帧之间变化的图像。如果帧与帧之间有快速丰富的图像变化,图像质量就会迅速降低,为了避免这种失真,动态压缩算法允许说明参考帧(也称内部帧、当前帧)。MPEG1的帧间编码采用3种方式:
①Intra,简称I帧,也就是当前帧,大约半秒取1帧,作为其他帧的参考。
②Predicted,简称P帧,也称预测帧,根据当前帧的变化预测下一帧,对其预测误差做有条件的传送,以达到提高压缩比的目的。
③Bi-directional,简称B帧,也称插补帧、双向预测帧,他根据前面和后面的帧双向预测产生增加B帧的数目会减少I帧和P帧之间的相关性。
这样对提高压缩比有益而对图像质量有损,所以I帧、B帧、P帧之间的时间间隔应根据被压缩视频画面的复杂程度和重建图像的质量来综合考虑决定。
MPEG1压缩算法能将视频信号压缩到0.5~1b/pixel,压缩数据率为1.2M/s,还原图像的质量与VHS相当,目前市场上流行的VCD光盘,也就是MPEG1的一个代表产品,但由于其图像质量较差,在不久的将来会被DVD产品所淘汰。
MPEG2是一种图像能恢复到广播质量的编码方法,也采用帧间压缩的算法,但在视频信号质量上优于MPEG1,目前发展非常迅速,典型产品是高清晰视频光盘DVD、高清晰数字电视HDTV等。
(4)WTP小波变换压缩法
小波变换起源于1989年,是在研究函数分析中为克服三角函数的时域分析能力不足而提出的。他采用局部函数在频域和时域同时分析法,将图像信号分析成不同的频率区域,然后根据图像统计特性和人眼生理特性,在不同的频域采取不同的压缩算法,使视频数据量减小。小波变换不受带宽限制,只要选取的小波函数和相关滤波器合适,就能使视频能量集中在低频分量上。即使在编码过程中取较大的压缩比,还原图像的质量仍然较好。加拿大和美国的知名视频厂商生产的非线性编辑系统就采用小波变换算法,他的优点是图像采集质量高,缺点是格式专用,与M-JPEG相比,交换性、通用性差。
(5)DV格式算法
DV格式是数字视频磁带经常采用的一种压缩格式,他的压缩算法主要基于DCT离散余弦变换进行的帧内压缩,因此是一种可编辑的格式,如今已经演变出DVCAM和DVCPRO两种互不兼容的专业级数字视频格式,主要应用于6.35mm数字磁带摄录系统,他还支持IEEE1394接口和传输标准,可与当今流行的非线性编辑系统建立纯数字连接,因而具有良好的发展空间和应用前景。
4结语
视频信号被采集到计算机后,就可进入编辑制作阶段,由于硬盘录像机、数字摄像机、非线性编辑系统等数字产品的快速发展,将视频制作带入全面数字化时代,视频的网络化传输和直接播出技术已成为现实。