引言
數(shù)字技術(shù)的蓬勃發(fā)展和廣泛應(yīng)用使人類(lèi)社會(huì)邁入了“數(shù)字時(shí)代”,。今天,,數(shù)字技術(shù)產(chǎn)品已走進(jìn)普通百姓的日常生活之中。 數(shù)字技術(shù)就是用數(shù)字編碼來(lái)描述和表達(dá)圖像,、聲音等各種媒體信息,。其信息處理的流程是:模擬信息→數(shù)字化→壓縮編碼→存儲(chǔ)或傳輸→解碼再現(xiàn)。其中,,壓縮編碼是一個(gè)關(guān)鍵環(huán)節(jié),。數(shù)字化的圖像和聲音信號(hào)數(shù)據(jù)是非常龐大的,例如一幅640×480像素中等分辨率的彩色圖像(24 bit/像素)的數(shù)據(jù)量約為7.37 Mbit/幀,,如果是運(yùn)動(dòng)圖像.以每秒30幀或者25幀的速度播放時(shí),,則視頻信號(hào)傳輸速率為220 Mbit/s;如果把這種信號(hào)存放在650MB的光盤(pán)中,,一張光盤(pán)只能播放20多秒鐘,。所以,必須對(duì)數(shù)字化信息進(jìn)行壓縮.用盡可能少的數(shù)據(jù)來(lái)表達(dá)信息,,節(jié)省傳輸和存儲(chǔ)的開(kāi)銷(xiāo),。
1 視頻模型
數(shù)字視頻就是先用攝像機(jī)之類(lèi)的視頻捕捉設(shè)備,將外界影像的顏色和亮度信息轉(zhuǎn)變?yōu)殡娦盘?hào),,再記錄到儲(chǔ)存介質(zhì)(如錄像帶),。播放時(shí),視頻信號(hào)被轉(zhuǎn)變?yōu)閹畔?。并以每秒約30幀的速度投影到顯示器上.使人類(lèi)的眼睛認(rèn)為它是連續(xù)不問(wèn)斷地運(yùn)動(dòng)著的,。電影播放的幀率大約是每秒24幀。如果用示波器(一種測(cè)試工具)來(lái)觀看,,未投影的模擬電信號(hào)看起來(lái)就像腦電波的掃描圖像,,由一些連續(xù)鋸齒狀的山峰和山谷組成。
中國(guó)和歐洲采用的是PAL制(逐行倒相制),美國(guó)和日本采用的NTSC制,,PAL信號(hào)有25 fb/s的幀率,,NTSC制信號(hào)有30 fb/s的幀率。視頻信號(hào)在質(zhì)量上可區(qū)分為復(fù)合視頻(Composite),,S-Vide,,YUV和數(shù)字(Digital)4個(gè)級(jí)別。復(fù)合視頻,,VHS,,VHS-C和VideO8都是把亮度、色差和同步信號(hào)復(fù)合到一個(gè)信號(hào)中,,當(dāng)把復(fù)合信號(hào)分離時(shí).濾波器會(huì)降低圖像的清晰度,,亮度濾波時(shí)的帶寬是有限的,否則就會(huì)無(wú)法分離亮度和色差,,這樣亮度的分離受到限制,,對(duì)色差來(lái)講也是如此。因此復(fù)合信號(hào)的質(zhì)量比較一般,,但他的硬件成本較低,,目前普遍用于家用錄像機(jī)。S-Vide,,S-VHS,,S-VHS-C和Hi8都是利用2個(gè)信號(hào)表現(xiàn)視頻信號(hào),即利用Y表現(xiàn)亮度同步,,C信號(hào)是編碼后的色差信號(hào),,現(xiàn)在很多家用電器(電視機(jī),VCD,,SHVCD,,DVD)上的S端子,是在信號(hào)的傳輸中,,采用了Y/C獨(dú)立傳輸?shù)募夹g(shù),,避免濾波帶來(lái)的信號(hào)損失。因此圖像質(zhì)量較好,。YUV視頻信號(hào)是3個(gè)信號(hào)Y,,U,V組成的,,Y是亮度和同步信號(hào).U,,V是色差信號(hào),由于無(wú)需濾波,、編碼和解碼,,因而圖像質(zhì)量極好,,主要應(yīng)用于專(zhuān)業(yè)視頻領(lǐng)域。數(shù)字及同步信號(hào)利用4個(gè)信號(hào):紅,、綠,、藍(lán)及同步信號(hào)加于電視機(jī)的顯像管,因此圖像質(zhì)量很高,。還有一種信號(hào)叫射頻信號(hào),,他取自復(fù)合視頻信號(hào).經(jīng)過(guò)調(diào)制到VHF或UHF,這種信號(hào)可長(zhǎng)距離發(fā)送?,F(xiàn)在電視臺(tái)就采用這種方式,通過(guò)使用不同的發(fā)射頻率同時(shí)發(fā)送多套電視節(jié)目,。
2 數(shù)字化視頻采集
NTSC和PAL視頻信號(hào)是模擬信號(hào),,但計(jì)算機(jī)是以數(shù)字方式顯示信息的,因此NTSC和PAL信號(hào)在能被汁算機(jī)使用之前,,必須被數(shù)字化(或采樣),。
模擬視頻信號(hào)攜帶了由電磁信號(hào)變化而建立的圖像信息.可用電壓值的不同來(lái)表示,比如黑自信號(hào),,O V表示黑.O.7 V表示白,,其他灰度介于兩者之間。
數(shù)字視頻信號(hào)是通過(guò)把視頻幀的每個(gè)象素表現(xiàn)為不連續(xù)的顏色值來(lái)傳送圖像資料,,并且由計(jì)算機(jī)使用二進(jìn)制數(shù)據(jù)格式來(lái)傳送和儲(chǔ)存象素值.也就是對(duì)模擬信號(hào)進(jìn)行A/D轉(zhuǎn)換后得到的數(shù)字化視頻信號(hào),。
數(shù)字視頻信號(hào)的優(yōu)點(diǎn)很多:
(1)數(shù)字視頻信號(hào)沒(méi)有噪聲,用0和1表示,,不會(huì)產(chǎn)生混淆,,而模擬信號(hào)要求屏蔽以減少噪聲。
(2)數(shù)字視頻信號(hào)可利用大規(guī)模集成電路或微處理器進(jìn)行各類(lèi)運(yùn)算處理,,而模擬信號(hào)只能簡(jiǎn)單地對(duì)亮度,、對(duì)比度和顏色等進(jìn)行調(diào)整。
(3)數(shù)字視頻信號(hào)可以長(zhǎng)距離傳輸而不產(chǎn)生損失,,可以通過(guò)網(wǎng)絡(luò)線,、光纖等介質(zhì)傳輸,很方便地實(shí)現(xiàn)資源共享,,而模擬信號(hào)在傳輸過(guò)程中會(huì)產(chǎn)生信號(hào)損失,。
一個(gè)視頻圖形適配器(通常叫做抓幀器或視頻采集卡)經(jīng)常被用來(lái)數(shù)字化視頻模擬信號(hào),并將之轉(zhuǎn)換為計(jì)算機(jī)圖形信號(hào),。視頻信號(hào)的數(shù)字記錄需要大量的磁盤(pán)空間,,例如,一幅640×480中分辨率的彩色圖像(24 b/pixel),,其數(shù)據(jù)量約為O.92 Mb/s,,如果存放在650 MB的光盤(pán)中,,在不考慮音頻信號(hào)的情況下,每張光盤(pán)也只能播放24 s,,使用如此巨大的磁盤(pán)空間存儲(chǔ)數(shù)字視頻,,是大多數(shù)計(jì)算機(jī)用戶(hù)所無(wú)法接受的。在這種情況下,,將視頻帶到計(jì)算機(jī)上,,以有效的幀率播放存儲(chǔ)信息,是使用計(jì)算機(jī)處理視頻能力的最大障礙,,鑒于此種情況,,我們采用數(shù)據(jù)壓縮系統(tǒng)和幀尺寸、色彩深度和圖像精度折衷的辦法,,對(duì)視頻數(shù)據(jù)進(jìn)行壓縮,,以節(jié)省磁盤(pán)存儲(chǔ)空間.?dāng)?shù)字化視頻采集技術(shù)也就變成了現(xiàn)實(shí)。
數(shù)字化視頻的過(guò)程.通常被叫做數(shù)字化視頻采集,。模擬信號(hào)到數(shù)字信號(hào)的轉(zhuǎn)換中通常用8 bit來(lái)表示.對(duì)于專(zhuān)業(yè)或廣播級(jí)的信號(hào)轉(zhuǎn)換等級(jí)會(huì)更高,。對(duì)于彩色信號(hào),無(wú)論是RGB還是YUV方式,,只需用24 bit來(lái)表示,。因此采樣頻率的高低是決定數(shù)字化視頻圖像質(zhì)量的重要指標(biāo)。
視頻采集中計(jì)算機(jī)的處理設(shè)備通常有3種類(lèi)型,,即幀采集卡,、動(dòng)態(tài)圖像連續(xù)采集卡、電視節(jié)目接受卡,。幀采集卡的工作原理是把偶合視頻信號(hào)解碼成RGB或YUV,,RGB或YUV信號(hào)經(jīng)過(guò)A/D轉(zhuǎn)換后進(jìn)入幀存體,幀存體內(nèi)的數(shù)據(jù)根據(jù)同步信號(hào)不斷被刷新,。幀存體內(nèi)的數(shù)據(jù)需要保存時(shí),,計(jì)算機(jī)給出控制信號(hào),幀存體數(shù)據(jù)不再被刷新.這時(shí)計(jì)算機(jī)可以讀出幀存體數(shù)據(jù)傳送到計(jì)算機(jī)內(nèi)存或存放到硬盤(pán)中,。由于視頻信號(hào)是隔行掃描.在數(shù)字化過(guò)程中每幀圖像分成兩場(chǎng),,每場(chǎng)的分辨率是228行,因此高速運(yùn)動(dòng)的圖像采集后有抖動(dòng)的感覺(jué),,要解決這一問(wèn)題可以只采集一場(chǎng)或縮短快門(mén)時(shí)間,。采集連續(xù)圖像到計(jì)算機(jī)中是比較困難的,因?yàn)閱我粠o止圖像的數(shù)據(jù)量已經(jīng)很大,,而動(dòng)態(tài)圖像是25幀/s~30幀/s,,模擬的視頻圖像數(shù)字化后所得到的數(shù)據(jù)量巨大,使傳輸,、存儲(chǔ)和處理很困難,。解決這一問(wèn)題的辦法一般有3種:
(1)利用局部數(shù)據(jù)總線,,提高數(shù)據(jù)傳輸速度;
(2)大大降低分辨率,;
(3)采用壓縮編碼,。
3 視頻壓縮
對(duì)視頻圖像進(jìn)行壓縮編碼,是目前最流行的方法,。1980年以來(lái),,國(guó)際標(biāo)準(zhǔn)化組織(ISO)、國(guó)際電工委員會(huì)(IEC)和國(guó)際電信聯(lián)盟(ITU)等陸續(xù)完成了各種數(shù)據(jù)壓縮標(biāo)準(zhǔn)和建議.如面向靜止圖像壓縮的JPEG標(biāo)準(zhǔn),,在運(yùn)動(dòng)圖像方面用于視頻會(huì)漢的H.261標(biāo)準(zhǔn),、用于可視電話(huà)的H.263標(biāo)準(zhǔn)、用于VCD的MlPEG1標(biāo)準(zhǔn),、用于廣播電視和DVD的MPEG2標(biāo)準(zhǔn)以及最新的采用基于對(duì)象的編碼理念的MPEG4標(biāo)準(zhǔn)等,。MPEG是運(yùn)動(dòng)圖像專(zhuān)家組的英文首字母縮寫(xiě)。該專(zhuān)家組成立于1988年,,致力于運(yùn)動(dòng)圖像及其伴音的壓縮編碼標(biāo)準(zhǔn)化工作,。
MPEG1于1993年成為國(guó)際標(biāo)準(zhǔn),,它是對(duì)1.5 Mbit/s以下數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音的壓縮編碼標(biāo)準(zhǔn),,適用于CD—ROM、VCD,、CD-I(交互式CD)等,。
它可對(duì)SIF(標(biāo)準(zhǔn)交換格式)分辨率(NTSC制式為352×240;PAl,,制式為352×288)的圖像進(jìn)行壓縮,,傳輸速率為L(zhǎng) 5 Mbit/s,每秒播放30幀.具有CD音質(zhì),,圖像質(zhì)量基本與VHS家用錄像機(jī)相當(dāng),。MPEGl也被用于數(shù)字通信網(wǎng)絡(luò)上的視頻傳輸,如基于ADSI,。(非對(duì)稱(chēng)數(shù)字用戶(hù)線路)的視頻點(diǎn)播(VOD),、遠(yuǎn)程教育等。
MPEG2于1995年成為國(guó)際標(biāo)準(zhǔn),,其目標(biāo)是達(dá)到高級(jí)工業(yè)標(biāo)準(zhǔn)的圖像質(zhì)量以及更高的傳輸率,。MPEG2所能提供的傳輸率在3Mbit/s~10 Mbit/s之間,在NTSC制式下的分辨率可達(dá)720×486.可提供廣播級(jí)的圖像質(zhì)量和CD級(jí)的音質(zhì),,適用于數(shù)字電視廣播(DVB),、HDTV和DVD的運(yùn)動(dòng)圖像及其伴音的壓縮編碼。目前,,MPEG2已得到廣泛應(yīng)用.如美國(guó),、歐洲在DVD和數(shù)字電視廣播方面都采用MPEG2壓縮技術(shù),。
MPEG3最初是為HDTV開(kāi)發(fā)的編碼和壓縮標(biāo)準(zhǔn),但由于MPEG2的出色性能表現(xiàn),,已能適用于HDTV,,使得MPEG3還沒(méi)出世就被拋棄了。
MPEG4于1999年初正式成為國(guó)際標(biāo)準(zhǔn),。MPEG4是一個(gè)適用于低傳輸速率應(yīng)用的方案,。與MPEGl和MFPEG2相比,MPEG4更加注重多媒體系統(tǒng)的交互性和靈活性,。在視頻編碼方面,,MPEG4支持對(duì)自然和合成的視覺(jué)對(duì)象的編碼。合成的視覺(jué)對(duì)象包括2D,、3D動(dòng)畫(huà)和人面部表情動(dòng)畫(huà)等,。在音頻編碼,MPEG4是在一組編碼工具支持下,,對(duì)語(yǔ)音,、音樂(lè)等自然聲音對(duì)象和具有回響、空間方位感的合成聲音對(duì)象進(jìn)行音頻編碼的,。MPEG4音頻編碼不僅支持自然聲音,,而且支持合成聲音。
MPEG4的重要特點(diǎn)包括:(1)基于內(nèi)容的普遍性,。MPEG4能夠直接選取音頻,、視頻內(nèi)容進(jìn)行編碼,并對(duì)其靈活地進(jìn)行控制和顯示,,用戶(hù)可以自行選擇場(chǎng)景中的物體的解碼質(zhì)量,,進(jìn)行家庭影視節(jié)目制作和編輯。(2)以AV為對(duì)象.增強(qiáng)了交互性和擴(kuò)展性,,從而提高了交互應(yīng)用的靈活性,。(3)將各種功能應(yīng)用在自然的和合成的AV對(duì)象上.增強(qiáng)了節(jié)目編輯制作能力。(4)MPEG4在誤碼環(huán)境中.尤其是在惡劣誤碼條件下的低比特率應(yīng)用中的抗誤碼性,,有利于節(jié)目制作,、分配和顯示。
4 結(jié)束語(yǔ)
視頻信號(hào)被采集到計(jì)算機(jī)后,,就可進(jìn)入編輯制作階段,,由于硬盤(pán)錄像機(jī)、數(shù)字?jǐn)z像機(jī),、非線性編輯系統(tǒng)等數(shù)字產(chǎn)品的快速發(fā)展,,將視頻制作帶人全面數(shù)字化時(shí)代,視頻的網(wǎng)絡(luò)化傳輸和直接播出技術(shù)已成為現(xiàn)實(shí),。