前言:本站為你精心整理了數(shù)字圖像壓縮技術(shù)及發(fā)展范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
摘要:數(shù)字圖像壓縮技術(shù)對于數(shù)字圖像信息在網(wǎng)絡(luò)上實現(xiàn)快速傳輸和實時處理具有重要的意義。本文介紹了當(dāng)前幾種最為重要的圖像壓縮算法:JPEG、JPEG2000、分形圖像壓縮和小波變換圖像壓縮,總結(jié)了它們的優(yōu)缺點及發(fā)展前景。然后簡介了任意形狀可視對象編碼算法的研究現(xiàn)狀,并指出此算法是一種產(chǎn)生高壓縮比的圖像壓縮算法。
關(guān)鍵詞:數(shù)字圖像;圖像壓縮;壓縮技術(shù);任意形狀可視對象編碼
Abstract:Digitalimagecompressiontechnologyisofspecialintrestforthefasttransmissionandreal-timeprocesssingofdigitalimageinformationontheinternet.Thepaperintroducesseveralkindsofthemostimportantimagecompressionalgorithmsatpresent:JPEG,JPEG2000,fractalimagecompressionandwavelettransformationimagecompression,andsummarizestheiradvantageanddisadvantageanddevelopmentprospect.Thenitintroducessimplythepresentdevelopmentofcodingalgorithmsaboutarbitraryshapevideoobject,andindicatesthealgorithmshaveahighcompressionrate.
Keyword:Digitalimage;Imagecompression;Compresstechnique;Arbitraryshapevisibleobjectcode
一、引言
隨著多媒體技術(shù)和通訊技術(shù)的不斷發(fā)展,多媒體娛樂、信息高速公路等不斷對信息數(shù)據(jù)的存儲和傳輸提出了更高的要求,也給現(xiàn)有的有限帶寬以嚴峻的考驗,特別是具有龐大數(shù)據(jù)量的數(shù)字圖像通信,更難以傳輸和存儲,極大地制約了圖像通信的發(fā)展,因此圖像壓縮技術(shù)受到了越來越多的關(guān)注。圖像壓縮的目的就是把原來較大的圖像用盡量少的字節(jié)表示和傳輸,并且要求復(fù)原圖像有較好的質(zhì)量。利用圖像壓縮,可以減輕圖像存儲和傳輸?shù)呢摀?dān),使圖像在網(wǎng)絡(luò)上實現(xiàn)快速傳輸和實時處理。
圖像壓縮編碼技術(shù)可以追溯到1948年提出的電視信號數(shù)字化,到今天已經(jīng)有50多年的歷史了[1]。在此期間出現(xiàn)了很多種圖像壓縮編碼方法,特別是到了80年代后期以后,由于小波變換理論,分形理論,人工神經(jīng)網(wǎng)絡(luò)理論,視覺仿真理論的建立,圖像壓縮技術(shù)得到了前所未有的發(fā)展,其中分形圖像壓縮和小波圖像壓縮是當(dāng)前研究的熱點。本文對當(dāng)前最為廣泛使用的圖像壓縮算法進行綜述,討論了它們的優(yōu)缺點以及發(fā)展前景。
二、JPEG壓縮
負責(zé)開發(fā)靜止圖像壓縮標準的“聯(lián)合圖片專家組”(JointPhotographicExpertGroup,簡稱JPEG),于1989年1月形成了基于自適應(yīng)DCT的JPEG技術(shù)規(guī)范的第一個草案,其后多次修改,至1991年形成ISO10918國際標準草案,并在一年后成為國際標準,簡稱JPEG標準。
1.JPEG壓縮原理及特點
JPEG算法中首先對圖像進行分塊處理,一般分成互不重疊的大小的塊,再對每一塊進行二維離散余弦變換(DCT)。變換后的系數(shù)基本不相關(guān),且系數(shù)矩陣的能量集中在低頻區(qū),根據(jù)量化表進行量化,量化的結(jié)果保留了低頻部分的系數(shù),去掉了高頻部分的系數(shù)。量化后的系數(shù)按zigzag掃描重新組織,然后進行哈夫曼編碼。JPEG的特點如下:
優(yōu)點:(1)形成了國際標準;(2)具有中端和高端比特率上的良好圖像質(zhì)量。
缺點:(1)由于對圖像進行分塊,在高壓縮比時產(chǎn)生嚴重的方塊效應(yīng);(2)系數(shù)進行量化,是有損壓縮;(3)壓縮比不高,小于50[2]。
JPEG壓縮圖像出現(xiàn)方塊效應(yīng)的原因是:一般情況下圖像信號是高度非平穩(wěn)的,很難用Gauss過程來刻畫,并且圖像中的一些突變結(jié)構(gòu)例如邊緣信息遠比圖像平穩(wěn)性重要,用余弦基作圖像信號的非線性逼近其結(jié)果不是最優(yōu)的[3]。
2.JPEG壓縮的研究狀況及其前景[2]
針對JPEG在高壓縮比情況下,產(chǎn)生方塊效應(yīng),解壓圖像較差,近年來提出了不少改進方法,最有效的是下面的兩種方法:
(1)DCT零樹編碼
DCT零樹編碼把DCT塊中的系數(shù)組成log2N個子帶,然后用零樹編碼方案進行編碼。在相同壓縮比的情況下,其PSNR的值比EZW高。但在高壓縮比的情況下,方塊效應(yīng)仍是DCT零樹編碼的致命弱點。
(2)層式DCT零樹編碼
此算法對圖像作的DCT變換,將低頻塊集中起來,做反DCT變換;對新得到的圖像做相同變換,如此下去,直到滿足要求為止。然后對層式DCT變換及零樹排列過的系數(shù)進行零樹編碼。
JPEG壓縮的一個最大問題就是在高壓縮比時產(chǎn)生嚴重的方塊效應(yīng),因此在今后的研究中,應(yīng)重點解決DCT變換產(chǎn)生的方塊效應(yīng),同時考慮與人眼視覺特性相結(jié)合進行壓縮。
三、JEPG2000壓縮
JPEG2000是由ISO/IECJTCISC29標準化小組負責(zé)制定的全新靜止圖像壓縮標準。一個最大改進是它采用小波變換代替了余弦變換。2000年3月的東京會議,確定了彩色靜態(tài)圖像的新一代編碼方式—JPEG2000圖像壓縮標準的編碼算法。
1.JPEG2000壓縮原理及特點
JPEG2000編解碼系統(tǒng)的編碼器和解碼器的框圖如圖1所示[4]。
編碼過程主要分為以下幾個過程:預(yù)處理、核心處理和位流組織。預(yù)處理部分包括對圖像分片、直流電平(DC)位移和分量變換。核心處理部分由離散小波變換、量化和熵編碼組成。位流組織部分則包括區(qū)域劃分、碼塊、層和包的組織。
JPEG2000格式的圖像壓縮比,可在現(xiàn)在的JPEG基礎(chǔ)上再提高10%~30%,而且壓縮后的圖像顯得更加細膩平滑。對于目前的JPEG標準,在同一個壓縮碼流中不能同時提供有損和無損壓縮,而在JPEG2000系統(tǒng)中,通過選擇參數(shù),能夠?qū)D像進行有損和無損壓縮?,F(xiàn)在網(wǎng)絡(luò)上的JPEG圖像下載時是按“塊”傳輸?shù)?,而JPEG2000格式的圖像支持漸進傳輸,這使用戶不必接收整個圖像的壓縮碼流。由于JPEG2000采用小波技術(shù),可隨機獲取某些感興趣的圖像區(qū)域(ROI)的壓縮碼流,對壓縮的圖像數(shù)據(jù)進行傳輸、濾波等操作[4]。
圖1JPEG2000壓縮編碼與解壓縮的總體流程
2.JPEG2000壓縮的前景
JPEG2000標準適用于各種圖像的壓縮編碼。其應(yīng)用領(lǐng)域?qū)↖nternet、傳真、打印、遙感、移動通信、醫(yī)療、數(shù)字圖書館和電子商務(wù)等[5]。JPEG2000圖像壓縮標準將成為21世紀的主流靜態(tài)圖像壓縮標準。
四、小波變換圖像壓縮
1.小波變換圖像壓縮原理
小波變換用于圖像編碼的基本思想就是把圖像根據(jù)Mallat塔式快速小波變換算法進行多分辨率分解。其具體過程為:首先對圖像進行多級小波分解,然后對每層的小波系數(shù)進行量化,再對量化后的系數(shù)進行編碼。小波圖像壓縮是當(dāng)前圖像壓縮的熱點之一,已經(jīng)形成了基于小波變換的國際壓縮標準,如MPEG-4標準,及如上所述的JPEG2000標準[2]。
2.小波變換圖像壓縮的發(fā)展現(xiàn)狀及前景
目前3個最高等級的小波圖像編碼分別是嵌入式小波零樹圖像編碼(EZW),分層樹中分配樣本圖像編碼(SPIHT)和可擴展圖像壓縮編碼(EBCOT)。
(1)EZW編碼器[6]
1993年,Shapiro引入了小波“零樹”的概念,通過定義POS、NEG、IZ和ZTR四種符號進行空間小波樹遞歸編碼,有效地剔除了對高頻系數(shù)的編碼,極大地提高了小波系數(shù)的編碼效率。此算法采用漸進式量化和嵌入式編碼模式,算法復(fù)雜度低。EZW算法打破了信息處理領(lǐng)域長期篤信的準則:高效的壓縮編碼器必須通過高復(fù)雜度的算法才能獲得,因此EZW編碼器在數(shù)據(jù)壓縮史上具有里程碑意義。
(2)EBCOT編碼器[8]
優(yōu)化截斷點的嵌入塊編碼方法(EBCOT)首先將小波分解的每個子帶分成一個個相對獨立的碼塊,然后使用優(yōu)化的分層截斷算法對這些碼塊進行編碼,產(chǎn)生壓縮碼流,結(jié)果圖像的壓縮碼流不僅具有SNR可擴展而且具有分辨率可擴展,還可以支持圖像的隨機存儲。比較而言,EBCOT算法的復(fù)雜度較EZW和SPIHT有所提高,其壓縮性能比SPIHT略有提高。
小波圖像壓縮被認為是當(dāng)前最有發(fā)展前途的圖像壓縮算法之一。小波圖像壓縮的研究集中在對小波系數(shù)的編碼問題上。在以后的工作中,應(yīng)充分考慮人眼視覺特性,進一步提高壓縮比,改善圖像質(zhì)量。并且考慮將小波變換與其他壓縮方法相結(jié)合。例如與分形圖像壓縮相結(jié)合是當(dāng)前的一個研究熱點[2]。
(3)SPIHT編碼器[7]
由Said和Pearlman提出的分層小波樹集合分割算法(SPIHT)則利用空間樹分層分割方法,有效地減小了比特面上編碼符號集的規(guī)模。同EZW相比,SPIHT算法構(gòu)造了兩種不同類型的空間零樹,更好地利用了小波系數(shù)的幅值衰減規(guī)律。同EZW編碼器一樣,SPIHT編碼器的算法復(fù)雜度低,產(chǎn)生的也是嵌入式比特流,但編碼器的性能較EZW有很大的提高。
五、分形圖像壓縮
1988年,Barnsley通過實驗證明分形圖像壓縮可以得到比經(jīng)典圖像編碼技術(shù)高幾個數(shù)量級的壓縮比。1990年,Barnsley的學(xué)生A.E.Jacquin提出局部迭代函數(shù)系統(tǒng)理論后,使分形用于圖像壓縮在計算機上自動實現(xiàn)成為可能。
1.分形圖像壓縮的原理
分形壓縮主要利用自相似的特點,通過迭代函數(shù)系統(tǒng)(IteratedFunctionSystem,IFS)實現(xiàn)。其理論基礎(chǔ)是迭代函數(shù)系統(tǒng)定理和拼貼定理。
分形圖像壓縮把原始圖像分割成若干個子圖像,然后每一個子圖像對應(yīng)一個迭代函數(shù),子圖像以迭代函數(shù)存儲,迭代函數(shù)越簡單,壓縮比也就越大。同樣解碼時只要調(diào)出每一個子圖像對應(yīng)的迭代函數(shù)反復(fù)迭代,就可以恢復(fù)出原來的子圖像,從而得到原始圖像[9]。
2.幾種主要分形圖像編碼技術(shù)[9]
隨著分形圖像壓縮技術(shù)的發(fā)展,越來越多的算法被提出,基于分形的不同特征,可以分成以下幾種主要的分形圖像編碼方法。
(1)尺碼編碼方法
尺碼編碼方法是基于分形幾何中利用小尺度度量不規(guī)則曲線長度的方法,類似于傳統(tǒng)的亞取樣和內(nèi)插方法,其主要不同之處在于尺度編碼方法中引入了分形的思想,尺度隨著圖像各個組成部分復(fù)雜性的不同而改變。
(2)迭代函數(shù)系統(tǒng)方法
迭代函數(shù)系統(tǒng)方法是目前研究最多、應(yīng)用最廣泛的一種分形壓縮技術(shù),它是一種人機交互的拼貼技術(shù),它基于自然界圖像中普遍存在的整體和局部自相關(guān)的特點,尋找這種自相關(guān)映射關(guān)系的表達式,即仿射變換,并通過存儲比原圖像數(shù)據(jù)量小的仿射系數(shù),來達到壓縮的目的。如果尋得的仿射變換簡單而有效,那么迭代函數(shù)系統(tǒng)就可以達到極高的壓縮比。
(3)A-E-Jacquin的分形方案
A-E-Jacquin的分形方案是一種全自動的基于塊的分形圖像壓縮方案,它也是一個尋找映射關(guān)系的過程,但尋找的對象域是將圖像分割成塊之后的局部與局部的關(guān)系。在此方案中還有一部分冗余度可以去除,而且其解碼圖像中存在著明顯的方塊效應(yīng)。
3.分形圖像壓縮的前景[2]
雖然分形圖像壓縮在圖像壓縮領(lǐng)域還不占主導(dǎo)地位,但是分形圖像壓縮既考慮局部與局部,又考慮局部與整體的相關(guān)性,適合于自相似或自仿射的圖像壓縮,而自然界中存在大量的自相似或自仿射的幾何形狀,因此它的適用范圍很廣。
六、其它壓縮算法
除了以上幾種常用的圖像壓縮方法以外,還有:NNT(數(shù)論變換)壓縮、基于神經(jīng)網(wǎng)絡(luò)的壓縮方法、Hibert掃描圖像壓縮方法、自適應(yīng)多相子帶壓縮方法等,在此不作贅述。下面簡單介紹近年來任意形狀紋理編碼的幾種算法[10]~[13]。
(1)形狀自適應(yīng)DCT(SA-DCT)算法
SA-DCT把一個任意形狀可視對象分成的圖像塊,對每塊進行DCT變換,它實現(xiàn)了一個類似于形狀自適應(yīng)GilgeDCT[10][11]變換的有效變換,但它比GilgeDCT變換的復(fù)雜度要低??墒牵琒A-DCT也有缺點,它把像素推到與矩形邊框的一個側(cè)邊相平齊,因此一些空域相關(guān)性可能丟失,這樣再進行列DCT變換,就有較大的失真了[11][14][15]。
(2)形狀自適應(yīng)離散小波變換(SA-DWT)
Li等人提出了一種新穎的任意形狀對象編碼,SA-DWT編碼[18]~[22]。這項技術(shù)包括SA-DWT和零樹熵編碼的擴展(ZTE),以及嵌入式小波編碼(EZW)。SA-DWT的特點是:經(jīng)過SA-DWT之后的系數(shù)個數(shù),同原任意形狀可視對象的像素個數(shù)相同;小波變換的空域相關(guān)性、區(qū)域?qū)傩砸约白訋еg的自相似性,在SA-DWT中都能很好表現(xiàn)出來;對于矩形區(qū)域,SA-DWT與傳統(tǒng)的小波變換一樣。SA-DWT編碼技術(shù)的實現(xiàn)已經(jīng)被新的多媒體編碼標準MPEG-4的對于任意形狀靜態(tài)紋理的編碼所采用。
在今后的工作中,可以充分地利用人類視覺系統(tǒng)對圖像邊緣部分較敏感的特性,嘗試將圖像中感興趣的對象分割出來,對其邊緣部分、內(nèi)部紋理部分和對象之外的背景部分按不同的壓縮比進行壓縮,這樣可以使壓縮圖像達到更大的壓縮比,更加便于傳輸。
(3)Egger方法
Egger等人[16][17]提出了一個應(yīng)用于任意形狀對象的小波變換方案。在此方案中,首先將可視對象的行像素推到與邊界框的右邊界相平齊的位置,然后對每行的有用像素進行小波變換,接下來再進行另一方向的小波變換。此方案,充分利用了小波變換的局域特性。然而這一方案也有它的問題,例如可能引起重要的高頻部分同邊界部分合并,不能保證分布系數(shù)彼此之間有正確的相同相位,以及可能引起第二個方向小波分解的不連續(xù)等。
七、總結(jié)
圖像壓縮技術(shù)研究了幾十年,取得了很大的成績,但還有許多不足,值得我們進一步研究。小波圖像壓縮和分形圖像壓縮是當(dāng)前研究的熱點,但二者也有各自的缺點,在今后工作中,應(yīng)與人眼視覺特性相結(jié)合??傊瑘D像壓縮是一個非常有發(fā)展前途的研究領(lǐng)域,這一領(lǐng)域的突破對于我們的信息生活和通信事業(yè)的發(fā)展具有深遠的影響。
參考文獻:
[1]田青.圖像壓縮技術(shù)[J].警察技術(shù),2002,(1):30-31.
[2]張海燕,王東木等.圖像壓縮技術(shù)[J].系統(tǒng)仿真學(xué)報,2002,14(7):831-835.
[3]張宗平,劉貴忠.基于小波的視頻圖像壓縮研究進展[J].電子學(xué)報,2002,30(6):883-889.
[4]周寧,湯曉軍,徐維樸.JPEG2000圖像壓縮標準及其關(guān)鍵算法[J].現(xiàn)代電子技術(shù),2002,(12):1-5.
[5]吳永輝,俞建新.JPEG2000圖像壓縮算法概述及網(wǎng)絡(luò)應(yīng)用前景[J].計算機工程,2003,29(3):7-10.
[6]JMShaprio.Embeddedimagecodingusingzerotreeofwaveletcoefficients[J].IEEETrans.onSignalProcessing,1993,41(12):3445-3462.
[7]ASaid,WAPearlman.Anewfastandefficientimagecodecbasedonsetpartitioninginhierarchicaltrees[J].IEEETrans.onCircuitsandSystemsforVideoTech.1996,6(3):243-250.
[8]DTaubman.HighperformancescalableimagecompressionwithEBCOT[J].IEEETransactionsonImageProcessing,2000,9(7):1158–1170.
[9]徐林靜,孟利民,朱建軍.小波與分行在圖像壓縮中的比較及應(yīng)用.中國有線電視,2003,03/04:26-29.
[10]MGilge,TEngelhardt,RMehlan.Codingofarbitrarilyshapedimagesegmentsbasedonageneralizedorthogonaltransform[J].SignalProcessing:ImageCommun.,1989,1(10):153–180.
[11]TSikora,BMakai.Shape-adaptiveDCTforgenericcodingofvideo[J].IEEETrans.CircuitsSyst.VideoTechnol.,1995,5(1):59–62.
[12]TSikora,SBauer,BMakai.Efficiencyofshape-adaptive2-Dtransformsforcodingofarbitrarilyshapedimagesegments[J].IEEETrans.CircuitsSyst.VideoTechnol.,1995,5(3):254–258.
[13]EJensen,KRijk,etal.Codingofarbitrarilyshapedimagesegments[C].Proc.WorkshopImageAnalysisandSynthesisinImageCoding,Berlin,Germany,1994:E2.1–E2.4.
[14]MBi,SHOng,menton“Shape-adaptiveDCTforgenericcodingofvideo”[J].IEEETrans.CircuitsSyst.VideoTechnol.,1996,6(6):686–688.
[15]PKauff,KSchuur.Shape-adaptiveDCTwithblock-basedDCseparationandDeltaDCcorrection[J].IEEETrans.CircuitsSyst.VideoTechnol.,1998,8(3):237–242.
[16]OEgger,PFleury,TEbrahimi.Shape-adaptivewavelettransformforzerotreecoding[C].Proc.Eur.WorkshopImageAnalysisandCodingforTV,HDTVandMultimediaApplication,Rennes,France,1996:201–208.
[17]OEgger.Regionrepresentationusingnonlineartechniqueswithapplicationstoimageandvideocoding[D].Ph.D.dissertation,SwissFederalInstituteofTechnology(EPFL),Lausanne,Switzerland,1997.
[18]SLi,WLi,etal.Shapeadaptivevectorwaveletcodingofarbitrarilyshapedtexture[S].ISO/IECJTC/SC29/WG11,MPEG-96-m1027,1996.
[19]WLi,FLing,HSun.ReportoncoreexperimentO3(Shapeadaptivewaveletcodingofarbitrarilyshapedtexture)[S].ISO/IECJTC/SC29/WG11,MPEG-97-m2385,1997.
[20]SLi,WLi.Shapeadaptivediscretewavelettransformforcodingarbitrarilyshapedtexture[C].Proc.SPIEVCIP’97,1997,3024:1046–1056.
[21]SLi,WLi,etal.Shapeadaptivewaveletcoding[C].Proc.IEEEInt.Symp.CircuitsandSystemsISCAS’98,1998,5:281–284.
[22]SLi,WLi.Shape-adaptivediscretewavelettransformforarbitrarilyshapedvisualobjectcoding[J].IEEETrans.CircuitsSyst.VideoTechnol.,2000,10(5):725–743.
數(shù)字貿(mào)易論文 數(shù)字素養(yǎng)教育 數(shù)字化教育 數(shù)字科技技術(shù) 數(shù)字貨幣論文 數(shù)字營銷論文 數(shù)字媒體論文 數(shù)字仿真技術(shù) 數(shù)字技術(shù)論文 數(shù)字與傳媒技術(shù) 紀律教育問題 新時代教育價值觀