聲像檔案數(shù)字化中的數(shù)據(jù)存儲格式
在聲像檔案的管理中,主要是對照片、視頻、音頻的檔案對象進(jìn)行管理,為了便于檔案的保存和再利用,各檔案管理部門開始利用現(xiàn)在強(qiáng)大的多媒體技術(shù)和計(jì)算機(jī)技術(shù),將聲像檔案數(shù)字化,但不同的數(shù)字化標(biāo)準(zhǔn)和文件存儲格式,數(shù)字化的檔案品質(zhì)差別非常大,可以針對檔案不同的使用目的,采用不同的數(shù)字化方案。
聲像檔案數(shù)字化的目的是為了長期保存和再利用,為了長期保存,數(shù)字化后的檔案必須接近真實(shí)地反映原檔案的全部特征,這樣數(shù)字化后的檔案數(shù)據(jù)文件就特別的大,不便于檔案數(shù)據(jù)的檢索,因此,我們在聲像檔案數(shù)字化時,每種檔案生成兩種數(shù)字化文件,一種用于長期保存,一種用于檢索。用于檢索的數(shù)據(jù)文件非常小,以至于在低帶寬的互聯(lián)網(wǎng)上檢索時,也可以保障快速的數(shù)據(jù)響應(yīng),用戶檢索到的聲像檔案,可以直接通過互聯(lián)網(wǎng)觀看視頻畫面、預(yù)聽聲音,當(dāng)需要原始檔案數(shù)據(jù)文件時,通過授權(quán),可以下載到本機(jī)使用。
一種檔案生成兩種數(shù)字化文件,并不需要數(shù)字化兩次,聲像檔案在數(shù)字化時,可以用較高的采樣率直接生成存檔級的數(shù)字化文件,在此文件的基礎(chǔ)上,通過轉(zhuǎn)換程序,可以任意生成低采樣率的檢索級的數(shù)據(jù)文件。
1.照片數(shù)字化的存儲格式及參數(shù)設(shè)置
照片數(shù)字化后的圖像存儲格式很多,對于存檔級的照片,建議采用TIFF存儲格式,但目前很多數(shù)碼相機(jī)拍攝的照片直接存儲的是JPEG格式,也可以直接用來存檔。TIFF圖像是一種非常靈活的存儲格式,可以存儲彩色、灰度、二值圖像。對于彩色圖像,支持RGB和CMYK兩種模式,RGB(紅綠藍(lán))大家都比較熟習(xí),CMYK(青、洋紅、黃色、黑)是專門用于印刷的存儲格式,在印刷業(yè)大量被采用。在存儲的數(shù)據(jù)組織方面,支持非壓縮存儲、LZW無損壓縮存儲;對二值圖像還支持CCITT Group4無損壓縮存儲。
在掃描圖像文件時,只要掃描的分辨率足夠高,就可以近乎完全地反映原始照片。但受到掃描硬件分辨率的限制、存儲空間的限制等一些硬件的制約,我們只能選擇一個合適的掃描分辨率,下面給出幾個掃描分辨率和存儲空間的對應(yīng)關(guān)系。
TIFF RGB 非壓縮格式:
在有足夠存儲空間的情況下,建議用1200DPI掃描存儲照片。
預(yù)覽照片的生成:
原始存檔圖像生成后,通過軟件,就可以自動提取用于預(yù)覽的圖像。這里又涉及到預(yù)覽圖像用什么格式存儲、采用多高的分辨率的問題。預(yù)覽用的圖像以能在電腦上看清圖像的內(nèi)容為原則,分辨率越低越好,通過實(shí)驗(yàn)得知,采用72DPI的分辨率較好,此分辨率既可以看清圖像的全貌,又可以保障存儲空間最小。在存儲格式上,采用JPEG壓縮存儲,以節(jié)約存儲空間。
采用72DPI,JPEG中等壓縮品質(zhì)存儲,不同尺寸的照片的存儲空間如下表:
2.視頻數(shù)字化的存儲格式及參數(shù)設(shè)置
用于存儲視頻圖像的數(shù)據(jù)格式很多,有些適合于檔案存儲,有些適合于網(wǎng)絡(luò)在線播放。對于存檔級的視頻圖像,建議采用MPEG-2的壓縮算法進(jìn)行壓縮,MPEG(Moving Picture Experts Group)是國際上著名的數(shù)字視頻和音頻壓縮的標(biāo)準(zhǔn)化組織,其系列標(biāo)準(zhǔn)有MPEG-1、MPEG-2、MPEG-4、MPEG-7等,這些標(biāo)準(zhǔn)都得到了不同軟硬件廠商廣泛的支持,不同的標(biāo)準(zhǔn)適用于不同的應(yīng)用領(lǐng)域,并不是說標(biāo)準(zhǔn)后序的數(shù)字越大越好。如MPEG-1是VCD的壓縮標(biāo)準(zhǔn),它的視頻壓縮質(zhì)量只是達(dá)到家用錄像機(jī)的品質(zhì);MPEG-2是DVD和數(shù)字電視傳輸?shù)膲嚎s標(biāo)準(zhǔn);MPEG-4是視頻流媒體的壓縮標(biāo)準(zhǔn),它的壓縮效率更高,可以在網(wǎng)絡(luò)低帶寬的情況下,保障連續(xù)的視頻數(shù)據(jù)播放,被目前很多的VOD(視頻點(diǎn)播)所采用;MPEG-7是多媒體內(nèi)容描述接口,提供基于內(nèi)容的視頻檢索機(jī)制,可以直接檢索某個視頻鏡頭。
用MPEG-2壓縮存儲存檔級的視頻檔案,視頻采樣數(shù)據(jù)流采用10Mbps,音頻采樣數(shù)據(jù)流采用384Kbps,48KHz,立體聲,視頻畫面分辨率720×576,這樣1小時的視頻畫面,經(jīng)MPEG-2壓縮后,約占用4.2GB的存儲空間,如果需要備份,正好可以備份到一張DVD盤上。壓縮后的MPEG-2數(shù)據(jù)文件,可直接用于播放、編輯等不同的用途。
預(yù)覽視頻數(shù)據(jù)流的生成:
用于預(yù)覽的視頻數(shù)據(jù)流必須是流媒體的格式,以滿足網(wǎng)絡(luò)在線播放的需要。目前常用的流媒體格式,除了上面提到的MPEG-4外,還有微軟公司的ASF(Advanced Streaming Format)、WMV(Windows Media Video),RealNetworks公司的RM/RAM/RMVB等視頻數(shù)據(jù)格式,這些視頻數(shù)據(jù)格式在網(wǎng)絡(luò)上都特別流行,各有長處,支持的軟件和硬件也特別多。MPEG-4對運(yùn)動圖像的還原更出色些,WMV對色彩的還原要好些,RM/RAM/RMV的壓縮品質(zhì)更高,在很低的網(wǎng)絡(luò)帶寬情況下,仍然可以獲得好的播放效果。
由于微軟在軟件業(yè)的統(tǒng)治地位,其相關(guān)的制作和播放軟件更容易獲得,建議預(yù)覽用的視頻數(shù)據(jù)流采用WMV的壓縮存儲格式,用相關(guān)的轉(zhuǎn)換軟件可以直接從存檔級的視頻數(shù)據(jù)文件中生成,在能看清內(nèi)容的情況下,預(yù)覽用的數(shù)據(jù)文件越小越好。
WMV的壓縮參數(shù)設(shè)置:視頻數(shù)據(jù)壓縮碼率采用256Kbps,視頻畫面分辨率320×240,這樣1小時的視頻畫面,用WMV格式存儲,約占用110MB的存儲空間。
3.音頻數(shù)字化的存儲格式及參數(shù)設(shè)置
目前用于音頻數(shù)據(jù)存儲的格式也很多,如WAV、MIDI、MP3、Ogg、杜比AC-3等。對于存檔級的音頻文件,還是采用WAV格式存儲,WAV格式是微軟公司開發(fā)的波形存儲文件,由于微軟公司在軟件業(yè)的統(tǒng)治地位,該格式非常普及和流行,它是非壓縮的,在采樣率足夠高的情況下,可以精確地記錄聲音。
在記錄WAV文件時,一般選擇雙聲道立體聲,16位采樣(每一個采樣點(diǎn)左右聲道各占16位),采樣率是一個很重要的參數(shù),一般選擇48Khz,可以達(dá)到廣播級的效果,也可以采用44.1Khz,可以達(dá)到CD的播放品質(zhì)。此參數(shù)設(shè)置的WAV文件,記錄一小時的音頻數(shù)據(jù)約占用600MB的存儲空間。
預(yù)覽音頻數(shù)據(jù)流的生成:
類似視頻數(shù)據(jù)流的處理,音頻用于預(yù)覽的數(shù)據(jù)流也必須是流媒體的格式,目前常用的音頻流媒體格式主要有MP3、WMA、RM/RAM/RMVB等格式。MP3實(shí)際上是前面提到的MPEG的第三聲音壓縮層(Audio Layer-3)對聲音的壓縮算法,在網(wǎng)絡(luò)上非常流行。WMA(Windows Media Audio)是微軟公司對音頻進(jìn)行壓縮的流媒體格式,RM/RAM/RMVB前面已經(jīng)提到過。
由于MP3的大量流行和其標(biāo)準(zhǔn)的開放性,預(yù)覽用的音頻數(shù)據(jù)流建議用MP3格式存儲,在提取MP3文件時,數(shù)據(jù)流碼率設(shè)置為56Kbps,記錄一小時的音頻數(shù)據(jù)約占用25MB的存儲空間。