常用的圖像特征有顏色特征、紋理特征、形狀特征、空間關系特征。
一 顏色特征 (一)特點:顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對應的景物的表面性質。一般顏色特征是基于像素點的特征,此時所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻。
由于顏色對圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對象的局部特征。另外,僅使用顏色特征查詢時,如果數(shù)據庫很大,常會將許多不需要的圖像也檢索出來。
顏色直方圖是最常用的表達顏色特征的方法,其優(yōu)點是不受圖像旋轉和平移變化的影響,進一步借助歸一化還可不受圖像尺度變化的影響,基缺點是沒有表達出顏色空間分布的信息。(二)常用的特征提取與匹配方法 (1) 顏色直方圖 其優(yōu)點在于:它能簡單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像。
其缺點在于:它無法描述圖像中顏色的局部分布及每種色彩所處的空間位置,即無法描述圖像中的某一具體的對象或物體。最常用的顏色空間:RGB顏色空間、HSV顏色空間。
顏色直方圖特征匹配方法:直方圖相交法、距離法、中心距法、參考顏色表法、累加顏色直方圖法。(2) 顏色集 顏色直方圖法是一種全局顏色特征提取與匹配方法,無法區(qū)分局部顏色信息。
顏色集是對顏色直方圖的一種近似首先將圖像從 RGB顏色空間轉化成視覺均衡的顏色空間(如 HSV 空間),并將顏色空間量化成若干個柄。然后,用色彩自動分割技術將圖像分為若干區(qū)域,每個區(qū)域用量化顏色空間的某個顏色分量來索引,從而將圖像表達為一個二進制的顏色索引集。
在圖像匹配中,比較不同圖像顏色集之間的距離和色彩區(qū)域的空間關系 (3) 顏色矩 這種方法的數(shù)學基礎在于:圖像中任何的顏色分布均可以用它的矩來表示。此外,由于顏色分布信息主要集中在低階矩中,因此,僅采用顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)就足以表達圖像的顏色分布。
(4) 顏色聚合向量 其核心思想是:將屬于直方圖每一個柄的像素分成兩部分,如果該柄內的某些像素所占據的連續(xù)區(qū)域的面積大于給定的閾值,則該區(qū)域內的像素作為聚合像素,否則作為非聚合像素。(5) 顏色相關圖 二 紋理特征 (一)特點:紋理特征也是一種全局特征,它也描述了圖像或圖像區(qū)域所對應景物的表面性質。
但由于紋理只是一種物體表面的特性,并不能完全反映出物體的本質屬性,所以僅僅利用紋理特征是無法獲得高層次圖像內容的。與顏色特征不同,紋理特征不是基于像素點的特征,它需要在包含多個像素點的區(qū)域中進行統(tǒng)計計算。
在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會由于局部的偏差而無法匹配成功。作為一種統(tǒng)計特征,紋理特征常具有旋轉不變性,并且對于噪聲有較強的抵抗能力。
但是,紋理特征也有其缺點,一個很明顯的缺點是當圖像的分辨率變化的時候,所計算出來的紋理可能會有較大偏差。另外,由于有可能受到光照、反射情況的影響,從2-D圖像中反映出來的紋理不一定是3-D物體表面真實的紋理。
例如,水中的倒影,光滑的金屬面互相反射造成的影響等都會導致紋理的變化。由于這些不是物體本身的特性,因而將紋理信息應用于檢索時,有時這些虛假的紋理會對檢索造成“誤導”。
在檢索具有粗細、疏密等方面較大差別的紋理圖像時,利用紋理特征是一種有效的方法。但當紋理之間的粗細、疏密等易于分辨的信息之間相差不大的時候,通常的紋理特征很難準確地反映出人的視覺感覺不同的紋理之間的差別。
(二)常用的特征提取與匹配方法 紋理特征描述方法分類 (1)統(tǒng)計方法統(tǒng)計方法的典型代表是一種稱為灰度共生矩陣的紋理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩陣中各種統(tǒng)計特征基礎上,通過實驗,得出灰度共生矩陣的四個關鍵特征:能量、慣量、熵和相關性。統(tǒng)計方法中另一種典型方法,則是從圖像的自相關函數(shù)(即圖像的能量譜函數(shù))提取紋理特征,即通過對圖像的能量譜函數(shù)的計算,提取紋理的粗細度及方向性等特征參數(shù) (2)幾何法 所謂幾何法,是建立在紋理基元(基本的紋理元素)理論基礎上的一種紋理特征分析方法。
紋理基元理論認為,復雜的紋理可以由若干簡單的紋理基元以一定的有規(guī)律的形式重復排列構成。在幾何法中,比較有影響的算法有兩種:Voronio 棋盤格特征法和結構法。
(3)模型法 模型法以圖像的構造模型為基礎,采用模型的參數(shù)作為紋理特征。典型的方法是隨機場模型法,如馬爾可夫(Markov)隨機場(MRF)模型法和 Gibbs 隨機場模型法 (4)信號處理法 紋理特征的提取與匹配主要有:灰度共生矩陣、Tamura 紋理特征、自回歸紋理模型、小波變換等。
灰度共生矩陣特征提取與匹配主要依賴于能量、慣量、熵和相關性四個參數(shù)。Tamura 紋理特征基于人類對紋理的視覺感知心理學研究,提出6種屬性,即:粗糙度、對比度、方向度、線像度、規(guī)整度和粗略度。
自回歸紋理模型(simultaneous auto-regressive, SAR)是馬爾可夫隨機場(MRF)模型的一種。
數(shù)字信號處理是把信號用數(shù)字或符號表示成序列,通過計算機或通用(專用)信號處理設備,用數(shù)值計算方法進行各種處理,達到提取有用信息便于應用的目的。例如:濾波、檢測、變換、增強、估計、識別、參數(shù)提取、頻譜分析等。
一般地講,數(shù)字信號處理涉及三個步驟:
⑴模數(shù)轉換(A/D轉換):把模擬信號變成數(shù)字信號,是一個對自變量和幅值同時進行離散化的過程,基本的理論保證是采樣定理。
⑵數(shù)字信號處理(DSP):包括變換域分析(如頻域變換)、數(shù)字濾波、識別、合成等。
⑶數(shù)模轉換(D/A轉換):把經過處理的數(shù)字信號還原為模擬信號。通常,這一步并不是必須的。 作為DSP的成功例子有很多,如醫(yī)用CT斷層成像掃描儀的發(fā)明。它是利用生物體的各個部位對X射線吸收率不同的現(xiàn)象,并利用各個方向掃描的投影數(shù)據再構造出檢測體剖面圖的儀器。這種儀器中fft(快速傅里葉變換)起到了快速計算的作用。以后相繼研制出的還有:采用正電子的CT機和基于核磁共振的CT機等儀器,它們?yōu)獒t(yī)學領域作出了很大的貢獻。
信號處理的目的是:削弱信號中的多余內容;濾出混雜的噪聲和干擾;或者將信號變換成容易處理、傳輸、分析與識別的形式,以便后續(xù)的其它處理。
主要有:地物邊界跟蹤法;形狀特征描述與提取;地物空間關系特征描述與提取。
遙感圖像解譯,除了利用地物的光譜特征外,還需利用地物的形狀特征和空間關系特征,因此需要提取圖像的其他特征。
對于高分辨率遙感圖像,可以清楚地觀察到豐富的結構信息,如城市是由許多街區(qū)組成的,每個街區(qū)又由多個巨星樓房構成,其中人造地物具有明顯的形狀和結構特征,如建筑物、廠房、農田田埂,因此可以設法去提取這類地物的形狀特征及其空間關系特征,以作為結構模式識別的依據
(1)提取簡單,時間和空間復雜度低。
(2)區(qū)分能力強,對圖像視覺內容相似的圖像其特征描述之間也應相近,反
之,對于視覺內容不相似的圖像其特征描述之間應有一定的差別。
(3)與人的視覺感知相近,對人的視覺感覺相近的圖像其特征描述之間也相
近,對人的視覺感知有差別的圖像其特征描述之間也有一定的差別。
(4)抗干擾能力強,魯棒性好,對圖像大小,方向不敏感,具有幾何平移,
旋轉不變性。
**************************************************************
如果你對這個答案有什么疑問,請追問,
另外如果你覺得我的回答對你有所幫助,請千萬別忘記采納喲!
**************************************************************
3.2 ECG特征點的提取方法 因為Peak Detection VI的輸出中已包含有相應點的幅值、二階導數(shù)及位置索引信息,在確定R峰點后,可進一步根據ECG的特點確定出其它各特征點。完整的ECG特征點判別方法及步驟為: (1)幅值最大或二階導數(shù)最小(或兩者同時滿足)的波峰點判定為R峰點;
(2)R峰點之前的第一個小于零的波谷點(Valley)為Q點;
(3)R峰點之后第一個小于零的波谷點(Valley)為S點;
(4)Q點之前合理時限內的最大波峰點為P點;
(5)S點之后合理時限內的最大波峰點為T點。
(U波幅度較小且目前對其認識還不清楚,本文不作討論。)4、基于虛擬儀器LabVIEW8.2的編程實現(xiàn) 按圖2流程編制LabVIEW8.2程序,考慮到實際ECG波形中存在干擾,閾值(Threshold)不宜取零。程序中采用本周期段數(shù)據中最小波谷點的0.02倍作為Valley點閾值,最大波峰點的0.03倍作為Peak點的閾值,這樣可將基線附近的絕大多數(shù)高頻干擾點避開,這些干擾點將不會出現(xiàn)在輸出序列中
特征提取
一、low-level,主要是MFCC,以及基于MFCC并對其優(yōu)化的一些方法。 1、MFCC
2、抗噪聲較優(yōu)的方法:
WMVDR:warped minimum variance distortionless response
Multitaper MFCC:思想是用multiple windows(tapers)來代替漢明窗。
MHEC:mean Hilbert envelope coefficients.此方法對抗汽車噪聲很有用。 3、對抗回聲較優(yōu)的方法(reverberant robustness):
FDLP: frequency domain linear prediction
4、融合MFCC的方法(fusion with MFCC):
SCF/SCM: spectral centroid frequency/magnitude
該方法的提出,是考慮到MFCC子帶中無法體現(xiàn)能量分布,而FM(frequency modulation)計算量太大。
FFV: fundamental frequency variation,該方法同時考慮到了MFCC和韻律(prosodic)
信息.
HSCC: Harmonic structure cepstral coefficient,該方法體現(xiàn)了能量分布,實現(xiàn)用到了
LDA。
二、high-level,主要是基于phone ,syllable ,word 一級。 1、韻律特征(prosodic features)
目前研究的有 pitch distribution和non-uniform extraction region features(NERFs) 2、音素特征(phonetic features)
建模可以用N-gram,也可以用SVM建模。 3、語法特征(lexical features)
詞一級的N-gram,建模的方法有LLR(log likelihood ration)和SVM.SVM的效果應該更好一些。 4、cepstral-derived features
實現(xiàn)用最大似然線性回歸MLLR(maximum likelihood linear regression)
一些特征: MFCC
PLP 感知線性預測 LPC 線性預測系數(shù) 過零率 LSP 短時能量 子帶流量比 亮度 基頻
頻譜峰值點 SDC CEP 線譜對 頻譜能量
Delt(MFCC)
聲明:本網站尊重并保護知識產權,根據《信息網絡傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個月內通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學習鳥. 頁面生成時間:2.801秒