圖像識別
圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術,是應用深度學習算法的一種實踐應用。 現階段圖像識別技術一般分為人臉識別與商品識別,人臉識別主要運用在安全檢查、身份核驗與移動支付中;商品識別主要運用在商品流通過程中,特別是無人貨架、智能零售柜等無人零售領域 。
圖像的傳統識別流程分為四個步驟:圖像采集→圖像預處理→特征提取→圖像識別。圖像識別軟件國外代表的有康耐視等,國內代表的有圖智能、海深科技等。另外在地理學中指將遙感圖像進行分類的技術。
基本介紹 編輯本段
如何識別人臉?識別人臉的方法有很多,最常用的是圖像識別。例如,人臉圖像從背景中提取信息,通過將面部與背景進行對比來確定是否為同一人。有很多圖像識別方法是需要在多張圖像中尋找特征點來進行識別,但是因為圖像所處的環境不同,所以其識別過程也是不一樣的。
一、特征提取
特征提取是指將待識別人臉圖像進行分割,并在分割之后,將其分為幾個部分。在特征提取過程中,需要考慮目標的具體特征,比如是否具有人臉特征、是否具有人臉的紋理特征等。在提取特征的過程中,需要對不同的目標設置不同的閾值,以達到不同的目的。閾值設置的越低,對人臉的影響越小;閾值設置的越高,對人臉的影響越大。當目標不具有人臉特征時,閾值設置為低;當目標具有人臉特征時,閾值設置為高。人臉特征提取過程中要注意以下幾點:提取目標的人臉特征,必須考慮目標所處環境變化以及與背景圖像等效的影響;提取人臉的紋理特征不能是孤立的,必須注意對面部進行多尺度化處理;提取目標特征必須考慮影響閾值設置的因素;提取目標的紋理特征后需要將其與背景圖像進行比較;將所有的圖像處理方法結合起來使用以提高特征識別效率而非降低識別結果;從多尺度化效果上考慮提取特征效果影響閾值設置等。
1、人臉特征
人臉特征是通過利用不同的算法來提取人臉的圖像特征,在提取人臉特征時,首先要解決的問題是目標的輪廓特征以及面部五官特征。目前比較常用的人臉特征有三種,分別是最小二乘(Loss Vector)、 Logistic Synthetic Device以及 Perception Synthetic Device。在這些提取法中, LSD是基于最小二乘模型而設計的一個二分算法,該模型用三種不同大小的均方誤差作為濾波器,再將三種不同大小的均方誤差乘以一個固定值作為輸出函數,最后用一個固定值作為該濾波器的初始參數。LSD自定義參數有很多,目前常用如 RMSE、 RMSE等函數。在所有選擇 RMSE作為特征值時,最小二乘(Logistic Synthetic Device)是非常重要的指標之一,其數值越大說明對目標越有價值;反之則可認為是一個負值,通常由梯度消失、梯度消除、平均曲率等方法構成,因此從梯度消失中能夠判斷出這個人是否具有生物相似性。
2、紋理特征
紋理特征是對人臉圖像的分割,主要包含了兩個方面的特征:即不同深度下的紋理信息;不同亮度下的紋理信息。通過紋理特征能夠對待識別的目標進行很好的分割。紋理特征主要包含紋理值、紋理空間等三個方面。對兩種不同深度下的紋理分量進行研究,將兩種不同深度下的紋理分量進行了比較,可以發現,紋理參數對紋理特征的影響是比較大的。對于含有紋理的圖像,需要先對其進行預處理,然后再利用上述三個參數對其進行分析,這樣才能獲得更加準確的紋理值。
3、人臉檢測
人臉檢測是在計算機視覺中進行的一種簡單、快速、高效的特征識別方式。其檢測方式包括了最大似然理論、最小似然理論等。為了進行圖像分類,人們需要對圖像進行比較。人們對計算機視覺領域研究較多的是應用最大似然理論進行面部識別,而對圖像進行分類的最重要手段是最小似然理論。
圖像特征提取 編輯本段
首先通過圖像處理軟件對圖像進行預處理,然后利用特征提取算法對圖像進行特征提取,出人臉特征點,用函數將圖像分割為若干個特征部分。圖像分割的目的是使圖像中各部分不相干,并使識別結果更加接近于實際圖像。人臉分割的原理是用圖像分割技術來提取人臉圖像中各個部分的特征,然后根據各特征進行計算,最后將計算所得的結果與特征點進行比較,將兩個相似的特征點進行比較,從而確定人臉是否為同一人:特征點最少必須與相似特征點相吻合;其次是圖像中不相干部位特征點的提取;最后便是在特征點旁邊一定范圍內的點來作為特征信息進行提取。這種方法可以達到快速快捷、結果準確的目的,但是它只能在人臉特征點比較密集的情況下才能有效地使用,對于一些較大數量或者形狀較復雜的人臉特征點就不能使用此方法來進行識別。而且當人臉出現明顯變化時,還會影響識別進度會導致識別結果有一定損失,這也是采用人臉分析方法來輔助人臉識別的缺點。
1、人臉識別方法的分類
人臉識別方法主要分為以下幾類:第一類是基于規則和幾何結構的人臉識別方法,包括人臉檢測算法、人臉特征點檢測算法、臉部識別數據處理算法等。第二類屬于基于特征和時間序列的人臉模型識別法,主要包括基于面部圖像的各種特征提取算法、臉部特征提取算法和模型搜索等。第三類屬于視覺和非視覺人臉識別方法,包括圖像處理方法、計算機輔助設計和人工智能等。第四類是支持向量機預測應用軟件。這類方法具有強大的魯棒性,在一定程度上也是對圖像處理和支持向量機算法進行優化的一種重要方法。但是它只能對人臉進行定性研究,沒有明確的算法,同時它存在著明顯的局限性,這使得人臉識別在實際應用中遇到了許多問題。
2、特征提取與分析
由于人臉的形狀復雜,很多特征點的數量很多,所以,對于該問題,我們首先要利用數學分析中的線性回歸和梯度下降法對其特征進行提取和分析。對于這些性質不同的特征,使用線性回歸或梯度下降法是不能有效地將其作為識別人臉的依據。而且對梯度下降法進行分析時,必須將梯度下降函數設為閾值,這對梯度值有一定的要求。梯度下降法采用的是梯度圖構造法,通過圖可以看出梯度變化對圖像有影響,因此這種梯度法適合對圖像有顯著影響的數據。梯度下降法計算速度比較快,在某些情況下還可以提高識別率,但梯度下降法需用到大量數據,而且對某些需要特殊處理后才能得到更好數據的情況是無法滿足實際要求的。因此采用梯度下降法提取人臉特征會大大降低該方法所需耗費的時間以及計算復雜程度。
人臉特征提取 編輯本段
人臉識別技術一般需要將人臉圖像轉換成特定圖像,通過識別對圖像中人物臉部的提取來確定人臉。首先,對人臉圖像的處理,對圖像進行預處理,使其含有一些信息。然后,根據人臉與背景相似程度,利用人臉的不同方向和角度將人臉分割成若干個區域,使其具有相似的特征,如直角面點,圓弧面點等。最后,將人臉圖像分割后,在適當的位置與背景圖像進行對比,就可以得到人臉特征了。在實際應用中,這種方法既能將人臉檢測到,又能將其提取出來,且識別率很高。在圖像提取中,通常通過三種方法進行分析:首先,基于背景分析法,在圖像中加入背景信息;其次是基于特征提取法,先將人臉圖像預處理,將圖像映射到背景圖像中;最后一種方法是利用圖像的不同角度提取人臉特征。
1、背景分析法
背景分析法是將背景看成是人臉圖像的背景,以得到該人臉圖像中的信息,是一種最簡單的方法。該方法不需要進行人臉圖像預處理,只要用灰度圖像中相同色調的顏色圖像和亮度相同強度的灰度圖像作為背景,就可以得到該人臉的信息。但背景分析方法存在著一定的局限性,它不能很好地保留背景信息,在實際應用中一般用該方法將人臉提取出來。背景分析法對人臉有很強的針對性,所以它是非常實用的一種方法。其優點在于:首先需要提取較多信息,并且需要對背景顏色有較高的要求;其次,由于每個人臉上最小特征為5×5,因而其背景與該圖像中每個人臉上最小特征相比具有很高相似性;最后,該方法由于可以與其它特征結合使用,所以應用范圍很廣。
2、特征提取法
特征提取法又稱圖像處理特征提取法,是指在對人臉圖像進行預處理時,首先利用具有相似特征的圖像提取其形狀或顏色、紋理特征,然后再對圖像特征進行人工處理(如去除面部皺紋、陰影等),使其具有相似程度。在使用這一方法時,可以通過訓練樣本進行預處理,從而將樣本分成兩組,一組樣本采用一元的像素,另一組樣本采用四元的像素,最后將樣本進行歸一化處理,得到一個具有相關特征的圖像。但該方法不能完全反映出人物面部的真實面部情況,所以在實際應用中需根據人臉的面部分布特征來決定其提取方式。該方法主要由三部分組成:首先是對圖像的預處理;其次是對樣本空間進行分割;最后是對特征值進行計算。此外,對于不同顏色、紋理、幾何特征等不同種類特征值,應通過對所對應對象進行識別選擇其最為合適或最具代表性特征進行描述分析以供識別與檢測人員使用。
智能領域 編輯本段
圖像識別是人工智能的一個重要領域。為了編制模擬人類圖像識別活動的計算機程序,人們提出了不同的圖像識別模型。例如模板匹配模型。這種模型認為,識別某個圖像,必須在過去的經驗中有這個圖像的記憶模式,又叫模板。當前的刺激如果能與大腦中的模板相匹配,這個圖像也就被識別了。例如有一個字母A,如果在腦中有個A模板,字母A的大小、方位、形狀都與這個A模板完全一致,字母A就被識別了。這個模型簡單明了,也容易得到實際應用。但這種模型強調圖像必須與腦中的模板完全符合才能加以識別,而事實上人不僅能識別與腦中的模板完全一致的圖像,也能識別與模板不完全一致的圖像。例如,人們不僅能識別某一個具體的字母A,也能識別印刷體的、手寫體的、方向不正、大小不同的各種字母A。同時,人能識別的圖像是大量的,如果所識別的每一個圖像在腦中都有一個相應的模板,也是不可能的。
為了解決模板匹配模型存在的問題,格式塔心理學家又提出了一個原型匹配模型。這種模型認為,在長時記憶中存儲的并不是所要識別的無數個模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗所要識別的圖像。如果能找到一個相似的原型,這個圖像也就被識別了。這種模型從神經上和記憶探尋的過程上來看,都比模板匹配模型更適宜,而且還能說明對一些不規則的,但某些方面與原型相似的圖像的識別。但是,這種模型沒有說明人是怎樣對相似的刺激進行辨別和加工的,它也難以在計算機程序中得到實現。因此又有人提出了一個更復雜的模型,即“泛魔”識別模型。
一般工業使用中,采用工業相機拍攝圖片,然后利用軟件根據圖片灰階差做處理后識別出有用信息,圖像識別軟件國外代表的有康耐視等,國內代表的有圖智能等。
在人工智能中圖像識別技術具有智能化、便捷化以及實用性的優勢,為人們的生活與工作帶來極大的便利。
研究現狀 編輯本段
圖像識別的發展經歷了三個階段:文字識別、數字圖像處理與識別、物體識別。文字識別的研究是從 1950年開始的,一般是識別字母、數字和符號,從印刷文字識別到手寫文字識別, 應用非常廣泛。
數字圖像處理和識別的研究開始于1965年。數字圖像與模擬圖像相比具有存儲,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優勢,這些都為圖像識別技術的發展提供了強大的動力。物體的識別主要指的是對三維世界的客體及環境的感知和認識,屬于高級的計算機視覺范疇。它是以數字圖像處理與識別為基礎的結合人工智能、系統學等學科的研究方向,其研究成果被廣泛應用在各種工業及探測機器人上。現代圖像識別技術的一個不足就是自適應性能差,一旦目標圖像被較強的噪聲污染或是目標圖像有較大殘缺往往就得不出理想的結果。
圖像識別問題的數學本質屬于模式空間到類別空間的映射問題。目前,在圖像識別的發展中,主要有三種識別方法:統計模式識別、結構模式識別、模糊模式識別。圖像分割是圖像處理中的一項關鍵技術,自20世紀70年代,其研究已經有幾十年的歷史,一直都受到人們的高度重視,至今借助于各種理論提出了數以千計的分割算法,而且這方面的研究仍然在積極地進行著。
現有的圖像分割的方法有許多種,有閾值分割方法,邊緣檢測方法,區域提取方法,結合特定理論工具的分割方法等。從圖像的類型來分有:灰度圖像分割、彩色圖像分割和紋理圖像分割等。早在1965年就有人提出了檢測邊緣算子,使得邊緣檢測產生了不少經典算法。但在近二十年間,隨著基于直方圖和小波變換的圖像分割方法的研究計算技術、VLSI技術的迅速發展,有關圖像處理方面的研究取得了很大的進展。圖像分割方法結合了一些特定理論、 方法和工具,如基于數學形態學的圖像分割、基于小波變換的分割、基于遺傳算法的分割等。
附件列表
詞條內容僅供參考,如果您需要解決具體問題
(尤其在法律、醫學等領域),建議您咨詢相關領域專業人士。