科技的發(fā)展正在加速改變我們的生活。以前,我們購物埋單時(shí),收銀員會(huì)問“現(xiàn)金還是刷卡”,現(xiàn)在,這句話則變成了“還是支付寶?”以前,我們上街要帶現(xiàn)金,后來變成帶卡,現(xiàn)在只需帶手機(jī)。
然而,你想過沒有?未來某一天,我們上街連手機(jī)都不用帶了,只要“帶臉”就行。因?yàn)?,我們正在邁向“刷臉時(shí)代”。到時(shí),把你的所有信息、財(cái)產(chǎn)都跟你的臉綁定了,出門“刷臉”就行。今天,我們就來詳細(xì)了解一下人臉識(shí)別技術(shù):
人臉識(shí)別概述
人臉識(shí)別,是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測(cè)和跟蹤人臉,進(jìn)而對(duì)檢測(cè)到的人臉進(jìn)行臉部的一系列相關(guān)技術(shù),通常也叫做人像識(shí)別、面部識(shí)別。
人臉識(shí)別是一項(xiàng)熱門的計(jì)算機(jī)技術(shù)研究領(lǐng)域,它屬于生物特征識(shí)別技術(shù),是對(duì)生物體(一般特指人)本身的生物特征來區(qū)分生物體個(gè)體。
生物特征識(shí)別技術(shù)所研究的生物特征包括臉、指紋、手掌紋、虹膜、視網(wǎng)膜、聲音(語音)、體形、個(gè)人習(xí)慣(例如敲擊鍵盤的力度和頻率、簽字)等。
相應(yīng)的識(shí)別技術(shù)就有人臉識(shí)別、指紋識(shí)別、掌紋識(shí)別、虹膜識(shí)別、視網(wǎng)膜識(shí)別、語音識(shí)別(用語音識(shí)別可以進(jìn)行身份識(shí)別,也可以進(jìn)行語音內(nèi)容的識(shí)別,只有前者屬于生物特征識(shí)別技術(shù))、體形識(shí)別、鍵盤敲擊識(shí)別、簽字識(shí)別等。
三大關(guān)鍵技術(shù)
1、基于特征的人臉檢測(cè)技術(shù)
通過采用顏色、輪廓、紋理、結(jié)構(gòu)或者直方圖特征等進(jìn)行人臉檢測(cè)。
2、基于模板匹配人臉檢測(cè)技術(shù)
從數(shù)據(jù)庫當(dāng)中提取人臉模板,接著采取一定模板匹配策略,使抓取人臉圖像與從模板庫提取圖片相匹配,由相關(guān)性的高低和所匹配的模板大小確定人臉大小以及位置信息。
3、基于統(tǒng)計(jì)的人臉檢測(cè)技術(shù)
通過對(duì)于“人臉”和“非人臉”的圖像大量搜集構(gòu)成的人臉正、負(fù)樣本庫,采用統(tǒng)計(jì)方法強(qiáng)化訓(xùn)練該系統(tǒng),從而實(shí)現(xiàn)對(duì)人臉和非人臉的模式進(jìn)行檢測(cè)和分類。
四大特征
1、幾何特征
從面部點(diǎn)之間的距離和比率作為特征,識(shí)別速度快,內(nèi)存要求比較小,對(duì)于光照敏感度降低。
2、基于模型特征
根據(jù)不同特征狀態(tài)所具有概率不同而提取人臉圖像特征。
3、基于統(tǒng)計(jì)特征
將人臉圖像視為隨機(jī)向量,并用統(tǒng)計(jì)方法辨別不同人臉特征模式,比較典型的有特征臉、獨(dú)立成分分析、奇異值分解等。
4、基于神經(jīng)網(wǎng)絡(luò)特征
利用大量神經(jīng)單元對(duì)人臉圖像特征進(jìn)行聯(lián)想存儲(chǔ)和記憶,根據(jù)不同神經(jīng)單元狀態(tài)的概率實(shí)現(xiàn)對(duì)人臉圖像準(zhǔn)確識(shí)別。
難點(diǎn)
1、光照問題
光照變化是影響人臉識(shí)別性能的zui關(guān)鍵因素,對(duì)該問題的解決程度關(guān)系著人臉識(shí)別實(shí)用化進(jìn)程的成敗。由于人臉的3D結(jié)構(gòu),光照投射出的陰影,會(huì)加強(qiáng)或減弱原有的人臉特征。尤其是在夜晚,由于光線不足造成的面部陰影會(huì)導(dǎo)致識(shí)別率的急劇下降,使得系統(tǒng)難以滿足實(shí)用要求。
同時(shí),理論和實(shí)驗(yàn)還證明同一個(gè)體因光照不同引起的差異,大于同一光照下不同個(gè)體之間的差異。光照問題是機(jī)器視覺中的老問題,在人臉識(shí)別中的表現(xiàn)尤為明顯。解決光照問題的方案有三維圖像人臉識(shí)別和熱成像人臉識(shí)別。但這兩種技術(shù)還遠(yuǎn)不成熟,識(shí)別效果不盡人意。
2、姿態(tài)問題
人臉識(shí)別主要依據(jù)人的面部表象特征來進(jìn)行,如何識(shí)別由姿態(tài)引起的面部變化就成了該技術(shù)的難點(diǎn)之一。姿態(tài)問題涉及頭部在三維垂直坐標(biāo)系中繞三個(gè)軸的旋轉(zhuǎn)造成的面部變化,其中垂直于圖像平面的兩個(gè)方向的深度旋轉(zhuǎn)會(huì)造成面部信息的部分缺失。使得姿態(tài)問題成為人臉識(shí)別的一個(gè)技術(shù)難題。
針對(duì)姿態(tài)的研究相對(duì)比較的少,目前多數(shù)的人臉識(shí)別算法主要針列正面、準(zhǔn)正面人臉圖像,當(dāng)發(fā)生俯仰或者左右側(cè)而比較厲害的情況下,人臉識(shí)別算法的識(shí)別率也將會(huì)急劇下降。
3、表情問題
面部幅度較大的哭、笑、憤怒等表情變化同樣影像著面部識(shí)別的準(zhǔn)確率?,F(xiàn)有的技術(shù)對(duì)這些方面處理得還不錯(cuò),論是張嘴還是做一些夸張的表情,計(jì)算機(jī)都可以通過三維建模和姿態(tài)表情校正的方法把它糾正出來。
4、遮擋問題
對(duì)于非配合情況下的人臉圖像采集,遮擋問題是一個(gè)非常嚴(yán)重的問題。特別是在監(jiān)控環(huán)境下,往往被監(jiān)控對(duì)象都會(huì)帶著眼鏡、帽子等飾物,使得被采集出來的人臉圖像有可能不完整,從而影響了后面的特征提取與識(shí)別,甚至?xí)?dǎo)致人臉檢測(cè)算法的失效。
5、年齡變化
隨著年齡的變化,一個(gè)人從少年變成青年,變成老年,他的容貌可能會(huì)發(fā)生比較大的變化,從而導(dǎo)致識(shí)別率的下降。對(duì)于不同的年齡段,人臉識(shí)別算法的識(shí)別率也不同。
這個(gè)問題zui直接的例子就是*照片的識(shí)別,在我國(guó)*的有效期一般都是20年,這20年間每個(gè)人的容貌必然會(huì)發(fā)生相當(dāng)大的變化,所有在識(shí)別上也同樣存在很大的問題。
6、人臉相似性
不同個(gè)體之間的區(qū)別不大,所有的人臉的結(jié)構(gòu)都相似,甚至人臉器官的結(jié)構(gòu)外形都很相似。這樣的特點(diǎn)對(duì)于利用人臉進(jìn)行定位是有利的,但是對(duì)于利用人臉區(qū)分人類個(gè)體是不利的。
7、動(dòng)態(tài)識(shí)別
非配合性人臉識(shí)別的情況下,運(yùn)動(dòng)導(dǎo)致面部圖像模糊或攝像頭對(duì)焦不正確都會(huì)嚴(yán)重影響面部識(shí)別的成功率。在地鐵、高速公路卡口、車站卡口、超市反扒、邊檢等安保和監(jiān)控識(shí)別的使用中,這種困難明顯突出。
8、人臉防偽
偽造人臉圖像進(jìn)行識(shí)別的主流欺騙手段是建立一個(gè)三維模型,或者是一些表情的嫁接。隨著人臉防偽技術(shù)的完善、3D面部識(shí)別技術(shù)、攝像頭等智能計(jì)算視覺技術(shù)的引入,偽造面部圖像進(jìn)行識(shí)別的成功率會(huì)大大降低。
9、圖像質(zhì)量問題
人臉圖像的來源可能多種多樣,由于采集設(shè)備的不同,得到的人臉圖像質(zhì)量也不一樣,特別是對(duì)于那些低分辨率、噪聲大、質(zhì)量差的人臉圖像(如手機(jī)攝像頭拍攝的人臉圖片、遠(yuǎn)程監(jiān)控拍攝的圖片等)如何進(jìn)行有效地人臉識(shí)別是個(gè)需要關(guān)注的問題。
同樣的,對(duì)于高分辨圖像對(duì)人臉識(shí)別算法的影響也需要進(jìn)一步的研究?,F(xiàn)在,我們?cè)谌四樧R(shí)別時(shí),一般采用的都是相同尺寸,清晰度很接近的人臉圖片,所以圖像質(zhì)量問題基本可以解決,但是面對(duì)現(xiàn)實(shí)中更加復(fù)雜的問題,還需要繼續(xù)優(yōu)化處理。
10、樣本缺乏
基于統(tǒng)計(jì)學(xué)習(xí)的人臉識(shí)別算法是目前人臉識(shí)別領(lǐng)域中的主流算法,但是統(tǒng)計(jì)學(xué)習(xí)方法需要大量的訓(xùn)練。由于人臉圖像在高維空間中的分布是一個(gè)不規(guī)則的流形分布,能得到的樣本只是對(duì)人臉圖像空間中的一個(gè)極小部分的采樣,如何解決小樣本下的統(tǒng)計(jì)學(xué)習(xí)問題有待進(jìn)一步的研究。
此外,現(xiàn)在參與訓(xùn)練的人臉圖像庫基本都是外國(guó)人的圖像,有關(guān)中國(guó)人、亞洲人的人臉圖像庫少之又少,給訓(xùn)練人臉識(shí)別模型增加了難度。