計算機視覺另一個比較成熟的應用,是人體生物及行為特征識別(簡稱生物識別)。生物識別是指通過指紋、視網膜、虹膜、指/掌靜脈、掌紋/掌形、人臉、步態、聲紋、筆跡等人體的生物或行為的特征,進行個人身份的鑒別和認證。其中,除了聲紋以外,其他的識別方法都屬于計算機視覺范疇。
傳統的身份認證是用戶名+密碼,或者實體卡片、鑰匙等,容易忘記、丟失、被盜取,或者被仿制。生物識別使用人與生俱來、差異性大、穩定性好、難以仿制的生物特征來進行身份的認證,更加安全和便捷。
生物識別所用的生物和行為特征
1 應用概述
生物識別已經應用的十分廣泛:
日常生活中,比如智能門鎖,智能手機的指紋和人臉解鎖。買東西時刷臉支付,在銀行和金融證券的線上系統操作時的指紋和人臉驗證等。
工作中,比如指紋、人臉,或者虹膜的門禁和考勤系統。保密單位或崗位上,登錄工作系統的權限驗證。
公共服務中,比如電子護照或身份證的驗證,醫療保險和養老保險遠程發放驗證,各種自助服務中的人證核驗等。
在生活工作以外,比如公安、司法和刑偵系統中,大量使用生物識別技術進行驗證、核查、偵察等方面的工作。
在人們可能不太注意的地方,比如圖書館的智能交互屏,根據用戶的性別、年齡、風格特征,以及借閱記錄,推薦可能感興趣的書籍。
生物識別的應用,按使用目的大致可以分為認證、匹配、畫像三類。
通常提到生物識別的應用,都會用認證的應用場景來舉例,但是生物識別的用途其實不止認證。
認證——確認自然人的身份。認證的目的是讓自然人獲得信息系統的權限,比如,網上銀行通過人臉識別確認“我”是小HUI,可以對小HUI的銀行賬戶進行任何操作。高鐵閘機,通過攝像頭捕捉的人臉和身份證圖像比對,確認是自然人持有的合法證件,且有票務信息,可以放行。
匹配——關聯不同信息系統中同一個人的信息。一種是跨系統整合信息,比如跨鏡頭追蹤,把同一個人在不同地點和角度的畫面整合起來,繪制行動軌跡和特征畫像。一種是跨系統信息碰撞,比如在大型集會入口抓取觀眾人臉圖像,和公安違法信息進行碰撞,發現可疑人員。
畫像——給出個人或人群畫像。畫像通常是為了商業目的,比如商業體分析某個區域顧客的整體性別和年齡分布、著裝風格,是路過、無差別閑逛,還是有目的購物等,據此進行動線設計。
智慧零售,《德勤-2019中國人工智能產業白皮書》
認證是普通消費者最常接觸到的生物識別應用,這個場景通常只采集用于驗證的1、2種用戶信息,比如人臉+指紋。
匹配和畫像在特定領域解決問題則復雜一些,通常需要識別多個維度的信息,相互關聯印證。比如跨鏡頭追蹤,除了需要識別面部、服飾,還需要通過步態識別,把一個人的正面圖像和背影圖像做關聯。
生物識別的各項技術,目前的普及程度差別很大。走入規模商用的,主要是人臉、指紋、虹膜和靜脈:
安全性和準確性最高的是虹膜和靜脈識別,識別率能達到近100%,目前多用于安全防護級別高的銀行、國防、機場等場所種,核心控制區的身份認證。同時這兩項技術的成本也是最高的,由于使用體驗和價格的原因,沒能被各個行業廣泛應用。
應用范圍最廣的是指紋識別,占有超過50%的生物識別市場份額,這項技術的成本也是最低的,目前廣泛用于門禁、解鎖、個人支付等場景中的身份認證;
人臉識別的應用范圍正在高速擴張,這項技術有非接觸、無感知的特點,幾乎適用于一切安全防護不太高的公共場所的身份認證,以及移動終端的解鎖、支付等。同時這項技術的成本較低、可以得到多維度的信息,目前在44%的金融企業,21%的制造企業,20%的信息服務企業都有應用(數據來自量子位)。
單一的生物識別技術,在數量到達百萬級時,都會有一定的誤識別率,因此,在安全性要求高的領域,一般使用多模態(如指紋+人臉,掌紋+指紋,人臉+指紋+聲紋等)生物識別。
生物識別市場格局(2019年7月)
2 生物識別的基本過程
生物識別的不同方法之間,采集的圖像不同,分析的特征也不同,但是大概的步驟比較類似:
生物識別的基本過程
3 哪個技術更好?
我們在很多媒體上都可以看到類似“人臉識別的準確率達到99.8%,即將爆發”這樣的描述。這里有兩個誤區:
1、 衡量生物識別的,不是一個唯一的“準確率”指標,而是分為誤識率、拒真率。
2、 實驗室能夠達到的水平,和真實環境中能夠做到的水準,可能有數量級上的差別。
誤識率——多大可能判斷“他就是你”。
誤識率由識別所依據的生物和行為特征決定,受在庫數據量的影響。
不同的生物和行為特征包含的信息量不同,這決定了個體間差異是否明顯,進而決定了這種方法能夠達到的、最低的誤識率。信息量最大的是掌靜脈、虹膜,而人臉、聲紋的信息量相對比較小。
在庫數據量小,比如只有一個小學的樣本,數據間的差異一般比較大,認錯的可能性就不太大。如果需要在整個城市的人口樣本中識別“他是誰”,認錯人的可能性就非常大,需要輔以人工或其他的確認方法。
拒真率——多大可能回答“我不認識你”。
拒真率的影響因素比較多,比如特征的穩定性、所處的人體部位,以及圖像采集方法等。
和誤識率不一樣,無論使用哪個生物或行為特性都可以做到很低的拒真率——只要不考慮誤識率。比如:分析完員工小王的指紋后回答:我認識你(低拒真率),你是員工小李(高誤識率)。
拒真率必須和誤識率一起考慮,信息量大的生物和行為特征,通常能同時達到較低的拒真率和誤識率。
特征穩定性高,則任何時候提取到的特征值都很穩定,不容易發生拒真。
有些特性會隨著年齡變化,比如靜脈、耳朵、人臉、聲紋、掌形等;
有些與身體狀態有關,比如生病就會影響聲紋、步態、簽名、擊鍵等;
虹膜、指紋、掌紋幾乎終身穩定不變。
特征所處的人體部位如果暴露在體表,則比較容易受環境影響或者被人為改變,導致某些情況下發生拒真。
指紋識別會受干、濕、污損手指的影響;
人臉識別會受到化妝、穿著、遮蓋等的影響;
步態、擊鍵等可以人為控制;
在同時有多個人的聲音時,聲紋識別就無法工作;
靜脈、虹膜等則不太容易受環境影響或人為改變。
不同的圖像采集方法決定了能采集到的信息量和數據的準確程度。
通常需要用戶配合的采集方式,采集的數據比較完整和準確,但同時用戶體驗會不太好。
因為光線和角度會嚴重影響人臉的圖像采集,所以在銀行、高鐵的身份認證中,會要求用戶看鏡頭,并同時補光,確保得到可信的識別結果,完成自動、自助通關;在安防中用戶沒有感知,識別結果就僅供參考,需要人工確認。
指紋的采集方案中,電容方案的應用最廣,但射頻方案才擁有最高的準確性。
可以看出來,不同生物和行為特征所包含的信息量(唯一性)和信息的穩定性,基本上就決定了每種生物識別方法的準確性。
特征的生物學特性
生物識別還有兩個比較新的領域:基于心臟(心跳波形)的生物識別;基于體味的生物識別。目前都只有小樣本的實驗,沒有能夠證明唯一性、穩定性的統計數據
這可能也是為什么指紋、虹膜、掌紋的應用研究開展的比較早。2005年中科院就申請了在移動設備上可以使用的掌紋識別的專利。
但是為什么2010年后,人臉識別開始成為科技公司投資的熱點?畢竟從技術上看,人臉既不容易做到很好的識別效果,干擾因素又多。
4 人臉識別有什么優勢?
為什么“先天條件”不好的人臉識別,現在得到了最快的發展?
先說結論:技術的性能指標很重要,但易用性、可維護性對應用至關重要。
首先:人臉識別的“先天缺陷”可以解決,使技術滿足實用要求。
實用化.1:技術的限制可以規避。
從國際大賽公開的數據看,人臉識別目前準確率在99.8%,這意味著每1000個人,就有2個認錯或者不認識。這還是在實驗室,針對指定數據集的比賽結果,真實世界的情況可能幾十個人就會認錯一個。這肯定是沒法用的。
為什么我們在高鐵、機場已經可以刷臉入閘,好像也很順利呢?
這是因為在工程應用中,把1:N的問題轉換成了1:1的問題。通俗一些說,原本需要菊廠的HR看一眼,說出這人是我廠的誰誰誰,實際工作中變成了員工把工卡遞給HR,判斷這是不是我廠的誰誰誰。前者為了避免見誰都說不認識(拒真),標準只好稍微模糊一點;后者則可以提高標準仔細核對細節。
因此,刷臉入閘這樣人證核驗中,準確率可以做到99.99999%。
當然,標準提高會導致拒真率也升高,在高鐵閘機,也確實經常會遇到識別不通過的情況。但在人臉識別良好的交互體驗和結果的可驗證,使高拒真率不成為致命問題。
圖片來自網絡
實用化.2:相對優秀的用戶體驗。
在大部分的技術落地中,導致最后無疾而終的,通常不是技術問題徹底無法解決,而是沒有辦法做到良好的體驗,使用戶持續使用。
在接近20種生物識別的方法中,可以不需要用戶刻意主動配合就采集到生物特征信息的,有大概7種,其中人臉是唯一性和穩定性最好的一種。
識別準確率高的指紋、掌紋、虹膜、靜脈,都需要以用戶的主動配合為前提,其中,指紋、掌紋需要用戶直接觸摸采集器;虹膜、靜脈需要用戶靠近到距離采集儀20、30cm以內。
當發生拒真的時候,人臉識別的閘機,只需要用戶再看一眼攝像頭(順便吐個槽,拍出來實在難看),就可以重試,就算重復了好幾次,用戶也只會認為這機器太傻。
其他的采集方案就沒有這么友好了,用戶需要以正確的角度、距離、位置配合機器伸出手或頭,如果需要重復試,會顯得用戶自己很傻,十分容易引起抵觸。
解決了這一步還不夠,還需要有最終的人工兜底措施,防止極端的拒真情況。
特征的采集特點
小HUI觀點:指紋、掌紋的接觸式采集方式,很可能會限制它的適用場景。在個人設備、熟人的公用設備上通常不會有接受度的問題。但是在開放的公用設備上,相當比例的用戶會擔心采集儀被前面的用戶污染。此外,一些宗教原因也會導致的接受度的問題。
實用化.3:識別結果可解釋、可驗證。
在所有的生物識別方法中,人臉識別是唯一個可以人工的、不借助任何設備,就能完成結果驗證的方法。
這樣,當一個用戶無論如何都沒法通過自動身份認證的時候,還可以求助工作人員,轉由人工進行身份的確認,不會讓流程卡死。
規避技術限制 + 良好的用戶體驗 + 結果可解釋可驗證,使人臉識別滿足了實用的要求。
除了實用性,人臉識別的廣泛的應用還有兩個有利條件。
有利條件.1:比較容易取得客戶信任。
企業采用新技術對操作過程做自動化改造的時候,會需要一個建立信任的過程。
如果自動化流程中完全無法人工校驗、核對,在自動化流程卡殼、結果錯誤時,客戶也就沒有辦法自己確認是否真的有問題,問題的歸屬是軟件系統、客戶自采硬件還是用戶,那么建立信任的過程就會很漫長,被放棄的可能性也會很大。
人臉識別的結果可解釋、可驗證,這意味著用戶有機會介入自動化流程,這種透明、可控的狀態,對建立信任特別有用。即使需要多輪迭代才難最終滿足需求,由于過程中的客戶體驗良好,客戶也更能有耐心給與持續的支持。
有利條件.2:高性價比
人臉識別的前端設備是攝像頭,它有非常多元化的應用場景。
對于身份認證而言,人臉識別有先天缺陷,但人臉包含了其他特征沒有的信息,比如年齡、性別、風格、情緒,甚至行為、意圖(需要結合人體姿態信息)等。
這使得攝像頭在安防、工業、教育、辦公、零售、金融和個人消費電子等領域,都有廣泛的應用。
攝像頭的所有應用場景都要求攝像頭做到:高還原度、高分辨率、高可靠性。
一方面是規模效應吸引的大量玩家,一方面是旺盛的性能提升需求,這使得攝像頭幾乎是性價比最高的圖像類傳感器。
可以說,人臉識別的勝出,是市場和工程共同推進的結果。
5 應該怎么選擇?
雖然指紋獲得了最大的市場,人臉獲得了最多的投資,但生物識別的各項技術,還是各有用武之地。
安全防護的等級,是生物識別方法選擇的首要約束。
安全防護根據失效所造成的影響定級。
如果失效導致的可能影響比較小,比如:企業的主要工作流程不受影響,只是慢一些;對個人造成比較小的財產損失等,則系統只需要做到比較低的安全防護級別。
反之,如果失效導致的可能影響巨大,比如:企業的工作職能無法履行;造成大范圍的社會不良影響;出現嚴重法律問題等,則系統就需要做到比較高的安全防護級別。
生物識別的安全防護級別,取決于誤識率(把他認成你)和防偽性能(通過盜取、復制、仿冒等手段欺騙系統的可能性)。
特征的安全性
一般來說,暴露在體表的特征更容易被盜取、復制、仿冒。靜態特征比動態特征更容易仿冒。
小HUI認為,“聲紋支付”是安全級別和技術選擇錯配的典型——用戶通過語音控制音箱進行購物,通過聲紋驗證完成支付。認證的標準嚴格一些,用戶體驗不好;松一些,則可能造成經濟損失。
如果想要通過支付應用倒逼聲紋驗證的技術發展,在早期需要設置一個“安全旁路”——比如語音交互完成以后,用戶可以選擇在APP或PC上確認訂單。這樣,用戶嘗鮮的風險更小,更有可能持續使用。
工作環境和識別對象,影響生物識別方法的選擇。
室外、光線變化非常大的環境,步態就比人臉更能勝任全天候的工作。
粉塵、污染的環境,就無法使用指紋、靜脈、虹膜這樣相對精密的方案。
特殊工種,比如穿防護服后進行權限驗證、礦井的上下井打卡,就無法使用人臉和指紋。
文化和法規,限制生物識別方法的選擇。
在一些宗教國家,所有利用人體生物特征進行識別的方法,可能都不能使用,只能使用行為特征,比如簽名,來進行識別。
不同國家和地區有不同的隱私和敏感信息保護法規,相應的,諸如人臉識別這樣敏感的技術,應用范圍也會受限。(在歐洲,敏感信息是那些可以回溯到自然人的信息,人臉信息是首當其沖的敏感信息)
6 機會
身份認證會是數字化社會的基礎設施
隨著信息化的發展,每個人都將有一個數字化身份。數字公民包含一個自然人方方面面的信息,除了人臉、指紋、虹膜等生物特征,個人的社會活動如工作履歷、社工服務,以及財產、征信、健康情況,甚至還包含日常的經濟活動等。
隨著數字公民的信息完善,身份認證必然會被更廣泛的使用,未來的生活中,可能醫院、學校、辦公室、廠區、餐廳、商店、充電站、公交和地鐵站,甚至私家車、家庭都會有各式各樣的身份認證終端,每一個場所和設施,都可以根據個人的權限、特點和過往選擇,讓人得到更便捷、個性化的服務。
生物信息采集器在未來除了以獨立硬件的形態出現,更多還會作為一個模塊嵌入各種設備和設施中,作為用戶交互的一部分,和設備一起“running in the wild”,經歷日曬雨淋、嚴寒酷暑、油氣煙塵,甚至拍打等粗暴對待。
現在廣泛使用的人臉、指紋、靜脈技術,都還無法適應這樣的環境。想要解決這些問題,除了識別方法上需要繼續探索,更需要從工程層面去提升可靠性,實現多模態整合。
身份認證現在有一半以上是在金融領域使用,接下來政務和專業服務也會逐漸普及。但身份認證進一步向民生領域滲透之前,需要先解決安全性問題。
數字公民的安全挑戰
生物識別雖然好用,但是也有一個致命的隱患:不可撤銷。
如果你發現你的某個密碼被盜,你可以馬上修改。但如果你的指紋、虹膜、人臉的原始數據被非法存儲、攔截、盜取,你幾乎是永遠無法撤銷或者追回了,如果別人利用盜取的生物特征數據做了違法的事情,你可能還沒辦法證明那不是你干的!數字公民的數據量越大,盜取生物特性信息的利益也就越大。
現在生物信息采集器的標準,更多還是針對電、磁安全,對數據安全沒有做要求。未來一定會有相關的強制性國家標準,確保信息采集、傳輸、存儲的安全。能夠參與標準制定的企業,很可能能夠與生物信息數據中心更好交互,拿到第一波紅利。
多元應用場景
生物識別除了在身份認證、安防、客流分析上應用,現在也有很多其他有趣的應用案例。
個性化推薦——選擇困難癥的福音。物質極大豐富的今天,人們在選擇上花了更多的時間和金錢,個性化推薦或許可以幫人們“只選對的,不買貴的”。
在圖書館、書城投放的廣告機,可以根據人的性別、年齡、著裝風格等特征,推薦可能感興趣的書籍。有些美妝品牌推出的智能鏡,可以根據臉型、發型、膚色、風格推薦合適色號的唇膏,還可以“一鍵試妝”。在眼鏡、服裝、美業等行業,也有類似的案例。
二次元交互。基于人臉特征生成表情豐富的卡通頭像,基于面部變化生成唇部動作和語音同步的二次元視頻,基于人體動作捕捉在游戲中控制人物行為。
這些應用讓人機交互、社交活動更有趣味的同時,也較少暴露隱私。
擊鍵、簽名、眼部的識別,未來的心跳、體味識別,也都有潛力做出有趣的交互方式。
更多信息的挖掘。生物信息除了包含“我是誰”這樣的哲學信息,還隱藏“我怎么了”這樣的人文表達。通過面部可以識別情緒,通過姿態、筆跡、聲紋等了解身體的健康狀態。
小結
生物識別是每個人都會接觸到的AI。
個人便攜設備上的人臉、指紋的識別,理論上屬于可以被攻擊的技術。但是目前信息安全的所有攻防手段中,從個人設備的生物識別入手進行信息盜取,并不是一個容易操作的、經濟的選擇(從網絡側動手還是首選)。
因此生物識別通過手機、電腦上的指紋識別、人臉識別,成功的在用戶中留下了“既方便又安全”印象,突破了技術應用最初的信任障礙。
現階段,人臉識別由于工程實施難度小、用戶體驗好等優勢,得到了廣泛的應用,投資的熱度也很高,但是現在說勝負已分還太早。
一方面,當大部分人過分信任生物識別,個人的信息、財產通過一部手機就可以獲取的時候,從終端入手進行攻擊,就有可能是最優選項。那時,唯一性、穩定性、安全性都更好的虹膜、靜脈識別,應該也找到了改善體驗、適應各種環境和條件的方法,那時它們就可能重新變成身份認證的核心方法。
最好的智能不是“我說你做”,而是它發現你的需要,并把需要做的事情都做了。因此,生物識別最終會藏身于家居、汽車、工廠、醫院、學校、園區、辦公樓等社會的各個角落,深刻的改變人與物的關系。