近日,人臉識別技術(shù)因多次在抓逃犯的過程中“立功”,再度走“紅”。從20世紀60年代起,人臉識別研究開啟,發(fā)展到今天有哪些進展?該產(chǎn)業(yè)里的競爭,是人工智能投資泡沫帶來的浮躁,還是市場規(guī)模將持續(xù)突進?
何謂人臉識別技術(shù)?
20世紀60年代,人臉識別工程化應(yīng)用研究正式開啟。初期的方法主要利用了人臉的幾何結(jié)構(gòu),通過分析人臉器官特征點及其之間的拓撲關(guān)系進行辨識。這種方法簡單直觀,但是一旦人臉姿態(tài)、表情發(fā)生變化,則精度嚴重下降。
如今的解決方案多是基于主動近紅外圖像的多光源人臉識別技術(shù)。它可以克服光線變化的影響,已經(jīng)取得了卓越的識別性能,在精度、穩(wěn)定性和速度方面的整體系統(tǒng)性能超過三維圖像人臉識別。
劃重點!
人臉識別技術(shù)原理:
一是建立一個包含大批量人臉圖像的數(shù)據(jù)庫;
二是通過各種方式來獲得當前要進行識別的目標人臉圖像;
三是將目標人臉圖像與數(shù)據(jù)庫中既有的人臉圖像進行比對和篩選。
人臉識別技術(shù)流程:
(全球物聯(lián)網(wǎng)觀察制圖)
圖像的采集與預(yù)處理
人臉圖像的采集一般分為兩種途徑,有人臉圖像的批量導(dǎo)入和人臉圖像的實時采集;預(yù)處理的目的是在系統(tǒng)對人臉圖像的檢測基礎(chǔ)之上,對人臉圖像做出進一步的處理以利于人臉圖像的特征提取。
人臉檢測
人臉檢測方法可分為三類,分別是基于膚色模型的檢測、基于邊緣特征的檢測、基于統(tǒng)計理論方法。
人臉特征提取
目前主流的人臉識別系統(tǒng)可支持使用的特征通??煞譃槿四樢曈X特征、人臉圖像像素統(tǒng)計特征等,而人臉圖像的特征提取就是針對人臉上的一些具體特征來提取的。
人臉識別和活體鑒別
實際的人臉識別系統(tǒng)一般需要增加活體鑒別環(huán)節(jié),因為生物特征識別的共同問題之一就是要區(qū)別該信號是否來自于真正的生物體,這種信號包括要求人左右轉(zhuǎn)頭,眨眼睛,開開口說句話等。
技術(shù)不斷發(fā)展
市場上應(yīng)用最多的是三種方案,包括3D結(jié)構(gòu)光方案、ToF 3D方案和雙目立體成像方案。
3D結(jié)構(gòu)光技術(shù)
3D結(jié)構(gòu)光技術(shù)(Structured Light)是通過光學(xué)手段獲取被拍攝物體的三維結(jié)構(gòu),再將獲取到的信息進行更深入的應(yīng)用。這種方案在未來將很有前景,可拓展空間更加廣闊,比如5G通信、AR以及其他與3D建模等相關(guān)的領(lǐng)域都可以發(fā)揮它獨有的關(guān)鍵作用。
例如,iphone x/xr/xs/xsmax、oppo Find x、mate20pro等都是采用了3D結(jié)果光技術(shù)原理。
3D 結(jié)構(gòu)光也有它的局限,相比傳統(tǒng)的攝像頭,3D 結(jié)構(gòu)光可以工作的距離要短一些,最長距離一般在 1 米左右,OPPO給出的數(shù)據(jù)是60cm遠精度也能控制在±1mm范圍。
ToF
ToF(Time Of Flight,時差測距技術(shù)),簡單來說,是指發(fā)出一道經(jīng)過處理的光,碰到物體以后會反射回來,捕捉來回的時間,因為已知光速和調(diào)制光的波長,所以能快速準確計算出到物體的距離。
ToF技術(shù)的普及與發(fā)展指日可待,vivo已經(jīng)搶占先機,而且蘋果分析師也曾預(yù)測2019年iPhone也許會有重大創(chuàng)新就包括采用ToF技術(shù)。
雙目立體成像
雙目立體成像(Stereo System)是利用雙攝像頭拍攝物體,再通過三角形原理計算物體距離。已經(jīng)上市的華為nova3采用的就是雙目3D人臉識別方案。
雙目方案的原理最簡單,成本也比較低。
技術(shù)發(fā)展方向
結(jié)合三維信息:二維和三維信息融合使特征更加魯棒多特征融合
多特征融合:單一特征難以應(yīng)對復(fù)雜的光照和姿態(tài)變化
大規(guī)模人臉比對:面向海量數(shù)據(jù)的人臉比對與搜索
深度學(xué)習(xí):在大數(shù)據(jù)條件下充分發(fā)揮深度神經(jīng)網(wǎng)絡(luò)強大的學(xué)習(xí)能力
我國人臉識別主要企業(yè)
在我國從事人臉識別的企業(yè)有很多,包括騰訊、四川川大智勝、上海閱面科技、北京獵戶星空、北京飛搜科技、珠海人人智能等等。以下列舉這條產(chǎn)業(yè)鏈上的一些主要企業(yè),排名不分先后。
1.北京曠視科技
業(yè)務(wù):FaceID 在線身份驗證服務(wù)、Face++ 人工智能開放平臺、智能地產(chǎn)解決方案、智能安防解決方案
特點:動態(tài)人臉識別、在線/離線活體檢測、超大人像庫實時檢索、證件識別、行人檢測、軌跡分析
曠視科技團隊成員除了幾名來自清華校友外,還有來自美國哥倫比亞大學(xué)、英國牛津大學(xué)和美國南加州大學(xué)的科研及開發(fā)人員,截至目前員工僅有100余人。
2016年獲得上億元C輪融資,最后選擇通過計算機視覺技術(shù)與NLP技術(shù)的結(jié)合,制造出能“識別萬物”的智能機器人,提供硬件模組,里面內(nèi)置他們家的算法。目前,他們正在準備啟動IPO的步伐,VIE架構(gòu)讓他們得以繞過A股,不用達到連續(xù)三年盈利的標準實現(xiàn)快速上市。
2. 北京商湯科技
業(yè)務(wù):智慧金融、智慧商業(yè)、智慧安防、互聯(lián)網(wǎng)+
特點:人臉技術(shù)、智能監(jiān)控、圖像識別、文字識別、圖像及視頻編輯、深度學(xué)習(xí)框架
SenseTime(商湯科技),獲IDG資本投資,主攻金融、移動互聯(lián)網(wǎng)、安防監(jiān)控三大行業(yè)。其主要案例是圍繞各個美化軟件與直播平臺制作人臉貼圖,重點強化了人臉識別的關(guān)鍵點檢測及跟蹤技術(shù)。目前,商湯從toC轉(zhuǎn)向toB領(lǐng)域。
3. 廣州云從科技
業(yè)務(wù):快速部署平臺、智能硬件、智能系統(tǒng)
特點:人臉信息檢測、特征提取融合、質(zhì)量屬性分析、人臉相似度比對、特征相似度對比、ocr識別
2015年4月,周曦拿到戰(zhàn)略投資成立云從科技,同年針對金融和銀行業(yè)推出了40多種解決方案,包含從算法、產(chǎn)品、銷售、售后的全產(chǎn)業(yè)鏈打造,針對農(nóng)行、建行、交行、中行及多地公安提供定制化服務(wù)。
團隊成員除了來自中科大的校友外,還來自中國科學(xué)院各大研究所、UIUC、IBM、NEC、MicroSoft等全球頂尖學(xué)府及研究機構(gòu)。
4. 上海依圖科技
業(yè)務(wù):智能安防平臺、城市數(shù)據(jù)大腦、智慧醫(yī)療健康、智能硬件設(shè)備
特點:計算機視覺、自然語言理解、知識推理、智能硬件、機器人技術(shù)
依圖科技從圖像識別入手,首先與全國省市級公安系統(tǒng)合作,對車輛品牌、型號等進行精準識別,隨后擴展到人像識別,通過靜態(tài)人像比對技術(shù)和動態(tài)人像比對技術(shù),協(xié)助公安系統(tǒng)進行人員身份核查、追逃、監(jiān)控、關(guān)系挖掘等。
6年多來,依圖科技的產(chǎn)品已經(jīng)應(yīng)用到全國二十多個省市地區(qū)的安防領(lǐng)域,安防領(lǐng)域之外,依圖也進入智慧城市領(lǐng)域和健康醫(yī)療領(lǐng)域,它要協(xié)助政府構(gòu)建"城市大腦",也希望將醫(yī)療領(lǐng)域的巨大知識鴻溝縮小,改善醫(yī)患體驗。
5. 北京漢王科技
業(yè)務(wù):個人和家庭相關(guān)的電子產(chǎn)品、企業(yè)和辦公相關(guān)的電子產(chǎn)品
特點:手寫技術(shù)、OCR技術(shù)、鍵盤技術(shù)、公式識別、輸入法
漢王科技曾助力銀川市政府應(yīng)用生物識別技術(shù)打造智慧政務(wù)平臺,助力杭州市國稅局實現(xiàn)人臉生物識別比對技術(shù)開展”刷臉“辦稅。其技術(shù)授權(quán)已與華碩、海爾、長虹、海信、平安銀行等達成合作。
6. 合肥科大訊飛
業(yè)務(wù):語音引擎、教育產(chǎn)品、手機應(yīng)用、互動音樂
特點:語音識別及合成技術(shù)、自然語言處理技術(shù)、語音評測技術(shù)、聲紋識別技術(shù)、手寫識別技術(shù)
科大訊飛聯(lián)合香港中文大學(xué)污曉鷗教授團隊,共同推出世界領(lǐng)先的人臉識別技術(shù),提供人臉驗證、在線/離線人臉檢測和人臉關(guān)鍵點檢測等功能,聯(lián)合中國銀聯(lián)和微商銀行發(fā)布”聲紋+人臉“融合認證個人轉(zhuǎn)賬應(yīng)用,科大訊飛在用的身份認證考勤,全國各地分公司通過APP進行”人臉+聲紋“打卡即可。
7. 湖南視覺偉業(yè)
業(yè)務(wù):智能安防平臺、城市數(shù)據(jù)大腦、智能醫(yī)療健康、智能硬件設(shè)備
特點:人車云智能識別系統(tǒng)、人臉識別、圖像增強處理引擎、人臉自動老齡化推算、前端到云端的計算架構(gòu)
視覺偉業(yè)依托于國防科大生物識別技術(shù)及一流的研發(fā)團隊。它的人臉識別卡口系統(tǒng)已在長沙坡子街、兩館一廳、國際會展中心等重點區(qū)域得到系統(tǒng)的運用。
8. 百度
業(yè)務(wù):智能零售、地產(chǎn)物業(yè)、智能工廠、智能政務(wù)、信息服務(wù)
特點:人臉屬性分析、人臉對比、人臉檢索、活體檢測、離線識別SDK
百度內(nèi)部正在使用人臉識別閘機,2016年11月與烏鎮(zhèn)景區(qū)合作,游客刷臉便可自由進出景區(qū);與首都機場簽訂協(xié)議,未來首都機場將實現(xiàn)刷臉登機;與“寶貝回家”公益平臺合作利用人臉識別尋找走失兒童。
9. 阿里
特點:人臉檢測定位、人臉屬性識別、人臉對比、人臉查找1:N
(阿里人臉識別產(chǎn)品計費說明)
阿里的“人臉識別技術(shù)”早已應(yīng)用于政務(wù)、金融、消費等多元場景。阿里云數(shù)加平臺提供的人臉服務(wù)分為三個獨立的模塊,提供三個獨立的API,模塊之間可以通過API參數(shù)來進行自由組合,不同的模塊及組合可以實現(xiàn)不同的人臉技術(shù)功能?;谏疃葘W(xué)習(xí)和海量人臉標注數(shù)據(jù),再加阿里云的技術(shù)實力,能夠提供穩(wěn)定、可靠的大流量服務(wù)。
10. 深圳云天勵飛
特點:數(shù)據(jù)采集、算法訓(xùn)練、算法升級
云天勵飛是一家專注于視覺人工智能領(lǐng)域的公司,致力于打造基于視覺芯片、深度學(xué)習(xí)和大數(shù)據(jù)技術(shù)的“視覺智能加速平臺”。自 2015 年年底開始,云天勵飛與華為合作搭建出一個云端一體的人臉識別抓拍系統(tǒng)。目前,它即將完成B輪融資,估值近100億元,有望成為深圳本土AI獨角獸。
寫在最后
隨著人工智能的發(fā)展,在全球信息化、云計算、大數(shù)據(jù)的背景下,生物識別技術(shù)的應(yīng)用面會越來越大。其中人臉識別技術(shù)會朝著網(wǎng)絡(luò)化、云技術(shù)、多模式融合的趨勢發(fā)展。
國內(nèi)外巨頭紛紛加碼人臉識別技術(shù),我國相關(guān)集成應(yīng)用的企業(yè)就有數(shù)百家,至于誰家算法更勝一籌,并不是重點問題。此時,我們是否要考慮:避免熱點過度炒作,企業(yè)推出真正符合用戶需求、市場所需的技術(shù)服務(wù),才是關(guān)鍵所在?
原文標題:一文讀懂人臉識別技術(shù)
文章出處:【微信號:BIEIqbs,微信公眾號:北京市電子科技情報研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。