人臉識(shí)別產(chǎn)業(yè)鏈上游為基礎(chǔ)層,包括人工智能芯片、算法技術(shù)和數(shù)據(jù)集;中游由視頻人臉識(shí)別、圖片人臉識(shí)別和數(shù)據(jù)庫(kù)對(duì)比檢驗(yàn)等技術(shù)層構(gòu)成,大體包括人臉檢測(cè)、活體檢測(cè)、人臉識(shí)別、視頻對(duì)象提取與分析等技術(shù);下游則是具體的場(chǎng)景應(yīng)用,即應(yīng)用方案、消費(fèi)類終端或服務(wù)等。下游以攝像頭為主的硬件采集端和應(yīng)用端采集人臉數(shù)據(jù),為數(shù)據(jù)集豐富數(shù)據(jù),對(duì)于基礎(chǔ)層算法的更新迭代形成正反饋。
目前,國(guó)外巨頭公司大多呈現(xiàn)全產(chǎn)業(yè)布局的特征,即上中下游均有布局。國(guó)內(nèi)人臉識(shí)別創(chuàng)業(yè)公司基本缺席上游的芯片和算法開發(fā)環(huán)節(jié),除了少量在中游有技術(shù)突破外,大多數(shù)集中于下游場(chǎng)景應(yīng)用層,這很大程度上得益于國(guó)內(nèi)龐大的應(yīng)用場(chǎng)景支持。
在具體的場(chǎng)景應(yīng)用商業(yè)化落地環(huán)節(jié),以BAT為代表的國(guó)內(nèi)互聯(lián)網(wǎng)巨頭,由于無法將計(jì)算機(jī)視覺的某一個(gè)子模塊拿出來單獨(dú)盈利。因此在應(yīng)用落地上并沒有明顯的優(yōu)勢(shì),而是創(chuàng)業(yè)公司突破能力更強(qiáng)。但互聯(lián)網(wǎng)巨頭擁有最大的數(shù)據(jù)源,人臉識(shí)別的后續(xù)發(fā)展動(dòng)力十足。
人臉識(shí)別產(chǎn)業(yè)鏈上游分析
人臉識(shí)別產(chǎn)業(yè)鏈上游,即基礎(chǔ)層,影響發(fā)展的三大要素是數(shù)據(jù)量、計(jì)算力和算法模型。2000年后,數(shù)據(jù)量的上漲、計(jì)算力的提升和深度學(xué)習(xí)算法的出現(xiàn)促進(jìn)了計(jì)算機(jī)視覺行業(yè)的發(fā)展。作為計(jì)算機(jī)視覺中重要的人臉識(shí)別,以攝像頭為主的采集終端的大規(guī)模普及帶來了數(shù)據(jù)量的增長(zhǎng),深度學(xué)習(xí)算法的出現(xiàn)可以實(shí)現(xiàn)精準(zhǔn)的識(shí)別功能。
此外,云計(jì)算技術(shù)、服務(wù)器和人工智能芯片等相關(guān)硬件性能的提升,對(duì)于處理數(shù)據(jù)的計(jì)算力有很強(qiáng)的助力作用,從而人臉識(shí)別應(yīng)用方案走入人們的生活成為現(xiàn)實(shí)。
而在算法領(lǐng)域,算法領(lǐng)域,美國(guó)互聯(lián)網(wǎng)巨頭谷歌、FACEBOOK、微軟都推出了深度學(xué)習(xí)算法開源平臺(tái),在深度學(xué)習(xí)算法方面有著明顯的技術(shù)優(yōu)勢(shì)。
2016年以來,以谷歌、微軟為首的巨頭為了搶占市場(chǎng),將自己研發(fā)的算法技術(shù)進(jìn)行開源,導(dǎo)致很多企業(yè)免去人工智能基礎(chǔ)技術(shù)研發(fā)投入,只需要采用開源算法或經(jīng)過訓(xùn)練的人工智能芯片,再結(jié)合行業(yè)數(shù)據(jù)進(jìn)行訓(xùn)練,就可開展行業(yè)應(yīng)用落地。與之對(duì)比,百度PaddlePaddle是國(guó)內(nèi)巨頭中唯一開放的深度學(xué)習(xí)算法開源平臺(tái)。
人臉識(shí)別產(chǎn)業(yè)鏈中游分析
中游人臉識(shí)別技術(shù)的進(jìn)步,是推動(dòng)下游場(chǎng)景應(yīng)用拓展的關(guān)鍵所在。目前,人臉識(shí)別市場(chǎng)的解決方案主要包括2D識(shí)別、3D識(shí)別技術(shù)。
市場(chǎng)上主流的識(shí)別方案是采用攝像頭的2D方案,但由于人的臉部并非平坦,因此2D識(shí)別在將3D人臉信息平面化投影的過程中存在特征信息損失。3D識(shí)別使用三維人臉立體建模方法,可最大程度保留有效信息,因此3D人臉識(shí)別技術(shù)的算法比2D算法更合理并擁有更高精度。
人臉識(shí)別產(chǎn)業(yè)鏈下游分析
人臉識(shí)別對(duì)場(chǎng)境要求非常強(qiáng),產(chǎn)品能否達(dá)到實(shí)際使用要求,核心并不只在于算法本身,還在于對(duì)場(chǎng)景的深耕。算法水平對(duì)于識(shí)別率的有力證明,也僅僅是停留在訓(xùn)練集與測(cè)試集之間,存在于實(shí)驗(yàn)室的“理論數(shù)值”。
而現(xiàn)實(shí)生活中人臉的獲取過程有大量不可控因素,光的方向、強(qiáng)度,是否有胡須、發(fā)型的變化,是否有表情都會(huì)影響識(shí)別效果。多種因素疊加后,真實(shí)環(huán)境下測(cè)得的準(zhǔn)確率可能只有75%左右,甚至更低。
因此,需要針對(duì)場(chǎng)景的不同特點(diǎn)收集大量場(chǎng)景數(shù)據(jù),不斷調(diào)試參數(shù)、組合算法、方法,甚至使用外圍硬件輔助以提升效果,不斷迭代以實(shí)現(xiàn)產(chǎn)品化。除此之外,還要在工程上滿足計(jì)算量、延遲、可維護(hù)性等需求。
(內(nèi)容來源:前瞻產(chǎn)業(yè)研究院)
來源:幫尼資訊