商湯研究院院長王曉剛?cè)涨氨硎?2014年人工智能(AI)人臉識別技術(shù)的準(zhǔn)確率首次超過人眼準(zhǔn)確率,但目前誤差率已經(jīng)可以達(dá)到億分之一。機(jī)器做人臉識別如果相當(dāng)于一個4位元口令,現(xiàn)在則相當(dāng)于一個8位元的口令,人臉識別4年內(nèi)準(zhǔn)確度已經(jīng)提升了4個數(shù)量級。
商湯研究院院長王曉剛?cè)涨霸凇堵槭±砉た萍荚u論》新興科技峰會上發(fā)表了題為「AI賦能下的當(dāng)下與未來」演講,闡述了人工智能如何通過云和端改變生活和未來。
王曉剛回顧在過去的十年里,人工智能飛速發(fā)展最杰出的代表就是深度學(xué)習(xí)。其中有三個推動深度學(xué)展的因素:一是大數(shù)據(jù),二是云端計算能力包括了GPU和AI芯片,三是深度學(xué)習(xí)算法不斷創(chuàng)新。
王曉剛舉例,2014年時機(jī)器做人臉識別可以達(dá)到萬分之一的誤差率;而現(xiàn)在誤差率可以達(dá)到億分之一。換句話說,機(jī)器做人臉識別如果相當(dāng)于一個4位元口令,現(xiàn)在則相當(dāng)于一個8位元的口令,人臉識別性能已經(jīng)提升了4個數(shù)量級。
隨著算法的提升,應(yīng)用邊界不斷擴(kuò)大,從最開始1:1身份的比對,到后來動態(tài)布控,如抓捕在逃嫌疑人。現(xiàn)在可以在整個城市范圍內(nèi),從上千億的圖象中去搜索人臉,恢復(fù)人的活動軌跡。這樣高的準(zhǔn)確率實(shí)際上得益于神經(jīng)網(wǎng)絡(luò)的強(qiáng)大,通過訓(xùn)練超過1,200層的神經(jīng)網(wǎng)絡(luò),從而超過人眼識別的能力。
神經(jīng)網(wǎng)絡(luò)已經(jīng)從2012年的5層,發(fā)展到現(xiàn)在的1,200層這樣一個過程,其網(wǎng)絡(luò)的復(fù)雜度、深度也在不斷的提升。但是為何在前端應(yīng)用的時只用一個很小的網(wǎng)絡(luò),后臺卻需要訓(xùn)練1,200層這么大的網(wǎng)絡(luò)?
王曉剛指出,原因是為了得到一個很小、但是識別率很高的網(wǎng)絡(luò),你首先需要得到一個非常深、非常強(qiáng)的網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。他比喻,這個小的但是識別率高的網(wǎng)絡(luò),就好比是一個小學(xué)生,資料就好比是書籍。
若是直接讓一個小學(xué)生,從大量的書籍當(dāng)中提取知識,這是一件非常困難的事,首先要找到一個老師,老師有非常強(qiáng)的學(xué)習(xí)能力,這就是1,200層網(wǎng)絡(luò)。它首先能夠從海量的資料里面,把知識提取出來,然后通過知識傳播的方式去教更小的網(wǎng)絡(luò),讓其達(dá)到很好的識別性能。
算法的提升可以帶來非常多的應(yīng)用,能讓城市變得更加安全。比如,有罪犯十幾年前隱姓埋名,就算改了身份證,最終還是被動態(tài)人臉布控系統(tǒng)所捕捉;此外公安局利用人臉識別系統(tǒng)結(jié)合城市里幾萬個攝像頭,能夠成功找到走丟的老人或孩童。
以商湯這幾年累積的成果來看,2014年能夠用20萬人臉來對機(jī)器進(jìn)行訓(xùn)練做到了98.5%的準(zhǔn)確率,而人是97.5%;2015年用30萬人臉進(jìn)行訓(xùn)練,達(dá)到了99.55%的準(zhǔn)確率;2016年用6,000萬人臉訓(xùn)練可以達(dá)到了百萬分之一的誤識率;2017年用20億人臉訓(xùn)練可以達(dá)到一億分之一的誤識率,這樣的誤識率才已可以真正地應(yīng)用到各行各業(yè)。
在硬件方面,王曉剛也提及商湯與高通(Qualcomm)的戰(zhàn)略合作,他認(rèn)為如果人工智能想要普及,那么AI就要走到前端設(shè)備。而這些前端設(shè)備都離不開芯片。目前商湯的人臉解鎖技術(shù)已經(jīng)被超過上億的手機(jī)用戶使用,都要靠高通的芯片支持。