服務(wù)熱線：13728883399
wangyp@shangeai.com

AI 算法已趨同？億分之一的人臉識別辨識度意味著什么？

時(shí)間：2018-05-21 17:47:24點(diǎn)擊：440次

來源:2018 中國圖靈大會

演講人:朱瓏(依圖科技聯(lián)合創(chuàng)始人、CEO)

【新智元導(dǎo)讀】主題為“引領(lǐng)人工智能,創(chuàng)造無限可能”的2018年中國圖靈大會5月19日在上海召開,于1966年由國際計(jì)算機(jī)協(xié)會(ACM)設(shè)立的“圖靈獎”,當(dāng)之無愧是計(jì)算機(jī)界最負(fù)盛名、最崇高的獎項(xiàng),因而有“計(jì)算機(jī)界的諾貝爾獎”之稱。今年的中國圖靈大會,更是匯聚了學(xué)界、業(yè)界的“最強(qiáng)大腦”,嘉賓陣容可謂豪華。在5月19日的論壇上,依圖CEO朱瓏博士給大家?guī)砹艘粓錾羁潭职l(fā)人深省的關(guān)于AI時(shí)代的演講。

在美國學(xué)習(xí)工作了十年之后,2012年的朱瓏回國創(chuàng)立依圖,也成為這一代AI創(chuàng)業(yè)的典型代表。他的履歷上來看有幾段重要的經(jīng)歷,第一段是在UCLA的博士時(shí)期做統(tǒng)計(jì)建模和統(tǒng)計(jì)學(xué)計(jì)算,師從艾倫·尤爾,艾倫的博士導(dǎo)師正是著名的理論物理學(xué)家霍金;然后在MIT的AI Lab做計(jì)算機(jī)視覺建模相關(guān)領(lǐng)域的博士后研究員;最后一段則是回國前,在深度學(xué)習(xí)爆發(fā)之前的NYU的Yann Lecun實(shí)驗(yàn)室做研究員。

在2012年之前,很少有人會說自己是做AI的,只會說做統(tǒng)計(jì)建模、統(tǒng)計(jì)學(xué)習(xí)這些具體的方向。但從2016年AlphaGo登上《自然》雜志,到美國著名的《經(jīng)濟(jì)學(xué)人》雜志多期報(bào)道,AI頻繁登上世界最著名的雜志成為封面主題,如今已經(jīng)進(jìn)入了一個言必稱AI的時(shí)代。與AI相關(guān)的各種言論,關(guān)于機(jī)器學(xué)習(xí)、圖像識別、無人車、健康醫(yī)藥等等都逐步成為熱點(diǎn)。而朱瓏一直關(guān)注的是未來到底AI能發(fā)生一些什么?

沒有權(quán)威的時(shí)代讓AI正變得真假難辨

在朱瓏的演講中,他提到目前AI跟過去比較重大的區(qū)別:因?yàn)锳I發(fā)展太快,現(xiàn)在技術(shù)處于一個很難辨別真假、好壞的時(shí)代。以深度學(xué)習(xí)為代表新的AI技術(shù),因?yàn)檫^去參與的人和實(shí)踐不多,全球性研究的大規(guī)模以及長時(shí)間的積累并不夠。因?yàn)樘盁帷?使得各方都熱衷參與到AI的討論,交流甚至宣傳當(dāng)中,AI的觀點(diǎn)就變得非常多,這客觀上使得很多專家真正有見地的意見和其他的言論很難區(qū)分開來,這不僅是中國,在美國也是同樣。

另外一個則是:技術(shù)到了一個沒有權(quán)威的時(shí)代。過去不管是從計(jì)算機(jī)視覺,還是整個人工智能領(lǐng)域,最好的實(shí)驗(yàn)室?guī)缀跄軌驂艛囝A(yù)測全球百分之七八十的進(jìn)展,但是現(xiàn)在AI無論是在美國,還是在中國或歐洲,大家的發(fā)展是比較跳躍性的,在一兩個實(shí)驗(yàn)室非常難預(yù)測主流到底在關(guān)注什么。這是整個時(shí)代的特點(diǎn)。

朱瓏的背景是跨越學(xué)術(shù)界和工業(yè)界的創(chuàng)業(yè)典型,經(jīng)歷了中國2012年到2018年這五、六年非常特殊的階段,正如他在演講中提到的,過去中國沒有成熟的科技創(chuàng)業(yè)的情景和市場機(jī)制。過去,政府、投資者、媒體這三者可以頻繁交流,在2012年之前,學(xué)術(shù)界不像今天這樣經(jīng)常會被政府或一流基金邀請交流。美國則因?yàn)槭袌龀墒?這些人經(jīng)常會在一起交流,甚至都是朋友。中國這幾年開始,各種背景的人在一起交流的越來越多,這是新的形態(tài)。

技術(shù)突破打開了工業(yè)界應(yīng)用的突破

技術(shù)上,2015年,機(jī)器識別人臉的水平正式超過人類。人臉識別中機(jī)器比人強(qiáng),最簡單基礎(chǔ)應(yīng)用就是1:1的比對,證明你就是你,大家熟知的是2017年iPhone推出的刷臉開機(jī);其次是1:N,是通過任一設(shè)備里捕捉到的人臉,從一個省(億級)或一個國家的人像庫(十億級)里來回答你是誰,這對識別性能的要求提升了一個量級,是千倍萬倍地增長。這意味著識別技術(shù)的突破,打開了工業(yè)界中的產(chǎn)品的突破。

2012年之前,可以認(rèn)為人臉識別技術(shù)幾乎沒有什么發(fā)展,2017年人臉識別最高水平可識別規(guī)模在20億人,大概比2016年可識別千萬提高兩百倍,比2015年提高了數(shù)萬倍。那未來的發(fā)展到底是什么樣?會不會再10倍、100倍甚至萬倍地發(fā)展?

大家現(xiàn)在也有個討論,技術(shù)是不是發(fā)展到了瓶頸?各項(xiàng)算法之間有沒有區(qū)別?隨著AI熱潮的涌現(xiàn),各家AI公司都會頻繁參加一些業(yè)界的比賽以證明自己的算法實(shí)力,以人臉識別算法為例,可以看到各AI公司在LFW等類似的計(jì)算機(jī)視覺比賽中都取得99.xx%的成績。于是人們會問:AI算法是否已經(jīng)趨同了?如果算法精度差別不大(只有幾個百分點(diǎn)),是否意味著創(chuàng)業(yè)公司的技術(shù)已經(jīng)同質(zhì)化了,沒有技術(shù)創(chuàng)業(yè)的核心競爭力了呢?

但實(shí)際上,這是典型的認(rèn)知誤區(qū)。我們在朱瓏的演講中看到了一張表,可能更準(zhǔn)確的回答了這個問題,這是中國某省1億人像庫的情況下,真實(shí)的刑偵案件的破案環(huán)境的性能測試對比的表,參與方是知名的幾大人臉識別公司:

我們可以這樣理解這張圖:必須對應(yīng)場景來談算法精度。不同場景的算法精度不具備任何可比性,甚至不代表有相關(guān)性。換句話說在簡單場景下算法精度高,不代表在復(fù)雜的高難度場景下有更大的概率可以把算法精度做高,就比如在小學(xué)生的考試中拿滿分,不見得可以在大學(xué)的考試中也拿滿分。因?yàn)楹芏鄬W(xué)術(shù)界的比賽使用的都是公開數(shù)據(jù)集,數(shù)據(jù)集內(nèi)多是互聯(lián)網(wǎng)照片,類似于難度小的開卷考試,大家很容易把測試成績刷到比較高。但在實(shí)際的應(yīng)用中則會遇到各種高難度場景,包括變形、昏暗、逆光、強(qiáng)光、光照不均、低清、運(yùn)動模糊、遮擋、跨年齡段比對等,在這種情況下各家的差距迅速拉開了,第二名和第一名的錯誤率都會相差幾倍以上,遠(yuǎn)未到趨同的程度。

第二,這些實(shí)戰(zhàn)中的技術(shù)差距體現(xiàn)在具體產(chǎn)品或應(yīng)用上,不是簡單的好用和一般好用的差距,而是可用和不可用的差距。實(shí)戰(zhàn)中是要以最高效率解決實(shí)際問題為目的的。在一個1億級別人像系統(tǒng)中進(jìn)行1:N的靜態(tài)比對時(shí),錯誤率相差幾倍,就導(dǎo)致使用者做事效率下降幾倍,那么自然而然,即使他使用的是一個多算法平臺,他也只會傾向于使用第一名的算法。

AI幫助探索人類智慧的邊界

AI除了在產(chǎn)業(yè)界的實(shí)際應(yīng)用外,更能夠幫助我們理解人類的智慧、人類智慧的邊界。

我們以前是沒辦法了解人類自己識別能力的規(guī)模和精度,到底是什么程度?過去沒法做這個科學(xué)實(shí)驗(yàn),1萬人還是10萬人你辨別不出來。而機(jī)器在大規(guī)模的情況下,很輕易地識別1億人、10億人,甚至更多的時(shí)候,機(jī)器識別就相當(dāng)于提供了一把尺子,根據(jù)相似度比例篩選出來給人去測,可以在有效的時(shí)間里面,測出一個人自己“看”這個世界的能力。

這是人類第一次有一個非常穩(wěn)定且強(qiáng)大的機(jī)器,有識別能力看到人和機(jī)器智能差別到什么程度。依圖曾做過一個實(shí)驗(yàn),在幾千萬量級的身份數(shù)據(jù)庫上,一個人把他女朋友生活照輸入進(jìn)去,在機(jī)器輸出相似度前十的照片中,他是非常難辨別哪張是他的女朋友。過去機(jī)器認(rèn)識生人的能力比人強(qiáng),但是今天機(jī)器識別熟人臉的能力也超越人了。

今天機(jī)器是有了高性能的,比人類大很多倍的這種識別能力,能夠幫助我們回答這些更有趣的問題:在13億中國人中有多少人跟你長的一模一樣?一模一樣我們可以先定義為自己的媽媽辨別不出來誰是誰。經(jīng)過依圖的實(shí)驗(yàn),結(jié)果是,每1億人當(dāng)中有一個人跟你長的一樣,所以全中國差不多12個人跟你長的一模一樣的。

這個意味著什么? 1億人當(dāng)中有一個人跟你長的像,這又意味著什么?

人類進(jìn)化過程中,視覺識別能力在各大感官中的比重越來越大,也可能是人類穿衣服,嗅覺識別家庭成員的能力在哺乳動物中比較低下,主要是看人臉來辨別同類。選擇壓力驅(qū)使人類的臉之間的區(qū)分度需要盡量的大,這樣保證家庭成員的穩(wěn)定性得到保障。

而人作為社群動物,需要和大量同類打交道,臉部識別錯誤的代價(jià)是失去整個基因組的遺傳繼承。對應(yīng)的編碼人臉形狀的基因數(shù)量需要很大,目前知道有一條染色體的一大塊用于編碼臉部特征。一億分之一的識別度是一個具有巨大社會學(xué)意義的統(tǒng)計(jì)數(shù)值,背后更多的生物學(xué)意義需要更近一步探討。與之對應(yīng)的一個未經(jīng)實(shí)驗(yàn)證實(shí)的觀察是,動物的臉部特征區(qū)分度不像人類這么大。比如貓和狗,光看臉,我們很不容易區(qū)分出來。

臉部信息對于身份的確認(rèn)是非常重要的,人類如果不具備辨別能力,出門回來之后你認(rèn)不出你的小孩、老婆,就會出現(xiàn)社會的騷亂,所以說人臉識別對基因的進(jìn)化有非常巨大的影響。

---------------

1950年圖靈發(fā)表《計(jì)算機(jī)器與智能》,提出著名的“圖靈測試”,成為人工智能的思想起源,而在2018年的圖靈大會中,依圖朱瓏博士的演講也給我們打開了認(rèn)知人工智能現(xiàn)狀和未來的一扇窗戶,在嘈雜的言論中給我們更多的啟發(fā)和思考。期待聽到更多這樣的演講。

來源：新智元

標(biāo)簽:

打印

AI 算法已趨同？億分之一的人臉識別辨識度意味著什么？

AI 算法已趨同？億分之一的人臉識別辨識度意味著什么？