BuzzFeed的人類們,一路喜歡搞事情。
自從亞馬遜的人臉識(shí)別系統(tǒng)Rekognition,把28位美國(guó)議員認(rèn)成了罪犯,他們就決定親自實(shí)驗(yàn)一下。
不過,BuzzFeed測(cè)試的不是這套系統(tǒng),而是同屬亞馬遜的一個(gè)名人識(shí)別AI。
把FBI通緝犯的507幅圖像拿去給AI匹配。
△ 畫家Bob Ross與通緝令上的Mike W. Jackson
結(jié)果,吉他手啊,演員啊,畫家啊,紛紛與通緝犯高分匹配成功。AI一共完成了17次置信度 (Confidence) 95%以上的匹配。
在另外一項(xiàng)用NIST臉部數(shù)據(jù)集做的測(cè)試?yán)?AI還把美國(guó)前國(guó)務(wù)卿賴斯,和一非裔男子被捕后的照片,匹配在了一起,置信分是96%。
機(jī)智的你可能發(fā)現(xiàn)了,重點(diǎn)不在明星和通緝犯的匹配,卻在于這些匹配并非勉勉強(qiáng)強(qiáng)拉個(gè)人湊數(shù),而是AI很有信心的答案。
為什么會(huì)這樣?BuzzFeed也想知道,于是聯(lián)系了亞馬遜。
亞馬遜:這不是人臉識(shí)別
得到的答復(fù),可能比實(shí)驗(yàn)結(jié)果,還要讓人驚喜。
亞馬遜說,別看名人AI是作為Rekognition的一次更新,發(fā)布出來的,它們兩個(gè)其實(shí)是完全不同的產(chǎn)品啊。
名人AI是個(gè)娛樂產(chǎn)品,會(huì)在社交網(wǎng)絡(luò)或者搞笑App這樣的地方出現(xiàn)。
所以,它要做的就是給出更多相似的組合。
比如,加勒比海盜的杰克船長(zhǎng),畫了很濃的妝,跟強(qiáng)尼戴普平時(shí)的樣子相差不少。
即便這樣,名人AI還是會(huì)給你一個(gè)很高的置信分,告訴你他們兩個(gè)是同一個(gè)人。
而同樣的一組圖,喂給Rekognition的話,兩者匹配的置信分?jǐn)?shù),可能就只有50%-60%了。
畢竟,后者作為嚴(yán)肅的人臉識(shí)別AI,設(shè)定里就包含了執(zhí)法用途。
為了強(qiáng)調(diào)兩者的差異,亞馬遜甚至表示,名人AI根本不是人臉識(shí)別系統(tǒng),它和Rekognition在模型的結(jié)構(gòu)上,就有明顯的不同。
未曾寫清差別
可問題是,普通人沒有辦法感覺到這樣的差異。
至少,亞馬遜的官方文件和宣傳文,都沒有體現(xiàn)它們之間的區(qū)別。
在跟BuzzFeed聊過之后,亞馬遜的人類才修改了Rekognition的文件。修改過的版本,已經(jīng)可見二者結(jié)構(gòu)上的不同了。
亞馬遜的一位發(fā)言人說,之前的文章寫得太傻了,只想著吸引人點(diǎn)進(jìn)去,沒有想到應(yīng)該讓用戶看清楚。
就像剛才說的,名人AI針對(duì)的是,會(huì)在影視作品里偽裝自己的演員,把他們的扮相和真實(shí)的長(zhǎng)相匹配起來。
所以,如果只對(duì)著一群通緝犯去匹配,當(dāng)然匹配不出正確的結(jié)果了。
亞馬遜還表示,大家不用在意名人AI給的置信分,因?yàn)檎嬲娜四樧R(shí)別系統(tǒng),打分的規(guī)則是完全不一樣的。
特意不寫清楚?
這樣,問題又來了。
加州大學(xué)伯克利分校的學(xué)者Joshua Kroll說,執(zhí)法用的AI系統(tǒng),大部分都不會(huì)公開技術(shù)細(xì)節(jié)。
這樣的話,公司說什么,就是什么。
像亞馬遜,Rekognition被爆出“把議員認(rèn)成罪犯”之后,公司才向外界解釋說,95%以上是推薦的置信度。
可置信分?jǐn)?shù)到底是怎樣得出的,代表怎樣的含義,亞馬遜從來沒有解釋過。
Kroll說,讓外界產(chǎn)生那么大的困惑,這是亞馬遜自己選擇的。
如果公司愿意透露更多的細(xì)節(jié),比如系統(tǒng)是如何開發(fā),或如何運(yùn)行的,那么針對(duì)亞馬遜人臉識(shí)別技術(shù)的質(zhì)疑和困惑就會(huì)少一些。
如何解讀置信分?
可是現(xiàn)在,只是給出了95%的推薦置信閾值,執(zhí)法人員又應(yīng)該怎樣理解這個(gè)數(shù)字呢?
來自喬治城法律中心的Clare Garvie說,一個(gè)人如果看到99%的置信度,那ta大概會(huì)認(rèn)為系統(tǒng)給的結(jié)果是99%肯定的。
可事實(shí)并不是這樣,那只是AI系統(tǒng)自己的信心而已。
而執(zhí)法人員會(huì)怎么解讀這個(gè)數(shù)字,取決于他們接受的是怎樣的培訓(xùn)。
這個(gè)解讀,又可能影響到案件調(diào)查的方向,人類很可能更偏重于那些置信分高的匹配結(jié)果。
人們之所以會(huì)有各種各樣的擔(dān)心,一部分也是因?yàn)?AI可以調(diào)查各種各樣的人,可對(duì)人類又很難對(duì)AI的工作原理展開調(diào)查。
人類在明,AI在暗。
無休止的調(diào)查?
除此之外,當(dāng)人臉識(shí)別被用于執(zhí)法,你一旦被監(jiān)控拍到,就不知道AI對(duì)你的調(diào)查,什么時(shí)候是個(gè)頭了。
亞馬遜說,存下圖像,只是為了維護(hù)系統(tǒng),改進(jìn)系統(tǒng)。
可是,圖像會(huì)不會(huì)被濫用,誰也不知道。
原文標(biāo)題:用FBI通緝犯照片集,考驗(yàn)亞馬遜人臉識(shí)別,意外發(fā)現(xiàn)了隱情
文章出處:【微信號(hào):szwlw26059696,微信公眾號(hào):物聯(lián)網(wǎng)之聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。