服務(wù)熱線：13728883399
wangyp@shangeai.com

如何用40行代碼實(shí)現(xiàn)人臉識(shí)別？

時(shí)間：2018-07-15 09:16:15點(diǎn)擊：374次

闖紅燈這件事情,一直是交通問(wèn)題的一大頭疼病。自從交通法對(duì)機(jī)動(dòng)車(chē)闖紅燈進(jìn)行扣 6 分的舉措后,很多司機(jī)朋友們紛紛表示不敢怠慢了。機(jī)動(dòng)車(chē)好了,可是非機(jī)動(dòng)車(chē)和行人闖紅燈的病咋治?當(dāng)中國(guó)式過(guò)馬路已經(jīng)深入人心的時(shí)候,這不,黑科技來(lái)了,乍一看還真的很像警方在搜捕嫌疑人。

近期山東、江蘇、深圳等一些城市開(kāi)始在交通路口上啟用了人臉識(shí)別系統(tǒng),針對(duì)行人和非機(jī)動(dòng)車(chē)闖紅燈等違規(guī)行為進(jìn)行抓拍,并現(xiàn)場(chǎng)進(jìn)行曝光。而對(duì)于行人和非機(jī)動(dòng)車(chē)闖紅燈的行為,交管部門(mén)將會(huì)給予 20 元到 50 元的罰款。

雖然罰款錢(qián)數(shù)不多,但是最讓大家忌憚的就是,你不文明行為的視頻和你的個(gè)人信息,都會(huì)在大屏幕上全天輪次播放。交警叔叔說(shuō)了,被拍的市民紛紛表示下次再也不敢闖紅燈了。

人臉抓拍系統(tǒng)的工作原理是:當(dāng)紅燈亮起后,如有行人和非機(jī)動(dòng)車(chē)越過(guò)停止線,系統(tǒng)會(huì)自動(dòng)抓拍四張照片,保留 15 秒視頻并截取違法者頭像,即便在晚上也能清晰成像。除了現(xiàn)場(chǎng)回放,交管部門(mén)還將連接的戶籍信息進(jìn)行曝光。

人臉識(shí)別技術(shù)到底是怎樣實(shí)現(xiàn)的呢?

很多人都認(rèn)為人臉識(shí)別是一項(xiàng)非常難以實(shí)現(xiàn)的工作,看到名字就害怕,然后心懷忐忑到網(wǎng)上一搜,看到網(wǎng)上 N 頁(yè)的教程立馬就放棄了。

這些人里包括曾經(jīng)的我自己。其實(shí)如果如果你不是非要深究其中的原理,只是要實(shí)現(xiàn)這一工作的話,人臉識(shí)別也沒(méi)那么難。

今天我們就來(lái)看看如何在 40 行代碼以內(nèi)簡(jiǎn)單地實(shí)現(xiàn)人臉識(shí)別。

一點(diǎn)區(qū)分

對(duì)于大部分人來(lái)說(shuō),區(qū)分人臉檢測(cè)和人臉識(shí)別完全不是問(wèn)題。但是網(wǎng)上有很多教程有意無(wú)意地把人臉檢測(cè)說(shuō)成是人臉識(shí)別,誤導(dǎo)群眾,造成一些人認(rèn)為二者是相同的。

其實(shí),人臉檢測(cè)解決的問(wèn)題是確定一張圖上有木有人臉,而人臉識(shí)別解決的問(wèn)題是這個(gè)臉是誰(shuí)的?？梢哉f(shuō)人臉檢測(cè)是是人識(shí)別的前期工作。

今天我們要做的是人臉識(shí)別。

所用工具

Anaconda 2 —— Python 2

Dlib

scikit-image

Dlib

對(duì)于今天要用到的主要工具,還是有必要多說(shuō)幾句的。Dlib 是基于現(xiàn)代 C++ 的一個(gè)跨平臺(tái)通用的框架,作者非常勤奮,一直在保持更新。

Dlib 內(nèi)容涵蓋機(jī)器學(xué)習(xí)、圖像處理、數(shù)值算法、數(shù)據(jù)壓縮等等,涉獵甚廣。更重要的是,Dlib 的文檔非常完善,例子非常豐富。就像很多庫(kù)一樣,Dlib 也提供了 Python 的接口,安裝非常簡(jiǎn)單,用 pip 只需要一句即可:

pip install dlib

上面需要用到的 scikit-image 同樣只是需要這么一句:

pip install scikit-image

注:如果用 pip install dlib 安裝失敗的話,那安裝起來(lái)就比較麻煩了。錯(cuò)誤提示很詳細(xì),按照錯(cuò)誤提示一步步走就行了。

人臉識(shí)別

之所以用 Dlib 來(lái)實(shí)現(xiàn)人臉識(shí)別,是因?yàn)樗呀?jīng)替我們做好了絕大部分的工作,我們只需要去調(diào)用就行了。Dlib 里面有人臉檢測(cè)器,有訓(xùn)練好的人臉關(guān)鍵點(diǎn)檢測(cè)器,也有訓(xùn)練好的人臉識(shí)別模型。

今天我們主要目的是實(shí)現(xiàn),而不是深究原理。例子既然代碼不超過(guò) 40 行,其實(shí)是沒(méi)啥難度的。

首先先通過(guò)文件樹(shù)看一下今天需要用到的代碼:

準(zhǔn)備了六個(gè)候選人的圖片放在 candidate-faces 文件夾中,然后需要識(shí)別的人臉圖片 test.jpg 。我們的工作就是要檢測(cè)到 test.jpg 中的人臉,然后判斷她到底是候選人中的誰(shuí)。

另外的 girl-face-rec.py 是我們的 python 腳本。

shape_predictor_68_face_landmarks.dat 是已經(jīng)訓(xùn)練好的人臉關(guān)鍵點(diǎn)檢測(cè)器。

dlib_face_recognition_resnet_model_v1.dat 是訓(xùn)練好的 ResNet 人臉識(shí)別模型。

ResNet 是何凱明在微軟的時(shí)候提出的深度殘差網(wǎng)絡(luò),獲得了 ImageNet 2015 冠軍,通過(guò)讓網(wǎng)絡(luò)對(duì)殘差進(jìn)行學(xué)習(xí),在深度和精度上做到了比 CNN 更加強(qiáng)大。

前期準(zhǔn)備

shape_predictor_68_face_landmarks.dat dlib_face_recognition_resnet_model_v1.dat 都可以在這里找到。

不能點(diǎn)擊超鏈接的可以直接輸入以下網(wǎng)址:http://dlib.net/files/。

然后準(zhǔn)備幾個(gè)人的人臉圖片作為候選人臉,最好是正臉。放到 candidate-faces 文件夾中。

本文這里準(zhǔn)備的是六張圖片,如下:

她們分別是:

然后準(zhǔn)備四張需要識(shí)別的人臉圖像,其實(shí)一張就夠了,這里只是要看看不同的情況:

可以看到前兩張和候選文件中的本人看起來(lái)還是差別不小的,第三張是候選人中的原圖,第四張圖片微微側(cè)臉,而且右側(cè)有陰影。

識(shí)別流程

數(shù)據(jù)準(zhǔn)備完畢,接下來(lái)就是代碼了。識(shí)別的大致流程是這樣的:

先對(duì)候選人進(jìn)行人臉檢測(cè)、關(guān)鍵點(diǎn)提取、描述子生成后,把候選人描述子保存起來(lái)。

然后對(duì)測(cè)試人臉進(jìn)行人臉檢測(cè)、關(guān)鍵點(diǎn)提取、描述子生成。

最后求測(cè)試圖像人臉描述子和候選人臉描述子之間的歐氏距離,距離最小者判定為同一個(gè)人。

代碼

代碼不做過(guò)多解釋,因?yàn)橐呀?jīng)注釋的非常完善了。以下是 girl-face-rec.py:

# -*- coding: UTF-8 -*-

import sys,os,dlib,glob,numpy

from skimage import io

if len(sys.argv) != 5:

print "請(qǐng)檢查參數(shù)是否正確"

exit()

# 1.人臉關(guān)鍵點(diǎn)檢測(cè)器

predictor_path = sys.argv[1]

# 2.人臉識(shí)別模型

face_rec_model_path = sys.argv[2]

# 3.候選人臉文件夾

faces_folder_path = sys.argv[3]

# 4.需識(shí)別的人臉

img_path = sys.argv[4]

# 1.加載正臉檢測(cè)器

detector = dlib.get_frontal_face_detector()

# 2.加載人臉關(guān)鍵點(diǎn)檢測(cè)器

sp = dlib.shape_predictor(predictor_path)

# 3. 加載人臉識(shí)別模型

facerec = dlib.face_recognition_model_v1(face_rec_model_path)

# win = dlib.image_window()

# 候選人臉描述子list

descriptors = []

# 對(duì)文件夾下的每一個(gè)人臉進(jìn)行:

# 1.人臉檢測(cè)

# 2.關(guān)鍵點(diǎn)檢測(cè)

# 3.描述子提取

for f in glob.glob(os.path.join(faces_folder_path, "*.jpg")):

print("Processing file: {}".format(f))

img = io.imread(f)

#win.clear_overlay()

#win.set_image(img)

# 1.人臉檢測(cè)

dets = detector(img, 1)

print("Number of faces detected: {}".format(len(dets)))

for k, d in enumerate(dets):

# 2.關(guān)鍵點(diǎn)檢測(cè)

shape = sp(img, d)

# 畫(huà)出人臉區(qū)域和和關(guān)鍵點(diǎn)

# win.clear_overlay()

# win.add_overlay(d)

# win.add_overlay(shape)

# 3.描述子提取,128D向量

face_descriptor = facerec.compute_face_descriptor(img, shape)

# 轉(zhuǎn)換為numpy array

v = numpy.array(face_descriptor)

descriptors.append(v)

# 對(duì)需識(shí)別人臉進(jìn)行同樣處理

# 提取描述子,不再注釋

img = io.imread(img_path)

dets = detector(img, 1)

dist = []

for k, d in enumerate(dets):

shape = sp(img, d)

face_descriptor = facerec.compute_face_descriptor(img, shape)

d_test = numpy.array(face_descriptor)

# 計(jì)算歐式距離

for i in descriptors:

dist_ = numpy.linalg.norm(i-d_test)

dist.append(dist_)

# 候選人名單

candidate = ['Unknown1','Unknown2','Shishi','Unknown4','Bingbing','Feifei']

# 候選人和距離組成一個(gè)dict

c_d = dict(zip(candidate,dist))

cd_sorted = sorted(c_d.iteritems(), key=lambda d:d[1])

print "\n The person is: ",cd_sorted[0][0]

dlib.hit_enter_to_continue()

運(yùn)行結(jié)果

我們?cè)?.py 所在的文件夾下打開(kāi)命令行。運(yùn)行如下命令:

python girl-face-rec.py 1.dat 2.dat ./candidate-faecs test1.jpg

由于shape_predictor_68_face_landmarks.dat 和 dlib_face_recognition_resnet_model_v1.dat 名字實(shí)在太長(zhǎng),所以我把它們重命名為 1.dat 和 2.dat 。

運(yùn)行結(jié)果如下:

The person is Bingbing。

記憶力不好的同學(xué)可以翻上去看看 test1.jpg 是誰(shuí)的圖片。有興趣的話可以把四張測(cè)試圖片都運(yùn)行下試試。

這里需要說(shuō)明的是,前三張圖輸出結(jié)果都是非常理想的。但是第四張測(cè)試圖片的輸出結(jié)果是候選人 4。對(duì)比一下兩張圖片可以很容易發(fā)現(xiàn)混淆的原因。

機(jī)器畢竟不是人,機(jī)器的智能還需要人來(lái)提升。

有興趣的朋友可以繼續(xù)深入研究如何提升識(shí)別的準(zhǔn)確率。比如每個(gè)人的候選圖片用多張,然后對(duì)比和每個(gè)人距離的平均值之類(lèi)的,全憑自己了。

原文標(biāo)題:【干貨】40行代碼,揭秘人臉識(shí)別技術(shù)

文章出處:【微信號(hào):WUKOOAI,微信公眾號(hào):悟空智能科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

標(biāo)簽:

打印

如何用40行代碼實(shí)現(xiàn)人臉識(shí)別？

如何用40行代碼實(shí)現(xiàn)人臉識(shí)別？