朋友圈里@微信官方要求戴圣誕帽的活動曾經(jīng)火爆一時(shí),有些會玩的小伙伴都悄咪咪地用美圖秀秀一類的 app 給自己頭像 p 一頂,然后可高興地表示“哎呀好神奇hhhh”,呆萌的小伙伴當(dāng)然就一直等啊等... ...作為一名堅(jiān)信“用技術(shù)解決需求”的萌新,在一個(gè)無聊的周末嘗試用python來搞一波事情。
主要思路
準(zhǔn)備兩張圖:一張頭像,一張帽子。先用人臉識別定位頭像中的人臉,給出人臉像素坐標(biāo);再根據(jù)這個(gè)坐標(biāo)確定帽子放置的坐標(biāo);最后將兩張圖片拼接后輸出。(需要注意的是,帽子是不規(guī)則圖像,除了主體外背景應(yīng)該是透明的,因此必須是四通道png格式)。gakki 醬親自演示如下:
示意圖
問題展開
1. 人臉識別怎么搞定?(重新造輪子?不存在的,這輩子都不可能造輪子的)。Github上一個(gè)開源的python人臉識別庫face_recognition雙手奉
https://github.com/ageitgey/face_recognition#face-recognition
據(jù)說識別率99.38%(頂瓜瓜啊!)。通過安裝這個(gè)庫就可以調(diào)用人臉檢測器。
2. 確定了帽子的放置位置,怎么拼接圖層?這個(gè)屬于基本的圖像操作,python提供了PIL(Python Image Lib)這么一個(gè)庫來進(jìn)行圖像處理,具體操作請看后面的代碼。
庫的安裝
我的環(huán)境是Ubuntu 16.04+Python2.7.12。使用Window,Mac OS和Python3的同學(xué)也可以參考,都是類似的。face_recognition這個(gè)庫比較事兒,安裝前需要依次安裝boost(boost_python),cmake,dlib這幾個(gè)依賴和庫,中間出現(xiàn)任何問題都可以通過Google解決(懶得寫 -.. -)。安裝完所有的依賴后,使用命令:
1pip install face_recognition2pip install pillow #PIL庫
完成后就可以在你的python腳本里import face_recognition和PIL了。
代碼分析
Talk is cheap, show me the code。直接上代碼:
1from PIL import Image 2import face_recognition 3img_path = raw_input("image path:") 4image = face_recognition.load_image_file(img_path) 5face_locations = face_recognition.face_locations(image) 6print("Found {} face(s) in this photograph.".format(len(face_locations)))
第1、2行導(dǎo)入PIL庫中的Image模塊和face_recognition庫。第3行,等待用戶輸入頭像圖片的路徑。第4行,把路徑所指的圖像數(shù)據(jù)讀入image中。第5行,調(diào)用face_locations處理image中的圖像數(shù)據(jù),對圖片中的人臉進(jìn)行識別定位,定位后的得到的像素坐標(biāo)數(shù)據(jù)放在face_locations里。第6行在shell里輸出圖片里識別到的人臉的個(gè)數(shù)。
7human_img = Image.open(img_path) 8human_img = human_img.convert("RGBA") 9hat_img = Image.open("./hat.png")10hat_img = hat_img.convert("RGBA")
第7、8行,把路徑所指的圖像數(shù)據(jù)讀入human_img中,并轉(zhuǎn)換為四通道RGBA模式。9、10行讀入帽子圖像并做相同處理。
11for face_location in face_locations:12 top, right, bottom, left = face_location13 top -= 1014 print("A face is located at pixel location Top: {}, Left: {}, Bottom: {}, Right: {}".format(top, left, bottom, right))15 head_h = bottom-top#hight of head16 head_l = right-left#length of head17 hat_img = hat_img.resize( (head_l,head_h) )#convert size of hat18 hat_region = hat_img19 human_region = ( left, top-head_h, right, top )20 human_img.paste(hat_region, human_region,mask=hat_img)21human_img.show()
如果一張圖里有多張人臉,face_recognition.face_locations(image)會返回每張人臉的位置信息,存放在一個(gè)list里。因此第11行是遍歷face_locations里的每張人臉的數(shù)據(jù)。第12行解包一個(gè)人臉像素坐標(biāo)數(shù)據(jù),得到top,right,bottom,left分別為示意圖中的y1,x2,y2,x1。第13行,為啥y1要減10個(gè)像素?
因?yàn)槿四樧R別得到的y1最多到你額頭的位置,所以再把這個(gè)坐標(biāo)往上提一提帽子才戴得更自然。第14行輸出坐標(biāo)數(shù)據(jù)方便調(diào)試。第15、16行計(jì)算人臉的高度和寬度。第17行使用resize()根據(jù)人臉的大小調(diào)整帽子的大小,因?yàn)閳D像中的人臉有大有小,調(diào)整后看起來更和諧。第18行,將帽子圖像作為頂部圖層圖像。第19行,確定底部圖層(頭像圖片)被覆蓋的區(qū)域(就是帽子放置區(qū)域)。
第20行,把頂部圖層與底部圖層拼接(不太明白的看下圖)。然后一個(gè)循環(huán)結(jié)束,亦即完成圖片中一個(gè)人的戴帽操作,接著進(jìn)行下個(gè)人的戴帽,直到所有人都戴上了帽子。最后21行,完成輸出~
更新
更多人臉:
原文標(biāo)題:20行Python代碼給微信頭像戴帽子
文章出處:【微信號:rgznai100,微信公眾號:AI科技大本營】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。