2018年1月,亞馬遜在西雅圖的無(wú)人超市對(duì)外營(yíng)業(yè),吸引北美媒體和市民眾多眼球。不過(guò)他們不知道,2017年10月,中國(guó)的在線零售巨頭京東的無(wú)人商店和無(wú)人超市已經(jīng)對(duì)外開放了。更有趣的是,在京東的無(wú)人商店和無(wú)人超市里,當(dāng)你選好自己要買的東西之后,只需“刷臉”就能完成支付過(guò)程,錢包什么的,完全不用拿出來(lái)啦。
在購(gòu)物的整個(gè)過(guò)程中,結(jié)算環(huán)節(jié)是重點(diǎn),更是難點(diǎn)。顧客選擇的商品,品類多種多樣,包裝彼此不同,如何保證在盡量短的時(shí)間之內(nèi)確定商品的具體品類和價(jià)格?除了掃描條碼之外,還有其他方法嗎?
當(dāng)然有,京東選擇了更神奇的方法:選好商品后,你可以把它們挨個(gè)放在智能結(jié)算臺(tái)上,其中有集成攝像頭,借助京東這些年積累的實(shí)拍數(shù)據(jù),利用圖像識(shí)別技術(shù)完成結(jié)算,當(dāng)你走出結(jié)算通道后,人臉識(shí)別、智能攝像頭等技術(shù)就會(huì)自動(dòng)完成付款啦。
京東大數(shù)據(jù)平臺(tái)部負(fù)責(zé)人,京東副總裁翁志介紹,“顧客的方便,來(lái)自于京東長(zhǎng)期以來(lái)在AI和大數(shù)據(jù)方向的技術(shù)積累,集成各種傳感器的智能貨架、智能結(jié)算臺(tái)、智能價(jià)簽、智能攝像頭等多種智能技術(shù),貢獻(xiàn)良多?!?
▌分析圖像,提取特征,還得靠通用架構(gòu)
京東公司成立二十年,在線商城已經(jīng)運(yùn)行了十四年。這么多年下來(lái),京東積累了一個(gè)龐大的在售產(chǎn)品目錄,產(chǎn)品圖像多達(dá)數(shù)億張。它們都保存在分布式大數(shù)據(jù)存儲(chǔ)庫(kù) Apache HBase中,用Hadoop框架加以處理。為了滿足客戶在各種場(chǎng)景下的不同需求,京東希望可以匹配、提取不同產(chǎn)品圖像中的特征。比如,客戶逛街時(shí)發(fā)現(xiàn)一款自己喜歡的咖啡杯,只要拍下來(lái),京東就可以根據(jù)照片為客戶找到滿足他要求的咖啡杯。對(duì)于京東自己來(lái)說(shuō),還可以利用圖像識(shí)別和匹配功能,與其他網(wǎng)站上的產(chǎn)品進(jìn)行匹配,京東就可以調(diào)整自己的定價(jià)策略,強(qiáng)化自己的競(jìng)爭(zhēng)力。此外,京東還對(duì)外提供公共云服務(wù),類似功能還可以提供給公共云的客戶,幫助他們開發(fā)符合自己需求的全新圖像分析應(yīng)用云平臺(tái)?,F(xiàn)在,在京東對(duì)外開放的技術(shù)能力中,“圖片質(zhì)量檢測(cè)”和“以圖搜圖”功能已經(jīng)可以對(duì)外提供給其他開發(fā)團(tuán)隊(duì)使用了。
京東的技術(shù)團(tuán)隊(duì)接下圖像分析這個(gè)任務(wù)后,一開始,他們?cè)鴩L試使用圖形處理單元(GPU)創(chuàng)建特征匹配應(yīng)用,然而并不順利,因?yàn)樵跀U(kuò)展性上遇到很多問(wèn)題,必須手工管理眾多設(shè)備和系統(tǒng),手工處理負(fù)載均衡和容錯(cuò);而且在數(shù)據(jù)處理過(guò)程中還出現(xiàn)很多延遲,不足以支持生產(chǎn)環(huán)境需求。
后來(lái),京東決定基于現(xiàn)有的服務(wù)器和通用處理器架構(gòu)開展工作,而且取得了顯著成效。他們的圖像數(shù)據(jù)存儲(chǔ)服務(wù)器基于英特爾至強(qiáng)處理器 E5 家族,技術(shù)團(tuán)隊(duì)使用 BigDL 深度學(xué)習(xí)庫(kù)來(lái)部署Caffe 模型,性能提升了3.83倍,這讓京東將來(lái)可以更快捷地提供基于圖片的全新服務(wù)。
在大數(shù)據(jù)分析領(lǐng)域,Apache Spark項(xiàng)目已經(jīng)成為事實(shí)上的標(biāo)準(zhǔn)。該項(xiàng)目起始于加州大學(xué)伯克利分校,幾個(gè)創(chuàng)始人后來(lái)成立了Databricks公司,成立五年來(lái),專門提供大數(shù)據(jù)分析服務(wù)。在分布式機(jī)器學(xué)習(xí)領(lǐng)域,他們也選擇了BigDL 項(xiàng)目,與本身的原生Spark技術(shù)集成,提升Spark在模型訓(xùn)練,預(yù)測(cè)和調(diào)優(yōu)方面的表現(xiàn)。
京東在基于英特爾至強(qiáng)處理器 E5-2650 v4 的服務(wù)器上運(yùn)行 BigDL,完成深度學(xué)習(xí)提取圖片特征過(guò)程。Big DL同時(shí)支持橫向擴(kuò)展,只要添加新的標(biāo)準(zhǔn)英特爾至強(qiáng)處理器服務(wù)器,就能夠?qū)崿F(xiàn)高效橫向擴(kuò)展,延展到數(shù)百乃至數(shù)千臺(tái)服務(wù)器。京東使用了帶有 1200 個(gè)邏輯內(nèi)核的高度并行架構(gòu),大幅加快了從數(shù)據(jù)庫(kù)中讀取圖像數(shù)據(jù)的流程,整體性能提高了3.83 倍。性能的提升,也要?dú)w功于英特爾在核心算法層面的優(yōu)化。BigDL 使用英特爾數(shù)學(xué)核心函數(shù)庫(kù)MKL 和并行計(jì)算技術(shù),充分發(fā)揮了至強(qiáng)處理器的性能。
借助 BigDL 框架,京東還在自己已有的通用硬件上使用 Caffe、Torch 和 TensorFlow 等框架中的預(yù)訓(xùn)練模型,這讓他們以更快的速度測(cè)試和推出新服務(wù),同時(shí)無(wú)需投入專用硬件。也就是說(shuō),不需要購(gòu)買、運(yùn)行獨(dú)立的 GPU 集群。京東可以重復(fù)使用現(xiàn)有的硬件資源,從而降低了總體擁有成本。結(jié)合ApacheHadoop 和 Spark 框架來(lái)處理資源管理工作,未來(lái)能夠更輕松地開發(fā)新應(yīng)用,同時(shí)保持高效性能。
▌家門口刷臉購(gòu)物不是夢(mèng)
毫無(wú)疑問(wèn),京東是中國(guó)零售領(lǐng)域的領(lǐng)軍企業(yè),技術(shù)上,京東同樣具有前瞻性思維,前文提到的京東的無(wú)人商店和無(wú)人超市刷臉完成購(gòu)物,就是一個(gè)很好的證明。
《福布斯》專門撰文報(bào)道:京東希望使用當(dāng)今最先進(jìn)的技術(shù)創(chuàng)新開發(fā)新的解決方案,創(chuàng)建面向未來(lái)的零售運(yùn)營(yíng)體系;京東正在推動(dòng)人工智能、大數(shù)據(jù)和機(jī)器人技術(shù)的發(fā)展,為第四次工業(yè)革命建立零售業(yè)的基礎(chǔ)設(shè)施。到那一天,你在家門口的便利店和超市里面就能直接刷臉買東西啦。
原文標(biāo)題:想體驗(yàn)無(wú)人商店?去京東他們家直接刷臉!
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):AI科技大本營(yíng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。