本站原創(chuàng),作者:章鷹,電子發(fā)燒友執(zhí)行副主編。
1月16日,在深圳益田威斯汀酒店百度大腦硬件平臺及產(chǎn)品發(fā)布大會現(xiàn)場,百度公司面對500多名現(xiàn)場觀眾,亮出了最新AI產(chǎn)品,不僅僅有百度大腦高性能端計算模型平臺、智能邊緣的軟件服務(wù),還有多款邊緣計算硬件設(shè)備發(fā)布,每一款設(shè)備也都已經(jīng)落地。
百度是最早致力于人工智能落地公司,過去2年將百度人工智能能力開放,推動各行業(yè)AI應(yīng)用?!癆I應(yīng)用分為兩類:一類是物聯(lián)網(wǎng)應(yīng)用,主要是在線服務(wù),使用百度平臺上的API或者SDK,就可以實現(xiàn)AI落地,另外一類是線下的園區(qū)、物業(yè)、房地產(chǎn)、工業(yè)和農(nóng)業(yè)場景中,非常期待硬件的革新,才能實現(xiàn)AI的功能。這是我們今天發(fā)布會重點,AI如何和硬件,特別和新型硬件如何結(jié)合,去解決場景中的應(yīng)用問題?!?百度AI技術(shù)生態(tài)部總經(jīng)理喻友平強調(diào)指出。
一開場,喻友平就定下來落地的基調(diào),從云端到終端,百度人工智能正在加速進入各個生態(tài)應(yīng)用。我們看到微軟、亞馬遜、谷歌等國際科技巨頭都在基于自己的使用經(jīng)驗,面向更廣大市場推出人工智能平臺及獨立應(yīng)用,百度顯然在2019年一開年就拉開了這種節(jié)奏。
百度大腦發(fā)布高性能端計算模型平臺 EasyEdge
百度大腦全新發(fā)布了基于 Paddle Mobile 打造的零代碼生成高性能端計算模型平臺 EasyEdge。平臺支持4種深度學(xué)習(xí)框架、13種網(wǎng)絡(luò)結(jié)構(gòu),只需3步,最快2分鐘即可生成端計算模型 SDK,適配5種芯片與3大操作系統(tǒng)??蓽p少90%開發(fā)時間,模型識別速度最高提升10倍。
“百度開放了最全面的通用AI能力的集合,從語音、圖像和在園處理,有150項能力的開放,超過80萬開發(fā)者,超過20個大行業(yè)中有AI應(yīng)用落地。” 喻友平介紹說?!?
人工智能落地是一個復(fù)雜的過程。近年來人工智能的發(fā)展是基于深度學(xué)習(xí)的技術(shù)進步,百度在深度學(xué)習(xí)的框架層上有國內(nèi)企業(yè)唯一的深度學(xué)習(xí)框架和解決方案,不僅有訓(xùn)練和預(yù)測,有服務(wù)器、移動端、大量模型的開放。百度大腦的工作是基于這個框架進行的。
基于這個框架,百度開放了語音、圖像、在園處理等在百度內(nèi)部成熟打磨的能力,同時還賦能行業(yè)應(yīng)用,行業(yè)需要根據(jù)自身的數(shù)據(jù)進行訓(xùn)練,百度推出EasyDL平臺,不需要編程就可以訓(xùn)練的平臺,有UNIT做智能對話與服務(wù)的平臺,上層將模型和算法與各種平臺結(jié)合,有硬件解決方案,有私有化解決方案,開發(fā)者能力,以及基于硬件廠商、集成廠商的能力打造的產(chǎn)品和服務(wù),可以上載到百度AI市場,連接廠商和客戶。
AI的落地,首先要將模型做進來,然后放到硬件中去,最終與學(xué)習(xí)的場景進行連接。對硬件的結(jié)合有兩個關(guān)鍵點:一個是視覺,一個是語音。
視覺技術(shù)的軟硬一體化方案
視覺技術(shù)的應(yīng)用中存在兩種經(jīng)典場景,包括遠(yuǎn)距離識別多目標(biāo)、承擔(dān)多種分析任務(wù)的場景,例如人流統(tǒng)計、工業(yè)檢測等;以及需求近距離目標(biāo)檢測、安全級別高的場景,如人臉通行、人證比對等。針對不同需求,百度大腦提供了AI 加速計算平臺方案和通用計算平臺方案兩套解決方案。
“AI加速計算平臺方案起步于AI加速卡的開發(fā),優(yōu)點是在端上實現(xiàn)高速、大規(guī)模的推理計算,端上的算法需要AI計算加速卡進行適配,識別速度和檢測速度要求高,單幀識別數(shù)達(dá)到10多個以上,需要支持定制的分析任務(wù),基于可重構(gòu)的計算架構(gòu)才能支持,使用于智能安防、人流分析這些巡檢的場景;通用計算平臺方案,基于通用的計算平臺和計算卡進行,通過GPU、CPU和操作系統(tǒng),實現(xiàn)復(fù)雜的業(yè)務(wù)模型,容易搭建上層應(yīng)用,與視覺模組進行深度匹配。軟件要與視覺模組進行適配,SDK要在速度、性能、效果、體積上做深度適配,適用于活體識別、單幀識別數(shù)小于10個,適用于復(fù)雜業(yè)務(wù)的處理?!?
約一元硬幣大小的 X-eye 計算卡內(nèi)置了多種百度高性能視覺算法,Intel Movdius AI 加速器 AI 計算資源實測超過 1Tops,Xos加速技術(shù)終端神經(jīng)網(wǎng)絡(luò)模型平均提速15%,可以支持多種傳感器,核心模型,如人臉等可提速200%,并可靈活搭配多種視覺模組組成整體解決方案。
對于性能要求更高、需求定制化的用戶而言,高性能計算卡 EdgeBoard 則是更合適的選擇。EdgeBoard 內(nèi)含模型嵌入工具包、AI 加速工具包、嵌入式計算卡成品和參考設(shè)計,其軟硬一體的完整架構(gòu)造具有強悍的終端加速性能。賽靈思 FPGA 高性能的加速引擎提供2.4 Tops 的強大 AI 算力,性能3倍于終端 GPU,10倍于終端 CPU,Resnet50 實測可達(dá)到55 FPS 處理速度,且方案商可以根據(jù)需要輸入百度大腦預(yù)置或自定制模型。通過集成 EdgeBoard 可大大提升終端設(shè)備算法運載性能表現(xiàn)。
基于EdgeBoard加速方案全新發(fā)布X-Target-01是一款綜合視覺圖像能力的設(shè)備,可支持圖像檢測包括不限于人臉、人體、動作、物體等識別,并支持定制模型的全目標(biāo)抓拍,通用于更多如工業(yè)質(zhì)檢、城市管理等復(fù)雜場景。以人臉識別為例,每幀最多可同時捕捉超過 100 張以上的人臉,高達(dá)每秒55幀實時人臉檢測,人臉抓拍率98%以上。
人臉識別領(lǐng)域終端產(chǎn)品最核心的三個部件:算法、鏡頭模組和計算板卡,用戶最直觀評價:算法效果和通行效率。算法方面,百度大腦全新發(fā)布了人臉離線識別 SDK2.0,四個特點:1、速度、精度較1.0顯著提升,且集成更簡單。2、識別速度上,全流程總體耗時小于500 ms,檢測/活體/特征抽取速度提升150%;3、識別精度方面,萬分之一誤識率下生活照/證件照模型精度高達(dá)99.23%,較1.0精度提高近1.5%;4、集成方面,重構(gòu)20余個底層 API,可降低近30%開發(fā)量。新增人臉通行、人證核驗場景化工程,讓開發(fā)者一分鐘跑通全流程業(yè)務(wù)邏輯。
2018年5月,百度率先發(fā)布3D結(jié)構(gòu)光產(chǎn)品,構(gòu)筑近紅外、RGB、3D結(jié)構(gòu)光完整產(chǎn)業(yè)鏈產(chǎn)品。鏡頭模組上,現(xiàn)場全新發(fā)布了三款合作鏡頭,與百度大腦人臉識別離線 SDK 深度適配,并將于2019年2月正式在 AI 市場獨家發(fā)售。包括慧谷航天百度大腦定制???單目可見光鏡頭模組、奧比中光 3D 結(jié)構(gòu)光鏡頭模組Atlas和睿識雙目近紅外鏡頭模組。
慧谷航天百度大腦定制???單目可見光鏡頭模組
慧谷航天百度大腦定制???單目可見光鏡頭模組,支持115DB超級寬動態(tài),活體穩(wěn)定識別范圍達(dá)到0.5m到2米。
奧比中光 3D 結(jié)構(gòu)光鏡頭模組Atlas
奧比中光 3D 結(jié)構(gòu)光鏡頭模組 Atlas支持高精度深度識別,多維完整采集人臉數(shù)據(jù) RGB、IR、Depth,投射出18000個識別點,誤差率僅百萬分之一,超強寬動態(tài)支持逆光環(huán)境下可達(dá)到無差異識別??筛行?yīng)用于活體安全度較高的業(yè)務(wù)場景中。
睿識雙目近紅外鏡頭模組,超低功耗、千分之一誤識率下活體通過率超過99%。
基于百度大腦的人臉識別離線SDK,以及百度大腦合作伙伴視派爾提供的鏡頭模組,華正聯(lián)已落地警務(wù)一體機,目前已應(yīng)用于深圳多個公共服務(wù)區(qū)域。未來,華正聯(lián)產(chǎn)品將進一步融合百度大腦AI技術(shù),并通過百度合作伙伴生態(tài),進一步推廣產(chǎn)品、拓展市場。