蘋果發(fā)布 iPhone X,并基于3D 結(jié)構(gòu)光技術(shù)推出了名為“Face ID”的新功能用于日常解鎖和 Apple Pay。但彼時(shí)推出的一眾量產(chǎn)全面屏安卓手機(jī)僅僅只是在外貌上模仿了蘋果的劉海設(shè)計(jì),iPhone X “劉海屏”背后真正的大殺器是3D結(jié)構(gòu)光深感攝像模組。
今年5月,OPPO 曾向大眾演示了全球首個(gè)基于 3D 結(jié)構(gòu)光技術(shù)的 5G 視頻通話,并宣布 OPPO 的3D結(jié)構(gòu)光技術(shù)已經(jīng)具備量產(chǎn)條件。而后,OPPO Find X 的全面問世不僅兌現(xiàn)了 OPPO 承諾,更徹底打破了安卓陣營結(jié)構(gòu)光技術(shù)短板的局面,這項(xiàng)技術(shù)自此再也不是 iPhone X 的專屬功能了。
vivo 在2018 MWC 上海震撼發(fā)布了 TOF 3D 超感應(yīng)技術(shù)。在現(xiàn)場,用戶只需要站上 vivo 的體驗(yàn)機(jī),搖臂上搭載了 TOF 3D 超感應(yīng)技術(shù)的原型機(jī)就會(huì)對用戶的頭部進(jìn)行環(huán)形掃描,錄入之后很快就會(huì)形成一個(gè)高精度的 3D 人臉模型,輪廓和細(xì)節(jié)的把控都十分出色,用戶還可以拖動(dòng)模型查看任一角度的自己。
很多人不禁要問,這是一種什么樣的黑科技?
TOF 3D超感應(yīng)技術(shù)所采用的是發(fā)射光脈沖的形式,通過脈沖發(fā)射器連續(xù)發(fā)射脈沖,然后脈沖波遇到物體反射,反射的脈沖被接收器接受,CPU再將這一系列數(shù)據(jù)進(jìn)行分析和建模,最后得出三維模型,從而實(shí)現(xiàn)高精度的立體信息采集和輸入。
安卓陣營突破3D結(jié)構(gòu)光技術(shù)瓶頸
人類是通過兩只眼睛觀察立體世界的,為了讓手機(jī)像人一樣獲得三維立體的圖像信息,手機(jī)廠商們接連推出了雙攝方案,雖然雙目攝像頭能夠依據(jù)視差原理形成三維圖像,但是受制于光線和紋理等拍攝環(huán)境因素,雙攝產(chǎn)生的三維圖像差強(qiáng)人意,更無法滿足3D驗(yàn)真環(huán)節(jié)的應(yīng)用要求,所以采用主動(dòng)投射編碼光獲取3D信息的結(jié)構(gòu)光技術(shù)成為智能手機(jī)革新的關(guān)鍵一環(huán)。
曠視科技是全球領(lǐng)先的計(jì)算機(jī)視覺技術(shù)企業(yè),致力于通過“AI+IoT”技術(shù)賦能不同的垂直領(lǐng)域,為各行業(yè)提供完整的智能解決方案,其中以智能手機(jī)為代表的移動(dòng)終端是曠視用 AI 實(shí)現(xiàn)賦能的典型場景。
“世界上60%的攝像頭是用在手機(jī)上面的?!睍缫暱萍荚剖聵I(yè)部高級副總裁吳文昊表示,“短期來看,曠視的首要任務(wù)就是賦能全球十億攝像頭,所以手機(jī)市場一定是主戰(zhàn)場?!?017年中,曠視科技開始布局手機(jī)市場,隨后基于核心的深度學(xué)習(xí)和計(jì)算機(jī)視覺技術(shù)一舉推出人臉支付、人臉識別解鎖、人像光效、人像背景虛化、視頻美化、3D Animoji等一系列移動(dòng)端AI產(chǎn)品,以滿足不同手機(jī)廠商在人臉解鎖、圖像增強(qiáng)、相機(jī)增強(qiáng)、智能圖像和視頻處理上的需求。
在最新推出的應(yīng)用中,3D結(jié)構(gòu)光的整個(gè)系統(tǒng)包含結(jié)構(gòu)光投影設(shè)備、攝像機(jī)、圖像采集和處理系統(tǒng)。通過投影設(shè)備的發(fā)射光線到被測物體上,攝像機(jī)拍攝在被測物體上形成的三維光圖形,拍攝圖像經(jīng)采集處理系統(tǒng)處理后便能夠獲得被測物體表面數(shù)據(jù)形成三維的圖像信息。
簡單來講3D結(jié)構(gòu)光的實(shí)現(xiàn)原理類似于海底探測的聲吶系統(tǒng)是通過反射信息來確定深度的,只不過3D結(jié)構(gòu)光在手機(jī)人臉識別上的應(yīng)用,是通過人臉表現(xiàn)反射光線來確定深度信息的。相比雙目來說,其效果在同樣的場景下能夠得到更完整、更細(xì)膩的深度圖。
3D 時(shí)代來臨 移動(dòng)支付更安全
相比傳統(tǒng)人臉識別,3D結(jié)構(gòu)光技術(shù)可應(yīng)用于安全支付、三維重建、AR、游戲等眾多場景,其中最重要的應(yīng)用是便是安全支付,這便要求3D結(jié)構(gòu)光人臉識別算法具備極高的技術(shù)水準(zhǔn),并做到極致的質(zhì)量控制。
3D 安全支付相當(dāng)于曠視Face++聯(lián)合 vivo 基于 TOF技術(shù)和人臉識別算法打造了一款安卓版的 FaceID。在 3D 支付產(chǎn)品的開發(fā)中,vivo 手機(jī)在曠視三個(gè)核心算法模型結(jié)構(gòu)加持下,可實(shí)現(xiàn) 0.1s 內(nèi)極速識別,0.03s 重建和達(dá)百萬分之一的支付精度,包括多尺度多特征的注意力檢測模型,可自適應(yīng)網(wǎng)絡(luò)、多模型融合的識別方案,以及基于業(yè)界開創(chuàng)性的移動(dòng)卷積神經(jīng)網(wǎng)絡(luò) ShuffleNet 定制開發(fā)的活體檢測模型。有了這項(xiàng)技術(shù),vivo 用戶將可以用人臉替代指紋、密碼或 PIN 碼作為移動(dòng)支付的主要驗(yàn)證方式。
AI+3D 創(chuàng)造無限想象空間
在曠視科技Face++ 和 vivo 聯(lián)合發(fā)布的一系列 TOF 3D 超感應(yīng)技術(shù)應(yīng)用之前,由于科技發(fā)展的局限性,在我們手機(jī)攝像頭的眼里,世界是“平”的——攝像機(jī)給我們的反饋永遠(yuǎn)都只是一張二維的圖像。但顯然二維已經(jīng)不能滿足人們對于安全級別和影像處理的極致追求。
相比二維的人像數(shù)據(jù),立體的三維數(shù)據(jù)具有更豐富的細(xì)節(jié)信息和商用價(jià)值。vivo 在發(fā)布會(huì)中表示,將有望將 3D 技術(shù)應(yīng)用于更廣泛的各個(gè)場景中,如用戶可以在在線購物平臺(tái)中創(chuàng)造真人 3D 形象進(jìn)行試妝、試戴、試衣,或在 AR / VR / MR 手游中將掃描好的 3D 頭像植入到 3D 游戲中,創(chuàng)造逼真的同人角色。在發(fā)布會(huì)中,vivo 還宣布將開啟“3D 視覺開發(fā)者計(jì)劃”,邀請行業(yè)開發(fā)者、服務(wù)供應(yīng)商以及用戶一起探索并不斷提升 3D 視覺的性能表現(xiàn)及體驗(yàn)。
當(dāng)然,從技術(shù)上講,不止是人臉,我們可以通過 3D 實(shí)現(xiàn)對實(shí)體萬物的動(dòng)態(tài)實(shí)時(shí)建模。很快,面向手勢、人體、行為、商品、物體、城市甚至人與物體、人與場景的全面 3D 感知方案會(huì)陸續(xù)在終端實(shí)現(xiàn),而那時(shí)我們的感觀生活或許完全不同。
作為行業(yè)領(lǐng)先的移動(dòng) AI 解決方案提供商,曠視科技希望通過 AI 賦能與 3D 深度信息的結(jié)合創(chuàng)造出實(shí)用的算法和產(chǎn)品,進(jìn)而提升智能移動(dòng)終端用戶的解鎖,影像和交互體驗(yàn)。在手機(jī)領(lǐng)域,AI 和 3D 深度視覺的結(jié)合已經(jīng)給我們帶來了無限想象空間,而隨著對場景的深入探索和 3D 數(shù)據(jù)的開發(fā),曠視希望與更多行業(yè)伙伴和開發(fā)者一同推動(dòng) 3D 產(chǎn)業(yè)的發(fā)展。相信在未來 1-2 年內(nèi),3D 技術(shù)將會(huì)出現(xiàn)在我們生活的每一個(gè)角落,為我們帶來更多便利。
原文標(biāo)題:曠視科技:3D結(jié)構(gòu)光技術(shù)讓移動(dòng)支付更安全 ||聚焦
文章出處:【微信號:N1mobile,微信公眾號:第一手機(jī)界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。