本文主要是關(guān)于機(jī)器視覺(jué)的相關(guān)介紹,并著重對(duì)機(jī)器視覺(jué)的應(yīng)用場(chǎng)景進(jìn)行了詳盡的闡述。
機(jī)器視覺(jué)是人工智能正在快速發(fā)展的一個(gè)分支。簡(jiǎn)單說(shuō)來(lái),機(jī)器視覺(jué)就是用機(jī)器代替人眼來(lái)做測(cè)量和判斷。機(jī)器視覺(jué)系統(tǒng)是通過(guò)機(jī)器視覺(jué)產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來(lái)控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。
機(jī)器視覺(jué)是一項(xiàng)綜合技術(shù),包括圖像處理、機(jī)械工程技術(shù)、控制、電光源照明、光學(xué)成像、傳感器、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)軟硬件技術(shù)(圖像增強(qiáng)和分析算法、圖像卡、 I/O卡等)。一個(gè)典型的機(jī)器視覺(jué)應(yīng)用系統(tǒng)包括圖像捕捉、光源系統(tǒng)、圖像數(shù)字化模塊、數(shù)字圖像處理模塊、智能判斷決策模塊和機(jī)械控制執(zhí)行模塊。 [2] 機(jī)器視覺(jué)系統(tǒng)最基本的特點(diǎn)就是提高生產(chǎn)的靈活性和自動(dòng)化程度。在一些不適于人工作業(yè)的危險(xiǎn)工作環(huán)境或者人工視覺(jué)難以滿足要求的場(chǎng)合,常用機(jī)器視覺(jué)來(lái)替代人工視覺(jué)。同時(shí),在大批量重復(fù)性工業(yè)生產(chǎn)過(guò)程中,用機(jī)器視覺(jué)檢測(cè)方法可以大大提高生產(chǎn)的效率和自動(dòng)化程度。
一個(gè)典型的工業(yè)機(jī)器視覺(jué)系統(tǒng)包括:光源、鏡頭(定焦鏡頭、變倍鏡頭、遠(yuǎn)心鏡頭、顯微鏡頭)、 相機(jī)(包括CCD相機(jī)和COMS相機(jī))、圖像處理單元(或圖像捕獲卡)、圖像處理軟件、監(jiān)視器、通訊 / 輸入輸出單元等。
系統(tǒng)可再分為
一、采集和分析分開的系統(tǒng)。
主端電腦(Host Computer)
影像擷取卡(Frame Grabber)與影像處理器
影像攝影機(jī)
定焦鏡頭鏡頭
顯微鏡頭
照明設(shè)備
Halogen光源LED光源
高周波螢光燈源
閃光燈源
其他特殊光源
影像顯示器
LCD
機(jī)構(gòu)及控制系統(tǒng)
PLC、PC-Base控制器
精密桌臺(tái)
伺服運(yùn)動(dòng)機(jī)臺(tái)
二、采集和分析一體的系統(tǒng)
智能相機(jī)(圖像采集和分析一體)
其他配套外圍設(shè)備:光源、顯示、PLC控制系統(tǒng)等等。
工作原理
機(jī)器視覺(jué)檢測(cè)系統(tǒng)采用CCD照相機(jī)將被檢測(cè)的目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào),圖像處理系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,如面積、數(shù)量、位置、長(zhǎng)度,再根據(jù)預(yù)設(shè)的允許度和其他條件輸出結(jié)果,包括尺寸、角度、個(gè)數(shù)、合格 / 不合格、有 / 無(wú)等,實(shí)現(xiàn)自動(dòng)識(shí)別功能。
典型結(jié)構(gòu)
一個(gè)典型的機(jī)器視覺(jué)系統(tǒng)包括以下五大塊:
照明
照明是影響機(jī)器視覺(jué)系統(tǒng)輸入的重要因素,它直接影響輸入數(shù)據(jù)的質(zhì)量和應(yīng)用效果。由于沒(méi)有通用的機(jī)器視覺(jué)照明設(shè)備,所以針對(duì)每個(gè)特定的應(yīng)用實(shí)例,要選擇相應(yīng)的照明裝置,以達(dá)到最佳效果。光源可分為可見光和不可見光。常用的幾種可見光源是白熾燈、日光燈、水銀燈和鈉光燈??梢姽獾娜秉c(diǎn)是光能不能保持穩(wěn)定。如何使光能在一定的程度上保持穩(wěn)定,是實(shí)用化過(guò)程中急需要解決的問(wèn)題。另一方面,環(huán)境光有可能影響圖像的質(zhì)量,所以可采用加防護(hù)屏的方法來(lái)減少環(huán)境光的影響。照明系統(tǒng)按其照射方法可分為:背向照明、前向照明、結(jié)構(gòu)光和頻閃光照明等。其中,背向照明是被測(cè)物放在光源和攝像機(jī)之間,它的優(yōu)點(diǎn)是能獲得高對(duì)比度的圖像。前向照明是光源和攝像機(jī)位于被測(cè)物的同側(cè),這種方式便于安裝。結(jié)構(gòu)光照明是將光柵或線光源等投射到被測(cè)物上,根據(jù)它們產(chǎn)生的畸變,解調(diào)出被測(cè)物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機(jī)拍攝要求與光源同步。
鏡頭
FOV(Field of Vision)=所需分辨率*亞象素*相機(jī)尺寸/PRTM(零件測(cè)量公差比)
鏡頭選擇應(yīng)注意:
1焦距2目標(biāo)高度 3影像高度 4放大倍數(shù) 5影像至目標(biāo)的距離 6中心點(diǎn) /節(jié)點(diǎn)7畸變
視覺(jué)檢測(cè)中如何確定鏡頭的焦距
為特定的應(yīng)用場(chǎng)合選擇合適的工業(yè)鏡頭時(shí)必須考慮以下因素:
· 視野 - 被成像區(qū)域的大小。
· 工作距離 (WD) - 攝像機(jī)鏡頭與被觀察物體或區(qū)域之間的距離。
· CCD - 攝像機(jī)成像傳感器裝置的尺寸。
· 這些因素必須采取一致的方式對(duì)待。如果在測(cè)量物體的寬度,則需要使用水平方向的 CCD 規(guī)格,等等。如果以英寸為單位進(jìn)行測(cè)量,則以英尺進(jìn)行計(jì)算,最后再轉(zhuǎn)換為毫米。
參考如下例子:有一臺(tái) 1/3” C 型安裝的 CCD 攝像機(jī)(水平方向?yàn)?4.8 毫米)。物體到鏡頭前部的距離為 12”(305 毫米)。視野或物體的尺寸為2.5”(64 毫米)。換算系數(shù)為 1” = 25.4 毫米(經(jīng)過(guò)圓整)。
FL = 4.8 毫米 x 305 毫米 / 64 毫米
FL = 1464 毫米 / 64 毫米
FL = 按 23 毫米鏡頭的要求
FL = 0.19” x 12” / 2.5”
FL = 2.28” / 2.5”
FL = 0.912” x 25.4 毫米/inch
FL = 按 23 毫米鏡頭的要求
注:勿將工作距離與物體到像的距離混淆。工作距離是從工業(yè)鏡頭前部到被觀察物體之間的距離。而物體到像的距離是 CCD 傳感器到物體之間的距離。計(jì)算要求的工業(yè)鏡頭焦距時(shí),必須使用工作距離
高速相機(jī)
按照不同標(biāo)準(zhǔn)可分為:標(biāo)準(zhǔn)分辨率數(shù)字相機(jī)和模擬相機(jī)等
。要根據(jù)不同的實(shí)際應(yīng)用場(chǎng)合選不同的相機(jī)和高分辨率相機(jī):
按成像色彩劃分,可分為彩色相機(jī)和黑白相機(jī);
按分辨率劃分,像素?cái)?shù)在38萬(wàn)以下的為普通型,像素?cái)?shù)在38萬(wàn)以上的高分辨率型;
按光敏面尺寸大小劃分,可分為1/4、1/3、1/2、1英寸相機(jī);
按掃描方式劃分,可分為行掃描相機(jī)(線陣相機(jī))和面掃描相機(jī)(面陣相機(jī))兩種方式;(面掃描相機(jī)又可分為隔行掃描相機(jī)和逐行掃描相機(jī));
按同步方式劃分,可分為普通相機(jī)(內(nèi)同步)和具有外同步功能的相機(jī)等。
圖像采集卡
圖像采集卡只是完整的機(jī)器視覺(jué)系統(tǒng)的一個(gè)部件,但是
它扮演一個(gè)非常重要的角色。圖像采集卡直接決定了攝像頭的接口:黑白、彩色、模擬、數(shù)字等等。
比較典型的是PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計(jì)算機(jī)存儲(chǔ)器進(jìn)行處理。有些采集卡有內(nèi)置的多路開關(guān)。例如,可以連接8個(gè)不同的攝像機(jī),然后告訴采集卡采用那一個(gè)相機(jī)抓拍到的信息。有些采集卡有內(nèi)置的數(shù)字輸入以觸發(fā)采集卡進(jìn)行捕捉,當(dāng)采集卡抓拍圖像時(shí)數(shù)字輸出口就觸發(fā)閘門。
視覺(jué)處理器
視覺(jué)處理器集采集卡與處理器于一體。以往計(jì)算機(jī)速度較慢時(shí),采用視覺(jué)處理器加快視覺(jué)處理任務(wù)。采集卡傳輸圖像到存儲(chǔ)器,進(jìn)而計(jì)算分析。當(dāng)前主流配置的PLC,且配置較高,視覺(jué)處理器已經(jīng)幾乎退出市場(chǎng)。
TOP 1:人臉識(shí)別
人臉識(shí)別是人工智能視覺(jué)與圖像領(lǐng)域中最熱門的應(yīng)用, 今年 2 月,《麻省理工科技評(píng)論》發(fā)布「2017 全球十大突破性技術(shù)」榜單,來(lái)自中國(guó)的技術(shù)「刷臉支付」位列其中。這是該榜單創(chuàng)建 16 年來(lái)首個(gè)來(lái)自中國(guó)的技術(shù)突破。
人臉識(shí)別技術(shù)目前已經(jīng)廣泛應(yīng)用于金融、司法、軍隊(duì)、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療等行業(yè)。據(jù)業(yè)內(nèi)人士分析,我國(guó)的人臉識(shí)別產(chǎn)業(yè)的需求旺盛,需求推動(dòng)導(dǎo)致企業(yè)敢于投入資金。目前,該技術(shù)已具備大規(guī)模商用的條件,未來(lái)三到五年將高速增長(zhǎng)。而今年,這一技術(shù)有望在金融與安防領(lǐng)域迎來(lái)大爆發(fā)。
TOP 2:視頻/監(jiān)控分析
視頻/監(jiān)控分析是人工智能視覺(jué)與圖像領(lǐng)域中第二大熱門應(yīng)用。
人工智能技術(shù)可以對(duì)結(jié)構(gòu)化的人、車、物等視頻內(nèi)容信息進(jìn)行快速檢索、查詢。這項(xiàng)應(yīng)用使得讓公安系統(tǒng)在繁雜的監(jiān)控視頻中搜尋到罪犯的有了可能。在大量人群流動(dòng)的交通樞紐,該技術(shù)也被廣泛用于人群分析、防控預(yù)警等。
視頻/監(jiān)控領(lǐng)域盈利空間廣闊,商業(yè)模式多種多樣,既可以提供行業(yè)整體解決方案,也可以銷售集成硬件設(shè)備。將技術(shù)應(yīng)用于視頻及監(jiān)控領(lǐng)域在人工智能公司中正在形成一種趨勢(shì),這項(xiàng)技術(shù)應(yīng)用將率先在安防、交通甚至零售等行業(yè)掀起應(yīng)用熱潮。
TOP 3:圖片識(shí)別分析
靜態(tài)圖片識(shí)別應(yīng)用熱度在視覺(jué)與圖像領(lǐng)域中排名第三。將人工智能技術(shù)單純用于圖片識(shí)別分析的應(yīng)用企業(yè)數(shù)量并不如預(yù)想的多,可能有一下幾個(gè)方面原因:
1、目前視頻監(jiān)控方向的盈利空間大,眾多企業(yè)的注意力都放在了視頻監(jiān)控領(lǐng)域;
2、人臉識(shí)別屬于圖片識(shí)別的一個(gè)應(yīng)用場(chǎng)景,做人臉識(shí)別的大多數(shù)企業(yè)同時(shí)也在提供圖片識(shí)別服務(wù),但是銷售效果不佳,主要贏利點(diǎn)還在于人臉識(shí)別;
3、圖片識(shí)別大多商用場(chǎng)景還屬于藍(lán)海,潛力有待開發(fā);
4、圖片數(shù)據(jù)大多被大型互聯(lián)網(wǎng)企業(yè)所掌握,創(chuàng)業(yè)公司數(shù)據(jù)資源稀少。
TOP 4:駕駛輔助/智能駕駛
隨著汽車的普及,汽車已經(jīng)成為人工智能技術(shù)非常大的應(yīng)用投放方向,但就目前來(lái)說(shuō),想要完全實(shí)現(xiàn)自動(dòng)駕駛/無(wú)人駕駛,距離技術(shù)成熟還有一段路要走。
不過(guò)利用人工智能技術(shù),汽車的駕駛輔助的功能及應(yīng)用越來(lái)越多,這些應(yīng)用多半是基于計(jì)算機(jī)視覺(jué)和圖像處理技術(shù)來(lái)實(shí)現(xiàn)。
TOP 5:三維圖像視覺(jué)
三維圖像視覺(jué)主要是對(duì)于三維物體的識(shí)別,應(yīng)用于三維視覺(jué)建模,三維測(cè)繪等領(lǐng)域。
TOP 6:工業(yè)視覺(jué)檢測(cè)
機(jī)器視覺(jué)可以快速獲取大量信息,并進(jìn)行自動(dòng)處理。在自動(dòng)化生產(chǎn)過(guò)程中,人們將機(jī)器視覺(jué)系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗(yàn)和質(zhì)量控制等領(lǐng)域。
機(jī)器視覺(jué)系統(tǒng)的特點(diǎn)是提高生產(chǎn)的柔性和自動(dòng)化程度。運(yùn)用在一些危險(xiǎn)工作環(huán)境或人工視覺(jué)難以滿足要求的場(chǎng)合;此外,在大批量工業(yè)生產(chǎn)過(guò)程中,機(jī)器視覺(jué)檢測(cè)可以大大提高生產(chǎn)效率和生產(chǎn)的自動(dòng)化程度。
TOP 7:醫(yī)療影像診斷
醫(yī)療數(shù)據(jù)中有超過(guò) 90% 的數(shù)據(jù)來(lái)自醫(yī)療影像。醫(yī)療影像領(lǐng)域擁有孕育深度學(xué)習(xí)的海量數(shù)據(jù),醫(yī)療影像診斷可以輔助醫(yī)生,提升醫(yī)生的診斷的效率。
2015 年 4 月,IBM 成立了 Watson Health 部門,開始進(jìn)軍醫(yī)療行業(yè)。2015 年 8 月 6 日,IBM 宣布以 10 億美元的價(jià)格收購(gòu)醫(yī)療影像公司 MergeHealthcare,并將其與新成立的 WatsonHealth 合并。2016 年 2 月,IBM 又斥資 26 億美元收購(gòu)醫(yī)療數(shù)據(jù)公司 TruvenHealthAnalytics。今年 2 月份,在 HIMSS17 大會(huì)上 Watson Health 公布了 IBM 的第
TOP 8:文字識(shí)別
計(jì)算機(jī)文字識(shí)別,俗稱光學(xué)字符識(shí)別,它是利用光學(xué)技術(shù)和計(jì)算機(jī)技術(shù)把印在或?qū)懺诩埳系奈淖肿x取出來(lái),并轉(zhuǎn)換成一種計(jì)算機(jī)能夠接受、人又可以理解的格式。這是實(shí)現(xiàn)文字高速錄入的一項(xiàng)關(guān)鍵技術(shù)。
TOP 9:圖像及視頻編輯
2016 年,Google 舉行了一場(chǎng)人工智能作家的畫展。通過(guò)一個(gè)名叫DeepDream的藝術(shù)生成器,谷歌可以將神經(jīng)網(wǎng)絡(luò)由內(nèi)部傳送到外部。不是識(shí)別圖像,而是創(chuàng)作圖像。有人稱這些機(jī)器做的畫為機(jī)器之夢(mèng)。
目前市場(chǎng)上也出現(xiàn)了很多運(yùn)用及機(jī)器學(xué)習(xí)算法對(duì)圖像進(jìn)行處理,可以實(shí)現(xiàn)對(duì)圖片的自動(dòng)修復(fù)、美化、變換效果等操作。并且越來(lái)越受到用戶青睞。
機(jī)器視覺(jué)在應(yīng)用場(chǎng)景上逐漸突破工業(yè)檢測(cè),其應(yīng)用邊界逐步向智能生活領(lǐng)域拓展。由于機(jī)器視覺(jué)在智能生活、智能制造兩個(gè)領(lǐng)域具有不同的技術(shù)特點(diǎn)和應(yīng)用進(jìn)展,所以機(jī)器視覺(jué)于這兩個(gè)領(lǐng)域的行業(yè)發(fā)展趨勢(shì)也不盡相同。
一、機(jī)器視覺(jué)軟件選型要點(diǎn)
1、定位器的準(zhǔn)確性
目標(biāo)或特征的準(zhǔn)確定位是一個(gè)檢測(cè)體系或由視覺(jué)引導(dǎo)的運(yùn)動(dòng)體系的重要功用。傳統(tǒng)的物體定位選用的是灰度值有關(guān)來(lái)辨認(rèn)物體。盡管這種技能得到了廣泛的運(yùn)用,可是,它在圖象質(zhì)量變差的狀況,就缺少穩(wěn)定性。圖象質(zhì)量變差可能是因?yàn)殡s亂、亮度不一樣和隱瞞等要素的影響。相反,幾何目標(biāo)定位法是一種最新的辦法,它運(yùn)用目標(biāo)的概括來(lái)辨認(rèn)目標(biāo)及其特征。維視圖像自主研發(fā)的圖像處理軟件多數(shù)采用幾何目標(biāo)定位法,且效率極高,可以有效的幫助用戶解決定位問(wèn)題。
2、工具庫(kù)還是應(yīng)用軟件
機(jī)器視覺(jué)軟件主要以兩種典型的方式出售:一種是包含多種處理算法的工具庫(kù),另一種是專門實(shí)現(xiàn)某一類特殊工作的應(yīng)用軟件。這兩種各有利弊,需要第一時(shí)間確認(rèn)這一特性后再做選擇。維視圖像提供的圖像處理軟件包含這兩種,既可以提供專業(yè)應(yīng)用又滿足客戶變化多樣的需求。
3、編程和操作方便
簡(jiǎn)練、直觀的圖形界面是簡(jiǎn)單運(yùn)用和設(shè)置的要害。當(dāng)今機(jī)器視覺(jué)商品之間的主要區(qū)別在于他們的圖形接口。接口大概從“設(shè)置”和“操作”這兩方面來(lái)評(píng)估。對(duì)一個(gè)工程師來(lái)講,它大概十分復(fù)雜,而關(guān)于一個(gè)操作者來(lái)說(shuō)應(yīng)十分簡(jiǎn)單。
4、亞像素精度
視覺(jué)體系的分辯率是體系能分辯的最小特征。例如,1’’的視覺(jué)規(guī)模(FOV)運(yùn)用一個(gè)640x480像素的計(jì)算機(jī)圖象將得到1/640的分辯率或0.00156’’。實(shí)際上,機(jī)器視覺(jué)算法具有亞像素的才能。也就是說(shuō),這些算法可以丈量或得出比一個(gè)像素更小的單位。
5、易于升級(jí)
機(jī)器視覺(jué)體系可運(yùn)用在各種場(chǎng)合,他們的運(yùn)用規(guī)??蓮臅r(shí)尚的攝像機(jī)到監(jiān)督體系。當(dāng)挑選一個(gè)體系時(shí)應(yīng)思考體系將來(lái)的升級(jí)。依據(jù)通用目的的視覺(jué)軟件體系十分好晉級(jí)。最終用戶大概依據(jù)附加的攝像機(jī)、照明的改變、視覺(jué)東西的改變等來(lái)思考將來(lái)對(duì)體系的需要。
6、圖象預(yù)處理算法
大部分的圖像處理軟件提供預(yù)處理算法,所以需要比較其提供的豐富程度,效率等。
7、體系集成
假如你對(duì)機(jī)器視覺(jué)技能不是很精通,那么針對(duì)你的項(xiàng)目就需要一個(gè)體系集成商,理想的視覺(jué)商品能被體系集成商廣泛承受。
二、常用機(jī)器視覺(jué)軟件介紹
1. OpenCV,開源免費(fèi)的圖像處理庫(kù)
OpenCV是近年來(lái)推出的開源、免費(fèi)的計(jì)算機(jī)視覺(jué)庫(kù),利用其所包含的函數(shù)可以很方便地實(shí)現(xiàn)數(shù)字圖像和視頻處理。同時(shí)利用面向?qū)ο蟮腣C++ 6.0編程工具,用C++語(yǔ)言進(jìn)行程序編寫 OpenCV算法庫(kù)為VC++編程處理數(shù)字圖像提供了很大的方便,其必將成為圖像視頻處理領(lǐng)域的強(qiáng)有力的工具。
缺點(diǎn):由于是開源軟件,因此其版本繁多,函數(shù)庫(kù)復(fù)雜,執(zhí)行效率收到應(yīng)用,比較適用于科研和學(xué)習(xí),不適合工業(yè)應(yīng)用。
2. Halcon,強(qiáng)大的圖像處理庫(kù)
HALCON是德國(guó)MVtec公司開發(fā)的一套完善的標(biāo)準(zhǔn)的機(jī)器視覺(jué)算法包,擁有應(yīng)用廣泛的機(jī)器視覺(jué)集成開發(fā)環(huán)境。它節(jié)約了產(chǎn)品成本,縮短了軟件開發(fā)周期——HALCON靈活的架構(gòu)便于機(jī)器視覺(jué),醫(yī)學(xué)圖像和圖像分析應(yīng)用的快速開發(fā)。在歐洲以及日本的工業(yè)界已經(jīng)是公認(rèn)具有最佳效能的Machine Vision軟件
缺點(diǎn):價(jià)格比較貴,每次分發(fā)需要重新購(gòu)買授權(quán)。
3. NI Vision,快速驗(yàn)證的圖像處理庫(kù)(含視覺(jué)助手、VBAI)
關(guān)于機(jī)器視覺(jué)的相關(guān)介紹就到這了,如有不足之處歡迎指正。
相關(guān)閱讀推薦:什么是機(jī)器視覺(jué),有何實(shí)際意義
相關(guān)閱讀推薦:關(guān)于機(jī)器視覺(jué)的一些事