2017-06-22 00:06:00.0
機器視覺(Machine Vision)是人工智能(néng)領域中發展(zhǎn)迅速的一個重要分支,目前正處於不斷突破、走向(xiàng)成熟的階段。一般認為(wéi)機器視覺(jiào)“是通過光學裝置(zhì)和非接觸傳感器自動地接受和處理一個真實場景的圖像,通過分析圖像獲得所需(xū)信息或用於控製機器運動的裝置”,可以看出智能圖像處理技術在機(jī)器視覺中占有舉足輕重的位(wèi)置。
智能圖像處理是指(zhǐ)一類基於計算機的自(zì)適應於各種應用場合的圖像處理和分析技術,本身是一個獨立的理論和技術領域,但同時又是機器視覺中的一項十分重(chóng)要的技術支撐。
具有(yǒu)智能圖像處理(lǐ)功能的機器視覺(jiào),相當於人們在賦予機(jī)器智能的(de)同時為機器按上了(le)眼睛(jīng),使機器能夠“看(kàn)得見”、“看得準”,可替代甚至(zhì)勝過人眼做測量和判斷,使得機器(qì)視覺係統可以(yǐ)實(shí)現高分辨率和高速度的控製。而且,機器視覺(jiào)係統與被檢測對象無接觸,安全可靠。
1.機器視覺技術
機器視覺(jiào)的起源可追溯到20世紀(jì)60年代(dài)美國學者L.R.羅伯茲(zī)對多麵體積木世界的(de)圖像處理研究,70年代麻省理工學院(MIT)人(rén)工智(zhì)能實驗室“機器視覺”課程(chéng)的開設。到80年代,全球性機器視覺研究熱潮開始興起,出現了一些基於機器視覺的應用係統。90年代以後,隨著計算機和半(bàn)導體技術的飛速發展,機器視覺的理論和應用得到(dào)進一步發展。
進入21世紀後,機(jī)器視覺技術的發展速度更快,已經(jīng)大規模地應用於(yú)多個領域,如智能製造、智能交通、醫療衛生、安防監控等領域(yù)。目前,隨著人工智能浪潮(cháo)的興起,機器視覺技術正(zhèng)處於不斷突破(pò)、走向成熟的新階段(duàn)。
在中國,機器視覺的研究和應用開(kāi)始於(yú)20世紀90年代。從跟蹤國外(wài)品牌產(chǎn)品起步,經過二十多年的(de)努力,國內的機(jī)器視覺從無到有,從弱(ruò)到強,不僅理(lǐ)論(lùn)研究進展(zhǎn)迅速,而且已經出現一些頗具(jù)競爭力的公司(sī)和產品。估計隨著(zhe)國內對機器視覺研究(jiū)、開發和推廣的不斷深入,趕上和超越世界水平已不是遙不可及的事(shì)情了。
常見(jiàn)機器視覺係統主要(yào)可分為兩類,一類(lèi)是基於計算機的,如工控機或PC,另(lìng)一類是更加緊湊的(de)嵌入式設備。典型的基於工控機的機(jī)器視覺係統主要包括:光學係統(tǒng),攝像機和(hé)工控(kòng)機(jī)(包含圖像采集、圖像(xiàng)處理和(hé)分析、控製(zhì)/通信)等單元。機器(qì)視覺係統對核心的圖像處理要求(qiú)算法準確、快捷和穩定,同時還要求係統的實現成本(běn)低,升級換(huàn)代方便。
2.智能圖(tú)像處(chù)理技(jì)術
機器視覺的圖像(xiàng)處理係統對現場的數字圖(tú)像信號按(àn)照(zhào)具體的應用要求進行運算和分(fèn)析,根據獲得的(de)處理結果來控製現(xiàn)場設備的動作,其常見功能(néng)如下:
(1)圖像采集
圖像采集就是從工作(zuò)現場獲取場景圖像的過(guò)程,是機器(qì)視(shì)覺的第一步,采集工具大多為CCD或CMOS照相(xiàng)機或攝像機。照相機采集的是單(dān)幅的圖像,攝像機可以采集連續的現場圖像。就一幅圖像而言,它實際上是三維場景在二(èr)維圖像平(píng)麵上的投影,圖像中某一點(diǎn)的彩色(亮度和色度)是場景中對應點彩色(sè)的反映。這就(jiù)是我們可以用采(cǎi)集圖像來替代真實場景的根本依(yī)據所在。
如果相機是模擬信號輸出,需要(yào)將(jiāng)模擬圖像信號數字化後送給計算機(包括嵌入式係統)處(chù)理(lǐ)。現在大部(bù)分(fèn)相機都可直接輸出數字圖像信號,可以免除模數(shù)轉換這一步驟。不僅如此,現在相機的數(shù)字輸出接口也是標準化的,如USB、VGA、1394、HDMI、WiFi、Blue Tooth接口等,可以直(zhí)接送入計算機(jī)進行處理,以免除(chú)在圖像(xiàng)輸出和(hé)計算機之間加接一塊圖像采(cǎi)集卡(kǎ)的麻煩。後續的圖像處理工作往(wǎng)往是由計算機或嵌入式係統以(yǐ)軟件的方式進行。
(2)圖像預處理
對於采集到(dào)的數字化的現場(chǎng)圖像,由於受到設備和環境因素的影響,往往會受到不同程度的幹擾,如噪聲、幾何形變、彩色失調等,都會妨礙接下來的處理環節。為此,必(bì)須對采集圖像進行預處(chù)理。常(cháng)見(jiàn)的預處理包括噪聲消(xiāo)除、幾(jǐ)何校正、直方圖均衡等處理。
通常使用時域或(huò)頻域濾波的方法來去除圖像中的噪聲;采用幾何變換的辦法來校正圖像的幾(jǐ)何失真;采用直(zhí)方圖均(jun1)衡、同態濾波等方法來減輕圖(tú)像的彩色偏離。總之,通過這一係列的圖像預處理技術,對采集圖像進行“加工(gōng)”,為體機器視覺應用提供“更好”、“更有用”的圖像。
(3)圖像分割(gē)
圖像分割就是按照應用要求,把圖像(xiàng)分成各具特征的區域(yù),從中(zhōng)提取出感興趣目標。在圖像中常見(jiàn)的特征有灰度、彩色、紋理、邊緣、角點等。例如,對汽車裝配流水線(xiàn)圖像進行分割,分成背景(jǐng)區(qū)域和工件區域,提供(gòng)給後(hòu)續處理單元對工件安(ān)裝部分的(de)處理。
圖像分割多年來一直是圖像(xiàng)處理中(zhōng)的難題,至今已有種類繁多的分(fèn)割算法,但是效果往往並不理(lǐ)想。近來,人們利(lì)用基於神經網絡的深度學習方法進行圖像分割,其性能勝過傳統算法。
(4)目標識別和分類
在製造或安防等行(háng)業,機器視覺(jiào)都離不開對輸入圖像的目標進(jìn)行(háng)識別和分類處理,以便在(zài)此基礎上完(wán)成後續的判斷和操作。識別和分類(lèi)技術有很(hěn)多相同的地方,常常在目標識別完成後,目標的類別也(yě)就明確了。近來的圖像識別技術正(zhèng)在跨越傳統方法,形成(chéng)以神經網絡為主流的智能化圖像識別方法,如卷積神經網絡(CNN)、回歸神(shén)經(jīng)網絡(RNN)等一類性能優越的方法。
(5)目標定位和測量
在智能製(zhì)造中,最常見的工作(zuò)就是對目標工件進行安裝,但是在安裝前往往需要先對目標進行定位,安裝後還需對目標進行測量。安裝和測量都需要保持較(jiào)高的精度和速度,如毫米級精度(甚至更小),毫秒級速度。這種高(gāo)精度、高(gāo)速(sù)度的(de)定位和測量,倚(yǐ)靠通常的機(jī)械或人工的方(fāng)法是難以辦到的。在機器視覺中,采(cǎi)用圖像處(chù)理的辦法,對安裝現場(chǎng)圖像進行處理,按照目標和圖像之間的複雜映射關係進行處理,從而快速精(jīng)準地完成定位和測量(liàng)任務(wù)。
(6)目標檢測和跟蹤 圖像處理中(zhōng)的運動目標檢(jiǎn)測和跟蹤,就是實時檢測攝像機捕獲的場景圖像中是否有運動(dòng)目(mù)標,並預測它下一步的(de)運動方向和趨勢,即跟蹤。並及時將這些運動數據提交給後續的分析和控製處理,形成(chéng)相應的控製動作。圖像采(cǎi)集一般使(shǐ)用單(dān)個攝像機,如果需要也可以使用兩個攝像機,模仿人的雙目視覺而獲得(dé)場景的立體信息,這樣(yàng)更加有利於目標檢測和跟蹤處理。
3.機器視覺的應用
機(jī)器視覺應用廣泛,如安防、製造、教育、出版、醫療、交通、軍事領域等。在(zài)這些機器數額的應用中,智能圖像處理都是不可(kě)或缺的,這裏僅簡要介紹其中幾個方麵的應用。
(1)智能製(zhì)造
為了實現中國智能製(zhì)造2025這(zhè)一宏偉(wěi)目標,離不開機器視覺。例如,在智能圖像處理一直處於領先地位的廣東迅通科技股份有限公司(以下簡稱“迅通科技”)針對這一需求開發出了機器視(shì)覺分析儀平台。其中,迅通科技為某知名汽車廠商裝配流水線開發(fā)的車門限位器自動定位、檢測和識別的係統(tǒng)。該係統通過智(zhì)能圖像識(shí)別方式,自動檢測型號是否(fǒu)正確,定位是否準確,完全代替了人工操作,檢測準確率達到100%。此前,每個工位需要4個工人用眼睛來檢查、定位16種型號限位器,員工不僅很容易疲勞,還時常出現差錯。
(2)教育考試
考試試卷時常發現因排版或印刷錯(cuò)誤影響學生考試,利用智能圖(tú)像處理技術,機器自動對印刷後的試卷和原版(bǎn)試卷進行(háng)比對,發現不一致之處,會自動提示並報警,完全替代(dài)之(zhī)前隻(zhī)能通過人工對試卷進行校驗。
(3)出版印刷
和教育考試類似,專業出版(bǎn)印刷廠由於印刷的圖書、報紙雜誌,以及(jí)承接來自企業產品包裝和宣傳資料的種類多,數量大,排版和印刷中(zhōng)經常出錯。為此,需安排(pái)不少專業人員進行校對,耗費大量(liàng)的資金(jīn)和(hé)時間。通過利用智能圖(tú)像處理(lǐ)技術(shù)進行自動校對,既提高了校對準確(què)度,又縮短了校對時間(jiān),降低(dī)了印刷成本,縮短了出版物的交付周(zhōu)期(qī)。
(4)安防監控
這是當前備受機器視覺關注的一個領域。機器視覺打破了傳統視頻監控係統(tǒng)的限製,增加了係統的智能,使得智能視頻分析得以逐步實現。以公共(gòng)場所的視頻監控為例,通(tōng)過運用機器視覺(jiào)技術,可(kě)以實現對可(kě)疑人物的自(zì)動檢測、人臉識別、實(shí)時跟蹤,必要時還可以(yǐ)實現多攝像機接連跟蹤,同時發出告警,存儲(chǔ)現場信(xìn)息。
(5)智能交通
機器視覺在交通領(lǐng)域有著廣泛的應用(yòng)。例如,在高速公路上及卡口處,對來往車輛進行車型、牌照等識別(bié),甚至對行駛車輛的違(wéi)規行為(wéi)進行識別。在汽車(chē)上對駕駛員(yuán)麵部圖像進行(háng)分(fèn)析,判斷(duàn)駕駛員是否處於疲勞駕駛狀(zhuàng)態。再如,無(wú)人駕駛汽車借助於機器視(shì)覺技術,使用攝像頭、激光/毫米波/超(chāo)聲波雷達、GPS等感(gǎn)知道路環境信息,自動規劃和控(kòng)製車輛的安全行駛(shǐ)。
有數據(jù)顯示,2016年全球機器視覺係統的市(shì)場規模約46億(yì)美元, 2017年約50億美元,預計2018年達到55億美元,年增長率為10%左右。中國機器視覺(jiào)市場(chǎng)的增長是從2010年開始的,2017年(nián)市場規模約68億元,預計到2020年或達780億元,市場(chǎng)增長率將超過(guò)100%。
4.技術瓶頸及(jí)今後的發展
在機(jī)器視覺的智能圖像處理技術的發展中,還存在(zài)不少技術瓶頸,如:
1)穩定性:某種處理方法往往在研究和開(kāi)發中(zhōng)表現良好,但在複雜多變的應(yīng)用環境中,卻不時地出現問題(tí)。例如人臉識別係統,在目(mù)標配合時識別率可高達95%以上,但在實際監(jiān)控環境下,識別率就(jiù)會大大下降。
2)實時性:如果圖像的采(cǎi)集速度、處(chù)理(lǐ)速度較(jiào)慢,再加上新近引入的深度學習類算法,加大了係統實時處理的(de)難度,跟不上機器運行和(hé)控製(zhì)的節奏。
3)準確性:機器視覺係統要求圖像識別和測量(liàng)的準確性接近100%,任何微小的誤差都有可能帶(dài)來不可(kě)預(yù)測的(de)後果。例如目標定位的誤差(chà)會使裝配(pèi)出來的設備(bèi)不符合要求。
4)係統能力:目前的嵌入式圖像處理係統,存在芯片的計算能力不足,存儲空間有限等(děng)問題,常常(cháng)不能滿足運算量較大(dà)的圖像處理運算(suàn),如神經網絡的迭代運算,大規(guī)模矩陣運(yùn)算等。
今(jīn)後機器視覺中智能圖像處理的發展主要體現在以下幾(jǐ)個方麵(miàn):
1)算法:傳統算法繼續(xù)不(bú)斷有所突破,新一波人工智能浪潮帶來不少新的性能優良(liáng)的圖(tú)像處理算法,如深度學習(DL),卷積神經網絡(CNN),生成對抗網絡(GAN),等等。
2)實(shí)時(shí)性:出現更多結構新穎、資源充足、運算快速的硬件平台支撐(chēng),例如基於(yú)多CPU、多GPU的並(bìng)行處理結構的計算機,海量存(cún)儲單元等。
3)嵌入式:新的高速的信號處理器陣列,超大規模FPGA芯片。
4)融合(hé)處理:從(cóng)單圖(tú)像傳感器發展到多傳感器(多視點)的融合處理,可更加充分地獲取現場信息。還可融合多類傳感器,如圖像傳感器、聲音傳感器、溫度傳感(gǎn)器等共(gòng)同(tóng)完對現場目標(biāo)定(dìng)位、識別和測量。
總之,無論是“中國製造2025”還是“工業4.0”都離不開人(rén)工智能,離不開計算(suàn)機視覺,而智能圖像處理是機器視覺的核心技術(shù),隨著圖像處理水平的不斷提高,一定會有力地(dì)推動機(jī)器視(shì)覺的迅速發展。
上一條:智慧消防監測預警係統(tǒng)
下(xià)一條:客戶至上,誠信服務
官方微信
手機版