期刊大全 雜志訂閱 SCI期刊 投稿指導(dǎo) 期刊服務(wù) 文秘服務(wù) 出版社 登錄/注冊(cè) 購(gòu)物車(0)

首頁(yè) > 公文范文 > 計(jì)算機(jī)視覺論文

計(jì)算機(jī)視覺論文

時(shí)間:2022-05-02 05:19:48

序論:寫作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來(lái)了一篇計(jì)算機(jī)視覺論文范文,愿它們成為您寫作過(guò)程中的靈感催化劑,助力您的創(chuàng)作。

計(jì)算機(jī)視覺論文

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺檢測(cè)技術(shù)在機(jī)加工零件測(cè)量中的應(yīng)用探究

現(xiàn)階段,我國(guó)的市面上有很多不同的方法來(lái)進(jìn)行機(jī)械零件尺寸的測(cè)量和研究,采取不同的測(cè)量辦法,得出的結(jié)果也有著精確度的差異。原始的測(cè)量方法是人們通過(guò)借助各種測(cè)量?jī)x器,如萬(wàn)能工具顯微鏡和三坐標(biāo)測(cè)量機(jī)等,進(jìn)行人工測(cè)量操作。這種方式存在著很多弊端,而計(jì)算機(jī)視覺檢測(cè)技術(shù)的應(yīng)用則可以很好地解決這一問(wèn)題。所謂視覺檢測(cè)就是檢測(cè)被測(cè)目標(biāo)時(shí),把圖像當(dāng)作檢測(cè)和傳遞信息的手段或載體加以利用的檢測(cè)方法,其目的是從圖像中提取有用的信號(hào),它是以現(xiàn)代光學(xué)為基礎(chǔ),融光電子學(xué)、計(jì)算機(jī)圖像學(xué)、信息處理、計(jì)算機(jī)視覺等科學(xué)技術(shù)為一體的現(xiàn)代檢測(cè)技術(shù)。由于計(jì)算機(jī)視覺系統(tǒng)可以快速獲取大量信息,而且易于與設(shè)計(jì)信息及加工控制信息集成,基于視覺檢測(cè)技術(shù)的儀器設(shè)備能夠?qū)崿F(xiàn)智能化、數(shù)字化、小型化、網(wǎng)絡(luò)化和多功能化,具備在線檢測(cè)、實(shí)時(shí)分析、實(shí)時(shí)控制的能力在軍事、工業(yè)、商業(yè)、醫(yī)學(xué)等領(lǐng)域得到廣泛關(guān)注和應(yīng)用。

一、計(jì)算機(jī)視覺檢測(cè)技術(shù)含義

計(jì)算機(jī)的視覺又叫做機(jī)器視覺,通過(guò)利用計(jì)算機(jī)或者是其他的一些機(jī)械設(shè)備來(lái)幫助人們視線事物到圖片的過(guò)程,從而進(jìn)行三維世界的感知活動(dòng)。計(jì)算機(jī)的快速發(fā)展,離不開神經(jīng)心理學(xué),心理學(xué)和認(rèn)知科學(xué)方面的研究和發(fā)展,計(jì)算機(jī)視覺檢測(cè)技術(shù)的發(fā)展方向就是對(duì)周圍的三維空間進(jìn)行感知和分析。一旦能夠擁有這種能力,計(jì)算機(jī)不僅能感知到周圍的總體環(huán)境,而且,還能夠具有對(duì)物體進(jìn)行描述,識(shí)別理解和儲(chǔ)存的能力。

二、計(jì)算機(jī)視覺檢測(cè)的基本原理

要實(shí)現(xiàn)人工智能對(duì)視覺的計(jì)算機(jī)處理是很重要的方面在計(jì)算機(jī)視覺應(yīng)用領(lǐng)域中如果要讓我們的計(jì)算機(jī)明白圖像的信息就必須經(jīng)過(guò)一系列的處理過(guò)程―――數(shù)字圖像處理.數(shù)字圖像的處理包括5個(gè)步驟:圖像預(yù)處理(去除噪聲)、分割處理分割后區(qū)域、測(cè)量、圖像判讀、圖像技術(shù).根據(jù)抽象程度和處理方法的不同圖像技術(shù)可分為三個(gè)層次:圖像處理、圖像分析和圖像理解.這三個(gè)層次的有機(jī)結(jié)合也稱為圖像工程.而計(jì)算機(jī)視覺(Computer vision)則是用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能對(duì)客觀世界三維場(chǎng)景的感知、識(shí)別和理解.視覺檢測(cè)按其所處理的數(shù)據(jù)類型又大致可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測(cè).另外還有X射線檢測(cè)、超聲波檢測(cè)和紅外線檢測(cè)。

作為新興檢測(cè)技術(shù)計(jì)算機(jī)視覺檢測(cè)充分利用了計(jì)算機(jī)視覺研究成果采用像傳感器來(lái)實(shí)現(xiàn)對(duì)被測(cè)物體的尺寸及空間位置的三維測(cè)量能較好地滿足現(xiàn)代制造業(yè)的發(fā)展需求.與一般意義上的圖像處理相比計(jì)算機(jī)視覺檢測(cè)更強(qiáng)調(diào)精度、速度和無(wú)損性以及工業(yè)現(xiàn)場(chǎng)環(huán)境下的可靠性.例如基于三角法的主動(dòng)視覺測(cè)量理具有抗干擾能力強(qiáng)、效率高、精度合適等優(yōu)點(diǎn)非常適合制造業(yè)生產(chǎn)現(xiàn)場(chǎng)的在線、非接觸產(chǎn)品檢測(cè)及生產(chǎn)監(jiān)控.對(duì)人類視覺感知能力的計(jì)算機(jī)模擬促進(jìn)了計(jì)算機(jī)視覺技術(shù)的產(chǎn)生和發(fā)展制造業(yè)上獲取這些信息的目的有:(1)計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;(2)得出觀察點(diǎn)到目標(biāo)物體的運(yùn)動(dòng)參數(shù);(3)甚至可以判斷出目標(biāo)物體的內(nèi)部特性;(4)推斷出目標(biāo)物體的表面特征有時(shí)要求形成立體視覺。

三、亞像素檢測(cè)技術(shù)

隨著工業(yè)檢測(cè)等應(yīng)用對(duì)精度要求的不斷提高,像素級(jí)精度已經(jīng)不能滿足實(shí)際檢測(cè)的要求,因此需要更高精度的邊緣提取算法,即亞像素算法。亞像素級(jí)精度的算法是在經(jīng)典算法的基礎(chǔ)上發(fā)展起來(lái)的,這些算法一般需要先用經(jīng)典算法找出邊緣像素的位置,然后使用周圍像素的灰度值作為判斷的補(bǔ)充信息,利用插值、擬合等方法,使邊緣定位于更加精確的位置?,F(xiàn)在的亞像素提取算法很多,如重心法、概率論法、解調(diào)測(cè)量法、多項(xiàng)式插值法、濾波重建法、矩法等。由于這些算法的精度、抗噪聲能力和運(yùn)算量各不相同,他們的應(yīng)用場(chǎng)合也是各不相同的。

邊緣是圖像的基本特征,所謂邊緣是指圖像中灰度存在階躍或尖頂狀變化的像素的集合,邊緣廣泛存在于物體與物體、物體與背景之間。圖像測(cè)量是通過(guò)處理被測(cè)物體圖像中的邊緣而獲得物體的幾何參數(shù)的過(guò)程,邊緣的定位精度直接影響最終的測(cè)量結(jié)果。因此,圖像邊緣提取方法是檢測(cè)的基礎(chǔ)和關(guān)鍵之一。在視覺測(cè)量領(lǐng)域中,早期使用的都是像素級(jí)邊緣檢測(cè)方法,例如常用的梯度算子、Lapacian算子和門式算子等。以上的邊緣檢測(cè)方法的精度可以達(dá)到像素級(jí)精度,即可以判斷出邊緣位于某個(gè)像素內(nèi),但不能確定邊緣在該像素內(nèi)的更精確的位置。如果一個(gè)像素對(duì)應(yīng)的實(shí)際長(zhǎng)度較大,就會(huì)產(chǎn)生較大的誤差,傳統(tǒng)的整像素邊緣檢測(cè)方法就不再適用。

四、計(jì)算機(jī)視覺檢測(cè)技術(shù)在機(jī)加工零件檢測(cè)中的應(yīng)用要素與過(guò)程

(一)曲陣CCD相機(jī)

面陣CCD是本項(xiàng)目圖像采集系統(tǒng)中的主要設(shè)備之一,其主要功能是采集實(shí)驗(yàn)圖像。該CCD相機(jī)主要由CCD感光芯片、驅(qū)動(dòng)電路、信號(hào)處理路、電子接口電路和光學(xué)機(jī)械接口等構(gòu)成。

(二)工業(yè)定焦鏡頭

在圖像測(cè)量系統(tǒng)中,鏡頭的主要作用是將目標(biāo)聚焦在圖像傳感器的光敏面上。鏡頭的質(zhì)量直接影響到圖像測(cè)量系統(tǒng)的整體性能,合理選擇并安裝光學(xué)鏡頭是圖像測(cè)量系統(tǒng)設(shè)計(jì)的重要環(huán)節(jié)。

(三)數(shù)字圖像采集卡

隨著數(shù)字信號(hào)處理技術(shù)和嵌入式處理器技術(shù)在圖像采集卡中的應(yīng)用,使得圖像采集卡向高速度、多功能和模塊化方向不斷發(fā)展。這類圖像采集卡不僅具有高速圖像采集功能,同時(shí)還具備部分圖像處理功能,因此又可以稱之為圖像處理卡。

(四)標(biāo)定板

為提高測(cè)量精度,需要進(jìn)行攝像機(jī)標(biāo)定。標(biāo)定過(guò)程中,采用NANO公司的CBC75mm}.0型高精度標(biāo)定板,外形尺寸為75mmx75mmx3.0mm,圖形為棋盤格,其尺寸為2.0mmx2.0mm,精度為1級(jí),即圖形尺寸精度與圖形位置精度為。

(五)背光源

背光方式只顯示不透明物體的輪廓,所以這種方式用于被測(cè)物需要的信息可以從其輪廓得到的場(chǎng)合。因此,為精確提取軸的圖像中的邊緣特征,需采用背光源。為使圖像邊緣更銳利,光源顏色選擇紅色。

五、結(jié)語(yǔ)

隨著計(jì)算機(jī)技術(shù)和光電技術(shù)的發(fā)展,已經(jīng)出現(xiàn)了一種新的檢測(cè)技術(shù)―基于計(jì)算機(jī)視覺的檢測(cè)技術(shù),利用CCD攝像機(jī)作為圖像傳感器,綜合運(yùn)用圖像處理等技術(shù)進(jìn)行非接觸測(cè)量的方法,被廣泛地應(yīng)用于零件尺寸的精密測(cè)量中。本文以面陣CCD為傳感器,研究了零件在線測(cè)量的方法,實(shí)現(xiàn)了零件尺寸的圖像邊緣亞像素定位測(cè)量,對(duì)面陣CCD在高精度測(cè)量方面的應(yīng)用作了進(jìn)一步的探索和研究,為面陣CCD在復(fù)雜零件尺寸高精度測(cè)量的實(shí)現(xiàn)打下了基礎(chǔ)。

計(jì)算機(jī)視覺論文:包裝條碼計(jì)算機(jī)視覺識(shí)別系統(tǒng)設(shè)計(jì)

摘要:隨著商品種類的不斷豐富和信息化管理手段的應(yīng)用普及,條形碼作為現(xiàn)代生產(chǎn)、物流和銷售各環(huán)節(jié)的重要信息化手段之一,它的應(yīng)用也日益廣泛,而且,隨著我國(guó)對(duì)食品和藥品安全問(wèn)題的重視,條碼作為追溯碼也開始被用于食品藥品追溯領(lǐng)域。如何對(duì)條形碼中的信息進(jìn)行提取就變得非常重要了。本文在這樣的背景下針對(duì)乳品企業(yè)的產(chǎn)品可追溯問(wèn)題,設(shè)計(jì)了一套可用于乳品追溯的包裝條碼計(jì)算機(jī)視覺識(shí)別系統(tǒng)。

關(guān)鍵詞:條碼;乳品包裝;條碼識(shí)別;計(jì)算機(jī)視覺

本系統(tǒng)硬件部分采用面陣攝像機(jī)、工控機(jī)構(gòu)成,軟件部分采用C#語(yǔ)言和OpenCV軟件進(jìn)行開發(fā),采用EF Model(實(shí)體框架)作為程序框架,通過(guò)搭建好的視頻采集系統(tǒng),利用外觸發(fā)啟動(dòng)攝像機(jī)采集圖像,經(jīng)過(guò)圖像預(yù)處理、識(shí)別區(qū)域的檢測(cè)和定位后,提取出待識(shí)別圖像,對(duì)于待識(shí)別圖像中的條碼和數(shù)字,分別采用相似邊距離方法進(jìn)行一維碼識(shí)別、采用逐行掃描法進(jìn)行二維碼識(shí)別,并利用模型匹配進(jìn)行數(shù)字識(shí)別。

本系統(tǒng)可綜合識(shí)別條碼以及數(shù)字識(shí)別,實(shí)驗(yàn)表明本系統(tǒng)具有較好的識(shí)別效率和識(shí)別精度,可以滿足一般條件下的包裝條碼計(jì)算機(jī)識(shí)別,并且已在乳品可追溯方面取得應(yīng)用。

1 概述

在數(shù)不勝數(shù)的新型計(jì)算機(jī)科學(xué)技術(shù)出現(xiàn)之后,條形碼技術(shù)儼然已經(jīng)成為了最為經(jīng)濟(jì)實(shí)用的一種自動(dòng)識(shí)別技術(shù)。隨著時(shí)代的不斷發(fā)展和用戶需求的不斷擴(kuò)展,各種各樣的商品出現(xiàn)在我們生活中[1]。雖然條形碼的技術(shù)發(fā)展的爐火純青,但是隨著條形碼的不斷變化和創(chuàng)新,識(shí)別包裝條形碼技術(shù)已然成為我們現(xiàn)在需要不斷研究的課題。

條形碼的出現(xiàn)無(wú)疑給我們的生活帶來(lái)了方便,但τ謖飧隹燜俜⒄溝氖貝,對(duì)其識(shí)別的技術(shù)的效率還需要我們進(jìn)行大量的研究和開發(fā)。這也是開發(fā)本系統(tǒng)的初衷。對(duì)于本系統(tǒng)來(lái)說(shuō),它既要滿足對(duì)條形碼的檢測(cè),圖像提取,校正等功能的實(shí)現(xiàn),又要實(shí)現(xiàn)所有程序自動(dòng)化的功能。該系統(tǒng)主要應(yīng)用于對(duì)海河食品包裝的識(shí)別。該系統(tǒng)利用外觸發(fā)器,實(shí)現(xiàn)將視頻轉(zhuǎn)化到靜態(tài)圖片的功能,同時(shí)通過(guò)后臺(tái)處理快速地找到該靜態(tài)圖片中條形碼的位置并對(duì)提取的條形碼以圖片的形式存儲(chǔ),然后對(duì)條形碼圖片進(jìn)行識(shí)別。

2 條形碼定位

2.1 圖像采集

采集方式是利用相機(jī)和觸發(fā)器采取圖像,DirectX以流的方式讀取播放視頻。

2.2 圖像預(yù)處理[2]

OpenCV現(xiàn)在利用Mat類來(lái)表示圖像,在此基礎(chǔ)上進(jìn)行圖像的灰度化處理[3],在灰度處理基礎(chǔ)上,進(jìn)行圖像梯度化[4]。就是把圖像作為二維離散函數(shù)。梯度化過(guò)程就是對(duì)該函數(shù)求導(dǎo)的過(guò)程。圖像邊緣的確定大多都是通過(guò)圖像梯度化處理來(lái)實(shí)現(xiàn)的。梯度化方向[5],分水平方向梯度計(jì)算和垂直方向梯度計(jì)算,或者是振幅計(jì)算。在進(jìn)行檢測(cè)前,還要使用Scharr算子先確定邊緣像素[6]的位置。接下來(lái)進(jìn)行圖像二值化,所有的像素點(diǎn)的像素值設(shè)置為0或者255。最后,采用開運(yùn)算算法進(jìn)行形態(tài)化處理。

2.3 條碼檢測(cè)

本系統(tǒng)使用Vecor容器用于存放面積;findContours函數(shù)對(duì)二值圖像中的輪廓進(jìn)行檢測(cè);Point用來(lái)表示坐標(biāo)為整數(shù)的二維點(diǎn);Rect方法:用于提取旋轉(zhuǎn)的矩形圖案;angle檢查這個(gè)矩形的偏斜角度;將提取的矩形輪廓標(biāo)記在圖片上并剪截下來(lái)進(jìn)行保存。

2.4 二維碼提取

相對(duì)應(yīng)一維碼,二維碼在譯碼之前需要先對(duì)二維碼進(jìn)行分割,再進(jìn)行邊緣檢測(cè)。采用區(qū)域增長(zhǎng)的方法修正邊界。二維碼是正方形形態(tài),我們也要對(duì)其進(jìn)行圖形區(qū)域的旋轉(zhuǎn)處理,利用Hough變換來(lái)進(jìn)行處理利用二維圖像的投影變換。然后對(duì)拍攝的圖像進(jìn)行Hough變換,根據(jù)4條邊界線進(jìn)行位置旋轉(zhuǎn)。也可以使用仿射變換。即先對(duì)一個(gè)向量空間進(jìn)行一次線性變換并根據(jù)該變化做出相對(duì)性的平移,使其變成另一個(gè)向量空間。該變化方法包括水平的平移、圖像的縮放、圖像的旋轉(zhuǎn)等功能。

2.5 數(shù)字定位方法

商品包裝上的條碼一般都是預(yù)印刷的,許多商品的生成日期和使用日期也需要入庫(kù)進(jìn)行保存,但是由于條碼印刷成本較高,所以廠家通常采用的方式是以數(shù)字形式將商品的生成日期和使用日期印刷在包裝袋上。因而,本系統(tǒng)添加了數(shù)字識(shí)別功能。數(shù)字技術(shù)識(shí)別的主要核心字符分割技術(shù):切割數(shù)字區(qū)域后,進(jìn)行字符的切割,由于該圖像還是灰度圖像,所以我們?cè)谇懈钋斑€要進(jìn)行一些圖像處理。具體過(guò)程:灰度拉伸、二值化、傾斜校正以及字符分割。圖像以海河牛奶的包裝袋為例。由于信息過(guò)多,一個(gè)條形碼無(wú)法將全部信息存儲(chǔ),所以會(huì)在包裝正面的空白位置加些數(shù)字,以此來(lái)完善條形碼內(nèi)容不足的地方。

具體分割算法如圖1所示。將截取后的整個(gè)圖片進(jìn)行自上而下的逐行對(duì)比,提取黑色的字符部分,直到整幅圖像完畢。已列為高度基準(zhǔn)進(jìn)行掃描,進(jìn)行從左到右依次排查,直到全部圖片掃面完畢。由于印刷問(wèn)題,數(shù)字區(qū)域可能有小圓點(diǎn),采用的是比例方法運(yùn)算將這些小點(diǎn)清除,把每個(gè)切割后的圖像的寬度均除以未切割前的圖像的寬度,設(shè)立一個(gè)最小的商值。如果小于該商值,將其以噪聲方式清除。最后對(duì)字符進(jìn)行了加框和歸一化處理。上述所切割的圖像大小是根據(jù)字符的最高和最低的值進(jìn)行的切割,所以我們得到的結(jié)果并不是很準(zhǔn)確,我們要將每個(gè)字符再進(jìn)行進(jìn)一步的確定,所以要多進(jìn)行幾次從第一個(gè)步驟到第三個(gè)步驟的運(yùn)算。這樣我們得到的才是該字符的準(zhǔn)確范圍。

3 條形碼識(shí)別

3.1 一維碼識(shí)別

一維碼儲(chǔ)存的信息是由條和空的寬度以及所在的位置來(lái)傳遞的。以EAN-13碼為例。一維條形碼的條和空的數(shù)量越多,它就越寬,儲(chǔ)存的數(shù)據(jù)量就越多,由于一維碼是由條和空組成的,將信息變化成二進(jìn)制或者十進(jìn)制的數(shù)字。

本系統(tǒng)對(duì)于一維碼識(shí)別采用的方法是相似邊距離方法,利用相似法識(shí)別一維碼[6]:根據(jù)算法進(jìn)行字符的掃描和識(shí)別,定義:C1和C3表示相鄰條的寬度,C2和C4表示空的寬度,T表示整個(gè)字符的寬度,T1和T2為相似邊的距離。用算法取得值JTj(j=1,2)來(lái)進(jìn)行T1與T2的歸一化處理。

3.2 二維碼識(shí)別

二維碼是按照一定的規(guī)律在平面上分布的黑色與白色相間的圖形記錄符號(hào)。識(shí)別二位碼[7]需先定位圖案,再是功能性數(shù)據(jù),識(shí)別由數(shù)據(jù)碼和糾錯(cuò)碼共同組成的數(shù)據(jù)信息。

定位圖案:我們通常定位二維碼是根據(jù)左上角、右上角以及左下角三個(gè)位置定位的。以其中一個(gè)圖形為例,我們可以將其看作分別為7*7、5*5和3*3三個(gè)模塊。三個(gè)之間比例為1:1:3:1:1。掃描:用一個(gè)直線逐行掃描二維碼,該線被截為1:1:3:1:1時(shí)截取。誤差在0.5之間在列方向,也用相同的方法進(jìn)行二維碼定位掃描。我們通常定位二維碼是根據(jù)圖上的三個(gè)位置定位的。

3.3 數(shù)字識(shí)別

數(shù)字識(shí)別[8]部分已經(jīng)超出了我們圖像處理的范圍依據(jù)了,屬于模式識(shí)別,由于我們已經(jīng)對(duì)圖片進(jìn)行了分割,所以我們只需通過(guò)其特征進(jìn)行分類與識(shí)別。采用的是逐像素取法方法[9],具體操作就是對(duì)圖片M行每行每列的依次查找,遇到的黑點(diǎn)時(shí),將其像素值設(shè)為“1”,其他為“0”,全部掃描結(jié)束后,將提取的個(gè)數(shù)相同的像素,放在特征矩陣?yán)?。將特征信息,輸入到分類器中,進(jìn)行分類處理,從而得出結(jié)果。再進(jìn)行采取模塊匹配,事先做好海河包裝上的圖像中字符的圖像采集,然后建立一個(gè)圖片模板識(shí)別庫(kù)。當(dāng)我們進(jìn)行字符識(shí)別時(shí),就將模板取出來(lái)依次對(duì)比,把與字符特征對(duì)比的結(jié)果的矢量求出加權(quán)距離。則最小的結(jié)果就是識(shí)別的結(jié)果。如圖2所示。

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用

摘 要

近年來(lái),經(jīng)濟(jì)的發(fā)展和人們生活水平的提升也使得人們的出行更加便捷,越來(lái)越多的人都是自己駕車出行,這樣導(dǎo)致公路上的交通流量不斷增加,如何保障交通的順暢性和安全性成為人們關(guān)注的重點(diǎn)問(wèn)題。信息技術(shù)的發(fā)展推動(dòng)了計(jì)算機(jī)視覺技術(shù)的出現(xiàn),為交通安全性的提升提供了一定的保障。本文主要對(duì)計(jì)算機(jī)視覺技術(shù)進(jìn)行分析,進(jìn)一步探討計(jì)算機(jī)視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用。

【關(guān)鍵詞】計(jì)算機(jī) 視覺技術(shù) 智能交通 系統(tǒng) 應(yīng)用

智能交通系統(tǒng)簡(jiǎn)稱ITS,這是一種新型的交通管理系統(tǒng)。該系統(tǒng)主要結(jié)合了信息化技術(shù)、計(jì)算機(jī)技術(shù)以及數(shù)據(jù)傳輸技術(shù)等多種技術(shù),用來(lái)對(duì)整個(gè)交通運(yùn)輸體系進(jìn)行管理,可以實(shí)現(xiàn)人、車、路的全面監(jiān)控和管理。計(jì)算機(jī)視覺藝術(shù)作為智能交通系統(tǒng)中的一個(gè)重要環(huán)節(jié),受到相關(guān)工作人員的高度重視。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,不僅為交通行業(yè)的發(fā)展提供了更多的便捷,同時(shí)還能夠篩選道路交通的各種信息,進(jìn)一步增強(qiáng)了智能交通系統(tǒng)的靈活性和準(zhǔn)確性。

1 計(jì)算機(jī)視覺技術(shù)的概述

計(jì)算機(jī)視覺也被稱為圖像分析和圖解理解,其包括的理論主要有攝影幾何學(xué)、概率論、圖像處理理論以及人工智能理論等部分。計(jì)算機(jī)視覺技術(shù)主要是用二維投影圖像實(shí)現(xiàn)三維物體重構(gòu)。這種技術(shù)的應(yīng)用范圍比較廣泛,不僅應(yīng)用于二維圖像識(shí)別方面,同時(shí)還用于三維物體的識(shí)別和重建上面。通過(guò)計(jì)算機(jī)視覺技術(shù)能夠獲取專業(yè)化的三維信息,對(duì)三維信息的獲取一般有兩種方法,其中一種是直接獲取法,還有一種是間接獲取法。直接獲取法主要是通過(guò)計(jì)算機(jī)視覺技術(shù)的效果來(lái)確定三維運(yùn)動(dòng)中產(chǎn)生的各種參數(shù),這一過(guò)程對(duì)攝像機(jī)運(yùn)動(dòng)問(wèn)題的關(guān)注程度較高;間接獲取的方式就是將單幅圖像和攝像機(jī)焦距相結(jié)合,來(lái)判斷被測(cè)量位置視覺上的信息。計(jì)算機(jī)視覺技術(shù)的關(guān)鍵就是實(shí)現(xiàn)特別匹配,在特殊情況下可以利用不同的攝像C同時(shí)收集運(yùn)動(dòng)信息,從而提高相關(guān)控制的精確度。

2 計(jì)算機(jī)視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用

計(jì)算機(jī)視覺技術(shù)在智能交通系統(tǒng)中的應(yīng)用可以實(shí)現(xiàn)道路交通的監(jiān)控,同時(shí)還能夠?qū)崿F(xiàn)自動(dòng)收費(fèi)、智能導(dǎo)航等功能,主要應(yīng)用有以下幾個(gè)方面的內(nèi)容。

2.1 交通監(jiān)控中對(duì)計(jì)算機(jī)視覺技術(shù)的應(yīng)用

基于計(jì)算機(jī)視覺技術(shù)的交通監(jiān)控系統(tǒng)主要分為三個(gè)步驟,首先是對(duì)車輛和行人進(jìn)行跟蹤和分割,其次是對(duì)車流量進(jìn)行分析和計(jì)算,并且計(jì)算車輛的平均速度和道路上車輛的隊(duì)列長(zhǎng)度,最后根據(jù)道路的交通狀況來(lái)規(guī)劃形式線路,從而有效緩解道路交通擁堵的現(xiàn)狀,方便人們減少出行時(shí)間。車輛和行人作為道路中運(yùn)動(dòng)的主要目標(biāo),在監(jiān)控場(chǎng)合下,需要對(duì)運(yùn)動(dòng)時(shí)間進(jìn)行有效分割,常用到的分割方式包括光流法和幀差法兩種,其中前一種分割方式主要是依據(jù)圖像中不同的運(yùn)動(dòng)用映射參數(shù)正確的表達(dá),這樣可以將具有同樣映射參數(shù)的光流量進(jìn)行分配,從而完成參數(shù)分割。計(jì)算機(jī)視覺在交通監(jiān)控中的應(yīng)用主要是對(duì)車輛速度、車輛數(shù)目、車輛分類進(jìn)行檢測(cè)。隨著計(jì)算機(jī)通信技術(shù)的發(fā)展,計(jì)算機(jī)視覺技術(shù)也是日新月異,基于計(jì)算機(jī)視覺的交通監(jiān)控系統(tǒng)具有較強(qiáng)的實(shí)時(shí)工作性,能夠快速的適應(yīng)高度公路以及城市道路交通的監(jiān)控。

2.2 車輛導(dǎo)航中對(duì)計(jì)算機(jī)視覺技術(shù)的應(yīng)用

實(shí)現(xiàn)車輛的智能導(dǎo)航是計(jì)算機(jī)視覺技術(shù)在智能交通中應(yīng)用的典型案例。這種技術(shù)主要為駕駛?cè)藛T提供道路信息和車輛運(yùn)行狀況兩大信息。通過(guò)車輛智能導(dǎo)航系統(tǒng)的運(yùn)行能夠?qū)Φ缆穬蛇叺慕缦捱M(jìn)行有效的識(shí)別,將車輛引向規(guī)定的行駛車道,在車輛行駛過(guò)程中,該系統(tǒng)能夠自動(dòng)檢測(cè)車輛與前方其他車輛之間的距離,從而提醒駕駛?cè)藛T保持車輛的安全距離,最終實(shí)現(xiàn)安全導(dǎo)航駕駛。通過(guò)該系統(tǒng)的攝像機(jī)運(yùn)動(dòng)能夠識(shí)別其他車輛的行駛狀況,并且通過(guò)計(jì)算檢測(cè)點(diǎn)的方式計(jì)算車輛的模擬匹配點(diǎn)。車倆智能導(dǎo)航系統(tǒng)中就使用了計(jì)算機(jī)視覺技術(shù),可以從中提取相關(guān)信息,計(jì)算車輛行駛的安全距離和速度。

2.3 計(jì)算機(jī)視覺技術(shù)用于車輛輔助駕駛

計(jì)算機(jī)視覺技術(shù)在車輛輔助駕駛中的應(yīng)用主要是幫助駕駛?cè)藛T對(duì)外界的變化做出反應(yīng)。具體表現(xiàn)為車輛在市內(nèi)行駛時(shí),計(jì)算機(jī)視覺技術(shù)的應(yīng)用能夠識(shí)別周邊道路的標(biāo)記,并且對(duì)交通標(biāo)志、其他車輛和行人進(jìn)行識(shí)別,然后篩選相關(guān)信息進(jìn)行計(jì)算,讓駕駛?cè)饲宄饨绲木唧w狀況,從而避開其他的車輛和行人,能夠從根本上減少交通事故的發(fā)生,增強(qiáng)車輛的安全運(yùn)行。輔助駕駛的形式轉(zhuǎn)變?yōu)槿藱C(jī)交互的方式,一定程度上能夠滿足駕駛?cè)藛T對(duì)信息的需求。

2.4 計(jì)算機(jī)視覺技術(shù)用于車輛智能收費(fèi)

車輛收費(fèi)是車輛在公共交通位置行駛中的一個(gè)關(guān)鍵環(huán)節(jié)。隨著科學(xué)技術(shù)的發(fā)展,車輛收費(fèi)系統(tǒng)逐漸向著計(jì)算機(jī)技術(shù)的應(yīng)用方向發(fā)展,計(jì)算機(jī)視覺技術(shù)在各地區(qū)交通發(fā)展中的應(yīng)用是現(xiàn)代化交通發(fā)展的一個(gè)重要突破口。很多地區(qū)的智能化收費(fèi)都是通過(guò)識(shí)別車牌的方式來(lái)實(shí)現(xiàn)收費(fèi),我國(guó)在車牌識(shí)別這方面僅僅限制于單目車牌和雙目車牌的識(shí)別,其中單目車牌識(shí)別的核心就是將車牌照位置作為核心部分,我國(guó)大部分地區(qū)都是將單目系統(tǒng)作為核心部分來(lái)使用。采用雙目系統(tǒng)對(duì)車牌進(jìn)行識(shí)別,也可以對(duì)車輛的型號(hào)進(jìn)行識(shí)別,通過(guò)大量的實(shí)踐發(fā)現(xiàn),雙目系統(tǒng)進(jìn)行車牌識(shí)別的實(shí)用性較強(qiáng)。但是這種識(shí)別方式在實(shí)際應(yīng)用過(guò)程中仍然存在著信息獲取難度大、車牌照定位難度大等多種問(wèn)題,尤其是車輛在高速路上行駛時(shí),對(duì)于車牌信息的獲取更為困難,因此,在這方面還需要加大研究和實(shí)踐。

3 結(jié)束語(yǔ)

隨著計(jì)算機(jī)視覺技術(shù)的智能化發(fā)展,其在智能交通系統(tǒng)中的應(yīng)用能夠解決多方面的問(wèn)題。該技術(shù)的應(yīng)用不僅能夠?qū)崿F(xiàn)車輛的實(shí)時(shí)監(jiān)控,同時(shí)還能夠?qū)崿F(xiàn)車輛導(dǎo)航以及車輛收費(fèi),幫助駕駛?cè)藛T識(shí)別車輛行駛中存在的障礙物,這樣一來(lái),可以增強(qiáng)車輛行駛的安全性,同時(shí)還能夠提高我國(guó)道路交通系統(tǒng)的整體管理水平。但是該技術(shù)應(yīng)用中也存在不足之處,未來(lái)發(fā)展中需要降低視覺系統(tǒng)的價(jià)格,減少系統(tǒng)的尺寸,從而增強(qiáng)系統(tǒng)對(duì)車輛信息的處理速度,最終實(shí)現(xiàn)對(duì)道路交通的全面監(jiān)測(cè)。

計(jì)算機(jī)視覺論文:淺析計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺與可視化技術(shù)

摘 要:在科技的帶動(dòng)下,計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺與可視化技術(shù)得以快速發(fā)展,并被應(yīng)用到各個(gè)領(lǐng)域,隨著它們的應(yīng)用,極大的推動(dòng)了現(xiàn)代社會(huì)發(fā)展。為進(jìn)一步了解這些技術(shù),充分發(fā)揮其應(yīng)有作用,本文將對(duì)計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)展開研究,希望能為相關(guān)人士帶來(lái)有效參考。

關(guān)鍵詞:計(jì)算機(jī)圖形學(xué);計(jì)算機(jī)視覺;可視化技術(shù)

計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)三者均是計(jì)算機(jī)領(lǐng)域重要組成部分,要做好計(jì)算機(jī)知識(shí),就要先學(xué)好計(jì)算機(jī)圖形學(xué),但計(jì)算機(jī)圖形學(xué)學(xué)習(xí)相對(duì)枯燥,尤其是算法教學(xué)難以理解,為解決這一問(wèn)題,計(jì)算機(jī)視覺與可視化技術(shù)被應(yīng)用到計(jì)算機(jī)圖形學(xué)中。可見,三者之間存在一定的聯(lián)系,因此,有必要對(duì)計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)展開研究。

1 計(jì)算機(jī)圖形學(xué)概述

1.1 計(jì)算機(jī)圖形學(xué)目的

所謂的計(jì)算機(jī)圖形學(xué)實(shí)際上就是怎樣利用計(jì)算機(jī)表示圖形,并利用計(jì)算機(jī)完成圖形計(jì)算與處理,而這一過(guò)程的實(shí)現(xiàn)需要得到相關(guān)算法的支持。學(xué)習(xí)計(jì)算機(jī)圖形學(xué)的目的是利用計(jì)算機(jī)技術(shù)為人們呈現(xiàn)既帶有美感又不缺真實(shí)的圖形(如下圖1所示),為實(shí)現(xiàn)這一目標(biāo),就需要按照?qǐng)D形的要求創(chuàng)設(shè)合適的場(chǎng)景,并在一些光照模型的作用下,做好光照效果設(shè)計(jì),在這一過(guò)程中需要計(jì)算機(jī)圖形學(xué)能夠與其他計(jì)算機(jī)技術(shù)相配合。經(jīng)過(guò)計(jì)算機(jī)圖形學(xué)出來(lái)的圖像,多會(huì)以數(shù)字圖像的方式展示出來(lái),總的來(lái)說(shuō),計(jì)算機(jī)圖形學(xué)與圖像處理之間存在著一定的聯(lián)系[1]。計(jì)算機(jī)圖形學(xué)的涉及范圍相對(duì)寬泛,不僅有圖形硬件設(shè)計(jì),還包括動(dòng)畫制作,虛擬現(xiàn)實(shí)等多個(gè)部分。此外,計(jì)算機(jī)圖形學(xué)在動(dòng)畫制作中的應(yīng)用頻率也很高,如45分鐘一集的動(dòng)畫影片中,85%的畫面都需要用算機(jī)圖形學(xué)來(lái)完成,由此可見,計(jì)算機(jī)圖形學(xué)的應(yīng)用頻率極高,并在動(dòng)畫制作中發(fā)揮著不可替代的作用。因此,應(yīng)重視計(jì)算機(jī)圖形學(xué)的應(yīng)用。

1.2 計(jì)算機(jī)圖形學(xué)應(yīng)用

隨著計(jì)算機(jī)圖形學(xué)的發(fā)展,它被應(yīng)用到各個(gè)領(lǐng)域中,并發(fā)揮著重要作用。首先,在計(jì)算機(jī)輔助設(shè)計(jì)與制造中的應(yīng)用,這是計(jì)算機(jī)圖形學(xué)應(yīng)用最多的領(lǐng)域,在計(jì)算機(jī)圖形學(xué)被應(yīng)用以后,不僅可以設(shè)計(jì)出更精準(zhǔn)的圖形,還能做好人機(jī)交互設(shè)計(jì),強(qiáng)化修改能力。計(jì)算機(jī)圖形學(xué)還被應(yīng)用到三維形體重建中,利用該技術(shù)可以將原理的二維信息轉(zhuǎn)化為三維信息,如在某次工程圖紙?jiān)O(shè)計(jì)中就應(yīng)用了計(jì)算機(jī)圖形學(xué),經(jīng)過(guò)一系列的處理以后,三維形體逐漸形成,最終實(shí)現(xiàn)了重建。其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。計(jì)算機(jī)圖形學(xué)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用多以計(jì)算可視化的形式展示出來(lái),如在腦部手術(shù)中,醫(yī)生為看清患處真實(shí)情況,經(jīng)常需要利用在可視化技術(shù)的作用下將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像,這時(shí)就體現(xiàn)了計(jì)算機(jī)圖形學(xué)在其中的應(yīng)用[2]。再者,在計(jì)算機(jī)動(dòng)畫中的應(yīng)用,人們看到的動(dòng)畫影片就是計(jì)算機(jī)圖形學(xué)作用的結(jié)果,以動(dòng)畫人物的行走為例,為保證動(dòng)畫人物的行走與自然人不存在過(guò)大差異,就需要應(yīng)用大量的計(jì)算機(jī)技術(shù),并在計(jì)算機(jī)圖形學(xué)的作用下完成設(shè)計(jì)。最后,在計(jì)算機(jī)藝術(shù)中的應(yīng)用。計(jì)算機(jī)圖形學(xué)在計(jì)算機(jī)藝術(shù)中也有廣泛應(yīng)用,它不僅可以用于藝術(shù)制作,很多場(chǎng)景都是通過(guò)計(jì)算機(jī)圖形學(xué)來(lái)完成的,現(xiàn)階段,一些人正在利用計(jì)算機(jī)圖形學(xué)創(chuàng)設(shè)人體模擬系統(tǒng),其目的是讓已故人士再次出現(xiàn)在熒屏上,這一目標(biāo)的實(shí)現(xiàn)就需要得到計(jì)算機(jī)圖形學(xué)的支持。

2 計(jì)算機(jī)視覺技術(shù)

2.1 計(jì)算機(jī)視覺技術(shù)含義

所謂的計(jì)算機(jī)視覺技術(shù),實(shí)際上就是用計(jì)算機(jī)取代人眼做識(shí)別、跟蹤以及測(cè)量等,同時(shí)也兼顧圖形處理,其目的是讓圖像在計(jì)算機(jī)被處理以后更適于識(shí)別。對(duì)于計(jì)算機(jī)視覺技術(shù)來(lái)說(shuō),意在實(shí)現(xiàn)人工智能,主要是從圖像與多維數(shù)據(jù)等方面實(shí)現(xiàn)人工智能系統(tǒng)設(shè)計(jì)[3]。計(jì)算機(jī)視覺是一種在相關(guān)理論與模型基礎(chǔ)上發(fā)展起來(lái)的視覺系統(tǒng),其主要構(gòu)成部分有以下幾種:

(1)程序控制,這一點(diǎn)主要體現(xiàn)在機(jī)器人設(shè)計(jì)上;(2)事件檢測(cè),多體現(xiàn)在圖像監(jiān)測(cè)上;(3)信息組織,主要體現(xiàn)在圖像數(shù)據(jù)庫(kù)等方面。計(jì)算機(jī)視覺三個(gè)階段如圖2所示,通過(guò)觀察圖1可以發(fā)現(xiàn),計(jì)算機(jī)視覺存在于圖像處理始終,從早期處理直到后期結(jié)束都存在,最終實(shí)現(xiàn)了3D描述,可見,計(jì)算機(jī)視覺具有十分重要的作用[4]。

2.2 計(jì)算機(jī)視覺技術(shù)的應(yīng)用

現(xiàn)階段,現(xiàn)代社會(huì)已經(jīng)進(jìn)入信息化時(shí)代,計(jì)算機(jī)技術(shù)也被應(yīng)用到各個(gè)領(lǐng)域,并發(fā)揮著重要作用。計(jì)算機(jī)視覺的應(yīng)用促使計(jì)算機(jī)實(shí)現(xiàn)了智能化,在該技術(shù)的支持下,計(jì)算機(jī)可以像人一樣透過(guò)視覺看待世界萬(wàn)物,且具有良好的適應(yīng)能力,但這一目標(biāo)的實(shí)現(xiàn)還需要很長(zhǎng)時(shí)間,需要一系列的努力才能實(shí)現(xiàn)?,F(xiàn)階段,計(jì)算機(jī)視覺應(yīng)用最多的就是車輛視覺導(dǎo)航,然而,這種導(dǎo)航還沒(méi)有實(shí)現(xiàn)完全自主導(dǎo)航,這也是需要進(jìn)一步研究的地方。計(jì)算機(jī)視覺技術(shù)的適應(yīng)性較好,特別適合在工業(yè)領(lǐng)域應(yīng)用,即便是存在電子在干擾或溫度變化較大的地方都能很好的運(yùn)行,其整體效果也不會(huì)受到影響,再者,計(jì)算機(jī)視覺技術(shù)的嵌入性較好,成本相對(duì)較低,尤其適合在PC方案中使用,同時(shí),具有一定的非接觸能力,能夠獲取大量信息,且不受距離限制,總的來(lái)說(shuō),計(jì)算機(jī)視覺技術(shù)總體效果較好,適合利用在各種工業(yè)環(huán)境中應(yīng)用,因此,應(yīng)重視計(jì)算機(jī)視覺技術(shù)的應(yīng)用[5]。同時(shí)計(jì)算機(jī)視覺還被應(yīng)用到移動(dòng)機(jī)器人設(shè)計(jì)中,主要是利用小波模板展示人體形態(tài),然后做圖像掃描,這樣就可以順利完成小波變換,進(jìn)而了解到人的存在。同樣,將計(jì)算機(jī)視覺應(yīng)用到機(jī)器人設(shè)計(jì)上,可以自動(dòng)檢測(cè)出正在行動(dòng)的人或車輛,而無(wú)法檢測(cè)到靜止的人,之所以會(huì)出現(xiàn)這樣情況,主要是由于其中采用率步態(tài)分析法。

3 可視化技術(shù)

3.1 可視化技術(shù)含義

可視化技術(shù)是一種綜合了計(jì)算機(jī)圖形學(xué)與圖像處理于一體的技術(shù),它可以將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像并在屏幕上展示出來(lái)。在可視化技術(shù)中,融合了以上兩種技術(shù)的特點(diǎn),并在多個(gè)領(lǐng)域都有應(yīng)用,隨著可視化技術(shù)的應(yīng)用,不僅有效實(shí)現(xiàn)了數(shù)據(jù)表示,還強(qiáng)化了數(shù)據(jù)處理能力,更對(duì)數(shù)據(jù)決策分析有一定作用[6]。現(xiàn)階段,虛擬現(xiàn)實(shí)技術(shù)已經(jīng)成為可視化技術(shù)主要發(fā)展方向。

3.2 可視化技術(shù)的應(yīng)用

首先,在計(jì)算機(jī)圖形學(xué)教學(xué)中的應(yīng)用,計(jì)算機(jī)圖形學(xué)相對(duì)枯燥,相關(guān)知識(shí)也很抽象,不便于學(xué)生理解,在計(jì)算機(jī)圖形學(xué)中最重要的部分是曲線曲面,而這些曲線曲面多是與數(shù)學(xué)模型有關(guān),具有一定的抽象性,學(xué)生理解難度較大,以往教師只能通過(guò)一系列的公式演算幫助學(xué)生理解,盡管這樣依然難以讓學(xué)生掌握曲線變化情況,學(xué)生依舊無(wú)法正確理解。為減少這種情況的發(fā)生,可視化技術(shù)被應(yīng)用到計(jì)算機(jī)圖形學(xué)教學(xué)中,教師將抽象的知識(shí)用動(dòng)畫的形式展示出來(lái),學(xué)生只要觀看動(dòng)畫,拖動(dòng)一定的控制點(diǎn)就可以了解到曲線變化情況,這樣一來(lái)不僅增加了教學(xué)趣味性,學(xué)生也可以隨意變動(dòng)曲線,讓復(fù)雜的知識(shí)變得簡(jiǎn)單,深化學(xué)生對(duì)計(jì)算機(jī)圖形學(xué)知識(shí)的深度理解,同時(shí),利用可視化技術(shù)在一定條件下,還可以完成代碼編譯,如在Actoin ScriPt中做編譯,這樣也可以增強(qiáng)學(xué)生的理解能力[7]。

其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。醫(yī)學(xué)領(lǐng)域?qū)τ诳梢暬夹g(shù)的應(yīng)用主要體現(xiàn)在放射治療與矯正手術(shù)上。通過(guò)可視化技術(shù)可以屏幕上看到手術(shù)整個(gè)過(guò)程,并將原來(lái)細(xì)節(jié)部位放大,手術(shù)醫(yī)生觀察的更加細(xì)致,手術(shù)成功幾率也會(huì)大幅度提升,患者生命也能得到保證(如圖3所示)。如在對(duì)某名患者進(jìn)行身體檢查的過(guò)程中需要應(yīng)用到可視化技術(shù),由于通過(guò)檢查會(huì)獲得大量數(shù)據(jù),而這些數(shù)據(jù)又相對(duì)復(fù)雜,但在可視化技術(shù)下就可以通過(guò)圖表、曲線圖或立柱圖的方式展示出來(lái),經(jīng)過(guò)可視化技術(shù)的作用,了解到患者的血糖為5.6mmol/L,醫(yī)生可以根這一數(shù)據(jù)做出診斷,而不必再分析這些數(shù)據(jù)。據(jù)不完全統(tǒng)計(jì),80%的醫(yī)療檢查工作都是需要利用可視化技術(shù)。

地質(zhì)勘探是我國(guó)最重要的工作之一,由于多數(shù)礦藏都深埋地下,即便使用探測(cè)儀受多種因素影響也無(wú)法了解到實(shí)際礦藏情況,這就需要應(yīng)用到可視化技術(shù),在可視化技術(shù)的作用下,相關(guān)工作人員可以了解到地下有無(wú)礦藏,如果存在礦藏,相關(guān)工作人員也可以了解到礦藏所在位置與實(shí)際儲(chǔ)備量,進(jìn)而為礦藏開采奠定基礎(chǔ)。如在地質(zhì)勘探中,相關(guān)工作人員利用可視化技術(shù)做地形圖整理,然后從中提取地形數(shù)據(jù),再用CATIA做導(dǎo)入,這樣就可以完成地形模型創(chuàng)建,這樣就完成了三維地質(zhì)模型創(chuàng)建工作,同時(shí)在相關(guān)工作臺(tái)的影響下,還可以完成地形數(shù)據(jù)導(dǎo)入,進(jìn)而生成一定的地形云點(diǎn),如果其中存在錯(cuò)誤,可視化技術(shù)也可以將其中的錯(cuò)誤內(nèi)容刪除,這些都是可視化技術(shù)所帶來(lái)的好處[8]。由此可見,可視化技術(shù)已經(jīng)成為地質(zhì)勘探中不缺少的技術(shù)。

最后,在氣象預(yù)報(bào)中的應(yīng)用(如圖4所示)。利用可視化技術(shù)能夠?qū)?shù)據(jù)轉(zhuǎn)化為圖像,通過(guò)觀察圖像就可以了解到云層變化情況,同時(shí)也能了解到實(shí)際風(fēng)力大小與風(fēng)走向等,氣象預(yù)報(bào)人員就可以根據(jù)圖像做出精準(zhǔn)分析,需要了解氣象變化的人也能了解到現(xiàn)實(shí)情況,如果氣象條件惡劣,相關(guān)工作人員也可以及時(shí)做出工作調(diào)整,減少危險(xiǎn)事件的發(fā)生。據(jù)不完全統(tǒng)計(jì),可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用頻率高達(dá)100%,由此挽回的經(jīng)濟(jì)損失高達(dá)13.2億元,可見,可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用十分有必要,因此,應(yīng)重視可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用。

4 結(jié)語(yǔ)

通過(guò)以上研究得知,計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)三者各具特色,三者間也存在一定的關(guān)系,尤其是可視化技術(shù)綜合了前兩者的特點(diǎn),并融合了其他技術(shù),在很多領(lǐng)域中都有應(yīng)用。可視化技術(shù)是現(xiàn)階段應(yīng)用最多的一種技術(shù),在計(jì)算機(jī)圖形學(xué)教學(xué)中也有應(yīng)用,并發(fā)揮著不可替代的作用。本文分析了計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)的含義與應(yīng)用,希望能為相關(guān)人士帶來(lái)有效參考,正確利用這些技術(shù)。

計(jì)算機(jī)視覺論文:淺談OpenCV計(jì)算機(jī)視覺庫(kù)

摘 要:用C、C++、Java等計(jì)算機(jī)語(yǔ)言編一個(gè)圖像識(shí)別程序,常常需要借助一些圖像處理的工具庫(kù),OpenCV就是其中之一,使用OpenCV要比使用計(jì)算機(jī)應(yīng)用軟件困難,需要前期復(fù)雜的準(zhǔn)備工作,如果了解了OpenCV與其他圖像處理應(yīng)用軟件的區(qū)別、學(xué)習(xí)OpenCV的基礎(chǔ)、運(yùn)行環(huán)境、圖像操作原理以及OpenCV文檔包含的內(nèi)容,學(xué)習(xí)和使用OpenCV就會(huì)容易很多。

關(guān)鍵詞:圖像處理 OpenCV C

圖像識(shí)別技術(shù)已經(jīng)應(yīng)用到生活中的許多方面。文字識(shí)別系統(tǒng),直接把圖片上的文字掃描成文本文檔格式。人臉識(shí)別技術(shù)已經(jīng)用到了智能手機(jī)之中,現(xiàn)在的手機(jī)解鎖可以直接使用人臉識(shí)別。指文圖像識(shí)別的應(yīng)用更為廣泛,如辦理身份證、入學(xué)考試、駕照等用來(lái)確認(rèn)身份。百度、Google、蘋果等公司研究的無(wú)人駕駛汽車,將該技術(shù)用于對(duì)障礙物、路標(biāo)、行人及其他車輛的判斷。道路交通監(jiān)控系統(tǒng)中,系統(tǒng)自動(dòng)檢索違規(guī)車輛,并對(duì)車輛的車牌等信息進(jìn)行識(shí)別。通過(guò)車牌提取、圖像預(yù)處理、特征提取、車牌字符識(shí)別等技術(shù),識(shí)別車輛牌號(hào),目前,字母和數(shù)字的識(shí)別率可達(dá)96%,漢字的識(shí)別率可達(dá)95% [1-2]。所有的這些都用到了圖像識(shí)別功能,要編寫圖像識(shí)別程序使用OpenCV是一個(gè)不錯(cuò)的選擇。

1 OpenCV簡(jiǎn)介

OpenCV是Intel公司于1999年推出的一種面向圖像處理的開源計(jì)算機(jī)視覺庫(kù),其中,OpenCV是Open Source Computer Vision Library的縮寫,如今由Willow Garage提供支持,其中包括了3個(gè)版本OpenCV1、OpenCV2、OpenCV3,除了OpenCV1現(xiàn)在很少使用外,其他兩個(gè)版本已經(jīng)有了很多改進(jìn)的版本。OpenCV有開源的函數(shù)庫(kù),可以滿足不同領(lǐng)域的圖像處理需求,使用時(shí)以函數(shù)調(diào)用的形式提供給用戶,也可以對(duì)其代碼進(jìn)行改進(jìn),便于用戶實(shí)驗(yàn)教學(xué)或程序開發(fā)使用。

2 OpenCV的特點(diǎn)

(1)開源。OpenCV是一個(gè)開源的圖像處理函數(shù)庫(kù),無(wú)論是商業(yè)應(yīng)用,還是做科學(xué)研究,完全是免費(fèi)的,與Linux類似它的源代碼也是公開的,這樣程序的安全性就得到保障,OpenCV的函數(shù)庫(kù)是用C語(yǔ)言和C++語(yǔ)言進(jìn)行編寫的,源代碼可讀性比較高,發(fā)現(xiàn)其中不足之可以自行進(jìn)行修改,避免編譯后的可執(zhí)行文件出現(xiàn)漏洞。

(2)跨平臺(tái)。OpenCV是一個(gè)基于BSD許可(開源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺庫(kù),可以運(yùn)行在Windows、Linux、Mac OS和嵌入式等操作系統(tǒng)上[3]。

(3)應(yīng)用領(lǐng)域廣。OpenCV圖像處理可以使用到多個(gè)領(lǐng)域當(dāng)中,包括生物醫(yī)學(xué)、工業(yè)、軍事安防、機(jī)器視覺、航空航天等。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠大規(guī)模生產(chǎn)視覺檢測(cè)等方面得到了廣泛的應(yīng)用,同時(shí)對(duì)于無(wú)人飛行器的視覺捕捉技術(shù)也有極大的幫助[4]。

(4)支持多種語(yǔ)言進(jìn)行開發(fā)。OpenCV中包括了多種編程語(yǔ)言的接口,其中支持的編程語(yǔ)言包括C、C++、C#、Java、Python等。

3 OpenCV與圖像處理應(yīng)用軟件

在計(jì)算機(jī)學(xué)習(xí)中也會(huì)學(xué)到一些其他的圖像處理軟件,如Photo Shop、Windows畫圖工具等在計(jì)算機(jī)中使用的圖像處理工具。在手機(jī)中有一個(gè)比較流行的軟件,在拍好照片后可以對(duì)個(gè)人照片進(jìn)行智能美化,這些軟件都是應(yīng)用軟件缺少編程需要的接口,這些軟件處理圖像后只是給出結(jié)果,無(wú)法取到程序處理所需要的中間參數(shù),只能局限于最后的結(jié)果展示,如果只是單純的圖像制作, Photo Shop類的圖像處理工具已經(jīng)足夠了。但是對(duì)于圖像識(shí)別、機(jī)器視覺等,需要對(duì)圖像內(nèi)容做出判斷,用類似于Photo Shop這樣的圖像處理軟件就無(wú)法完成了,因?yàn)闊o(wú)法集成到所編寫的程序當(dāng)中。OpenCV是一個(gè)圖像處理函數(shù)庫(kù),其中包涵了對(duì)于計(jì)算機(jī)操作系統(tǒng)和計(jì)算機(jī)語(yǔ)言編譯平臺(tái)支持的API接口以及源碼庫(kù),可以在編寫的程序中去處理圖像,不但可以得到圖像處理后的結(jié)果,還可以對(duì)圖像中間的處理過(guò)程進(jìn)行控制,可以對(duì)圖像中的內(nèi)容用自己編寫的程序代碼進(jìn)行判定,實(shí)現(xiàn)識(shí)別操作。

4 學(xué)習(xí)OpenCV的基礎(chǔ)

C和C++語(yǔ)言在工科類專業(yè)中一般設(shè)置必修課程,C語(yǔ)言常作為一門基礎(chǔ)的編程語(yǔ)言來(lái)教,有的學(xué)生覺得C比較容易,有的學(xué)生感覺比較難,這個(gè)取決于每個(gè)人對(duì)計(jì)算機(jī)語(yǔ)言的理解能力與對(duì)計(jì)算機(jī)語(yǔ)言的興趣,C和C++的區(qū)別在于C++增加了類,支持面向?qū)ο缶幊獭P掳鍻penCV函數(shù)庫(kù)是基于C++的,打開源代碼的文件夾可以看到許多以.cpp結(jié)尾的C++代碼文件,所以對(duì)于C和C++的掌握情況直接關(guān)系到對(duì)OpenCV的學(xué)習(xí)。

5 OpenCV的運(yùn)行環(huán)境

在學(xué)習(xí)每種計(jì)算機(jī)語(yǔ)言之前都要對(duì)每種計(jì)算機(jī)語(yǔ)言的IDE(Integrated Development Environment,集成開發(fā)環(huán)境)進(jìn)行安裝和配置,集成開發(fā)環(huán)境不只是用來(lái)編輯程序代碼,還包括了對(duì)代碼的編譯、調(diào)試與運(yùn)行等。如Java語(yǔ)言,在Windows操作系統(tǒng)中Java語(yǔ)言最簡(jiǎn)單的編輯環(huán)境是記事本,對(duì)于Java的編譯與運(yùn)行需要用到命令窗調(diào)用所安裝JDK(Java Development Kit,Java開發(fā)包)中的編譯程序與運(yùn)行環(huán)境,如果是集成的IDE,如Eclipse、MyEclipse等,點(diǎn)擊IDE上的運(yùn)行或是調(diào)試按鈕,就可以在IDE中的結(jié)果輸出窗口上直接查看運(yùn)行結(jié)果。OpenCV是用C和C++語(yǔ)言所編寫的圖像處理函數(shù)庫(kù),它沒(méi)有自己獨(dú)立的IDE,所以它需要借助其他編程語(yǔ)言的IDE進(jìn)行編寫和調(diào)用,如Microsoft Visual Studio、QT Creator等。

配置開發(fā)環(huán)境是學(xué)習(xí)OpenCV中重要的一步,但是這個(gè)過(guò)程相對(duì)于初學(xué)者來(lái)說(shuō)有些復(fù)雜。首先,要從網(wǎng)上下載并安裝計(jì)算機(jī)語(yǔ)言的開發(fā)環(huán)境,如微軟的Visual Studio、QT集成開發(fā)環(huán)境等。其次,下載并安裝OpenCV的安裝包,安裝OpenCV是一個(gè)解壓的過(guò)程。下一步,就是對(duì)開發(fā)環(huán)境的配置,其中要對(duì)系統(tǒng)變量、包含目錄、附加依賴項(xiàng)進(jìn)行配置。然后進(jìn)行調(diào)試運(yùn)行。在對(duì)開發(fā)環(huán)境配置時(shí),為保證OpenCV庫(kù)與本地開發(fā)環(huán)境兼容性更好,最好使用CMaker(Cross Platform Make)在本地環(huán)境中對(duì)OpenCV源代碼重新編譯。

6 OpenCV中的Hello World

在學(xué)習(xí)C或是java語(yǔ)言時(shí),常常會(huì)有一個(gè)重要的標(biāo)志就是‘Hello World!’,標(biāo)志著系統(tǒng)配置完成并且整個(gè)IDE環(huán)境運(yùn)行正常,編譯系統(tǒng)成功的編譯了所寫的代碼,并且在操作系統(tǒng)中執(zhí)行成功。OpenCV中這個(gè)標(biāo)志有所不同,它的‘Hello World!’是在IDE中寫好代碼后,調(diào)用OpenCV中的函數(shù)打開一幅代碼中指定的圖片并顯示到新建的窗口中,標(biāo)志著IDE中的參數(shù)是正確的,這是進(jìn)行圖像操作的重要一步。

7 OpenCV圖像像素操作

對(duì)于數(shù)值的計(jì)算是第一步一般輸出一個(gè)結(jié)果,在學(xué)任何一門計(jì)算機(jī)語(yǔ)言時(shí)會(huì)有一個(gè)很好的例子“計(jì)算器”,那圖像如何去表示?其實(shí)圖像是多個(gè)結(jié)果的一個(gè)集合,就像在C語(yǔ)言中打出星號(hào)所組成的菱形,每一個(gè)星號(hào)可以比喻成一個(gè)圖像中的像素點(diǎn)。對(duì)于圖像處理過(guò)程中常常見到的有3種:第一種,RGB圖像,彩色的圖像,每個(gè)像素點(diǎn)由3個(gè)數(shù)值表示。第二種,灰度圖像,像以前的黑白電視機(jī),每個(gè)像素點(diǎn)由一個(gè)數(shù)值就可以表示。第三種,二值圖像,每個(gè)像素點(diǎn)由一個(gè)數(shù)值表示。在OpenCV中有多種方法可以對(duì)圖像進(jìn)行操作,其中比較方便的就是利用cv::Mat類,對(duì)圖像進(jìn)行打開、顯示、修改和保存,這也是進(jìn)行圖像操作的重要一步。

8 OpenCV的文檔

大家在OpenCV官網(wǎng)提供的文檔中可以得到更多幫助。在OpenCV的文檔中包括了對(duì)組件結(jié)構(gòu)的介紹,了解OpenCV的組件結(jié)構(gòu)對(duì)學(xué)習(xí)OpenCV是十分有利的,該介紹包括了一系列的動(dòng)態(tài)或靜態(tài)庫(kù),如矩陣數(shù)組的定義、圖像處理模塊包含的內(nèi)容、視頻分析所需要的算法、基本的多視覺算法、外部特征的檢測(cè)類、物體的檢測(cè)類、UI類的使用、圖像算法的硬件加速等,在編寫代碼時(shí)可以查找其類中對(duì)象所包含成員和方法。一些OpenCV圖書所帶的光盤中或互聯(lián)網(wǎng)上網(wǎng)友提供的圖像處理代碼,由于編程使用的操作系統(tǒng)或編譯環(huán)境不同,有些代碼會(huì)包含未知的頭文件或者缺少頭文件,代碼本身并沒(méi)有錯(cuò)誤,但總是編譯出錯(cuò),了解了這些知識(shí)后在編程時(shí),有利于定位在程序中所引用的文件所屬的位置,從而有效地處理文件引用出現(xiàn)的問(wèn)題。

無(wú)論對(duì)什么樣的物體進(jìn)行識(shí)別,圖像識(shí)別過(guò)程基本是不變的,包括:圖像預(yù)處理、圖像分割,特征提取、判斷匹配、輸出結(jié)果。圖像預(yù)處理中會(huì)用到圖像的灰度化、圖像的二值化、去除圖像的噪聲等算法。特征提取中會(huì)用到圖像變換、圖像邊緣檢測(cè)等算法。判斷匹配中用到直方圖、投影等算法。圖像分割有3種:基于閾值的分割、基于區(qū)域分割、基于邊緣的分割[5]。在OpenCV的文檔中都詳細(xì)提供了基本算法類的定義與方法,通過(guò)OpenCV的代碼庫(kù)中的基本算法類或幾個(gè)基本算法類的組合可以實(shí)現(xiàn)以上所列算法的所有功能。

9 結(jié)語(yǔ)

據(jù)統(tǒng)計(jì),一個(gè)人獲取的信息大約有75%來(lái)自視覺。在工業(yè)4.0的時(shí)代里機(jī)器也需要有自己的視覺系統(tǒng),基于圖像處理的機(jī)器視覺在人工智能領(lǐng)域會(huì)得到更廣泛的應(yīng)用,如:無(wú)人駕駛汽車、智能機(jī)器人、智能安防系統(tǒng)等。OpenCV是一個(gè)進(jìn)入這些行業(yè)的重要工具之一,圖像處理的學(xué)習(xí)過(guò)程是一個(gè)循序漸進(jìn)的過(guò)程,希望學(xué)習(xí)者在OpenCV的基礎(chǔ)上提高對(duì)于圖像處理的認(rèn)識(shí)及對(duì)圖像處理的技術(shù)水平。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的實(shí)時(shí)車輛運(yùn)動(dòng)速度檢測(cè)算法研究

摘 要: 在對(duì)比了傳統(tǒng)運(yùn)動(dòng)車輛實(shí)時(shí)檢測(cè)方法的基礎(chǔ)上,提出了一種新的G?C二重差分法,將視頻流中的某一當(dāng)前幀與背景幀進(jìn)行邊緣檢測(cè),將兩幀的結(jié)果相減,得到梯度差分,再將此結(jié)果與背景顏色差分結(jié)果進(jìn)行“或”運(yùn)算,提高了車輛存在判斷的準(zhǔn)確度,此算法可以準(zhǔn)確檢測(cè)出路面運(yùn)動(dòng)車輛存在同時(shí)有效消除車輛陰影的影響,為后續(xù)車輛運(yùn)動(dòng)速度的實(shí)時(shí)檢測(cè)提供了有力保證?;谶\(yùn)動(dòng)車輛檢測(cè)的結(jié)果,在VC環(huán)境下進(jìn)行了編程實(shí)現(xiàn),自動(dòng)檢測(cè)出運(yùn)動(dòng)車輛的實(shí)時(shí)速度,測(cè)試結(jié)果表明該算法效果很好。

關(guān)鍵詞: 計(jì)算機(jī)視覺; 車輛檢測(cè); 速度檢測(cè); 消除車輛陰影

0 引 言

計(jì)算機(jī)視覺(Computer Vision)主要研究如何運(yùn)用照相機(jī)和計(jì)算機(jī)獲取被拍攝對(duì)象的數(shù)據(jù)與信息,形象的說(shuō),就是給計(jì)算機(jī)安裝上“眼睛”(照相機(jī))和“大腦”(算法)。目前,計(jì)算機(jī)視覺技術(shù)的應(yīng)用領(lǐng)域十分廣泛,其在道路交通管理中的應(yīng)用更是取得了很好的效果。隨著科學(xué)技術(shù)的飛速發(fā)展,現(xiàn)代交通在經(jīng)濟(jì)發(fā)展中所起的作用越來(lái)越大,而交通現(xiàn)代化帶來(lái)的問(wèn)題也越來(lái)越多,諸如交通擁擠、交通事故頻發(fā)、交通環(huán)境惡化等。在這樣的大背景下,智能交通系統(tǒng)(Intelligent Traffic System,ITS)作為一種強(qiáng)有力的交通管理手段應(yīng)運(yùn)而生,其高效率的管理特點(diǎn)使其成為當(dāng)今世界道路交通管理的發(fā)展趨勢(shì),而計(jì)算機(jī)視覺技術(shù)則是ITS的重要技術(shù)支持。

實(shí)時(shí)車輛運(yùn)動(dòng)速度檢測(cè)是ITS對(duì)交通實(shí)施監(jiān)測(cè)和管理的重要一環(huán),對(duì)車輛速度的檢測(cè)一方面可以監(jiān)控超速等違章問(wèn)題,減少交通事故的發(fā)生,另一方面可以根據(jù)車速判斷道路擁擠程度,進(jìn)而迅速采取措施,保證道路交通的安全和暢通,從而實(shí)現(xiàn)智能交通管理的目的。在上一代ITS中,實(shí)時(shí)車輛運(yùn)動(dòng)速度檢測(cè)的方法主要有線圈檢測(cè)、激光檢測(cè)、雷達(dá)檢測(cè)等,這些速度檢測(cè)方法多多少少都存在一定的問(wèn)題,如容易受路基狀況、自然環(huán)境等的影響精度降低,而在新一代ITS中基于計(jì)算機(jī)視覺的車輛速度檢測(cè)法則大大提高了測(cè)速的精度,這有賴于計(jì)算機(jī)有一個(gè)“超強(qiáng)大腦”,即好的算法。

1 運(yùn)動(dòng)車輛的檢測(cè)

運(yùn)動(dòng)車輛的檢測(cè)是實(shí)時(shí)運(yùn)動(dòng)車輛速度檢測(cè)的基礎(chǔ),使計(jì)算機(jī)能夠自動(dòng)的把相機(jī)攝取的視頻里的靜止物體與運(yùn)動(dòng)物體區(qū)別開,并且自動(dòng)提取出運(yùn)動(dòng)物體。所以,在研究實(shí)時(shí)車輛速度檢測(cè)算法前,先要研究運(yùn)動(dòng)車輛的檢測(cè)算法。

1.1 現(xiàn)有運(yùn)動(dòng)目標(biāo)檢測(cè)方法比較

目前,常用的運(yùn)動(dòng)車輛實(shí)時(shí)檢測(cè)方法主要有幀間差分法和背景差分法。

1.2.2 預(yù)處理幀的顏色差分

由于無(wú)論車身像素值是否低于路面像素值,其梯度邊緣必然存在,而交通路面一般都很平坦,除了車道線外檢測(cè)不到邊緣,將當(dāng)前幀與路面背景模型均進(jìn)行邊緣檢測(cè),再將兩個(gè)邊緣圖像按式(8)做差得到運(yùn)動(dòng)物體的邊緣梯度差分圖像:

3 實(shí)驗(yàn)結(jié)果與分析

筆者用實(shí)際拍攝的視頻圖像對(duì)上述算法進(jìn)行了試驗(yàn)測(cè)試,實(shí)驗(yàn)時(shí)模擬實(shí)際交通攝像機(jī)的安裝情況,使其固定不動(dòng),計(jì)算機(jī)處理的速度約為20 f/s。首先將視頻中的某一幀進(jìn)行邊緣檢測(cè),與背景做梯度差分,并與背景顏色差分的結(jié)果進(jìn)行“或”運(yùn)算,最后對(duì)圖像去噪并二值化,通過(guò)測(cè)試多種路況、天氣和光照條件,試驗(yàn)結(jié)果顯示該算法可以在陽(yáng)光充足、遇到物體陰影明顯的情況下準(zhǔn)確地將運(yùn)動(dòng)車輛從視頻的背景中提取出來(lái),并能準(zhǔn)確檢測(cè)出車輛的速度,如圖3所示。

4 結(jié) 語(yǔ)

計(jì)算視覺的應(yīng)用提高了智能交通系統(tǒng)的準(zhǔn)確性,本文在對(duì)比了傳統(tǒng)運(yùn)動(dòng)車輛實(shí)時(shí)檢測(cè)方法的基礎(chǔ)上,提出了一種新的運(yùn)動(dòng)車輛實(shí)時(shí)速度檢測(cè)算法,此算法與傳統(tǒng)的算法相比,可以更加準(zhǔn)確地檢測(cè)出路面運(yùn)動(dòng)車輛的存在,同時(shí)有效消除車輛陰影的影響,為后續(xù)車輛運(yùn)動(dòng)速度的實(shí)時(shí)檢測(cè)提供有力保證?;谶\(yùn)動(dòng)車輛檢測(cè)的結(jié)果,進(jìn)行編程實(shí)現(xiàn),可以自動(dòng)檢測(cè)出運(yùn)動(dòng)車輛的實(shí)時(shí)速度,測(cè)試結(jié)果表明該算法效果很好。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺理論的石材大板表面輪廓提取算法的研究

[摘 要]石材大板表面輪廓提取是石材加工生產(chǎn)過(guò)程中的重要步驟和關(guān)鍵工序。它對(duì)于實(shí)時(shí)優(yōu)化切割不規(guī)則石材以及優(yōu)化排版和下料具有決定性的作用,對(duì)于提高生產(chǎn)效率和石材利用率、節(jié)約石材資源具有重要意義。本文基于計(jì)算機(jī)視覺理論,研究了石材輪廓提取的算法。通過(guò)分析石材目標(biāo)圖像的灰度、顏色和紋理等特征,提出了石材輪廓提取算法,較準(zhǔn)確的提取出石材目標(biāo)輪廓。

[關(guān)鍵詞]石材大板;輪廓提??;圖像處理

1、 引言

圖像處理是在線測(cè)量系統(tǒng)中很重要的一部分,本文就是利用圖像處理技術(shù)提取石材大板的輪廓信息,然后利用其目標(biāo)點(diǎn)的間距最終求得石材大板尺寸。本文對(duì)圖像處理的相關(guān)算法進(jìn)行研究,提取石材大板的輪廓信息,最終計(jì)算其尺寸。提取過(guò)程主要包括圖像預(yù)處理和圖像分割兩部分。圖像處理過(guò)程如圖1所示。

2、圖像處理

2.1 圖像預(yù)處理

通過(guò)CCD攝像機(jī)獲取的石材大板圖像在其傳輸、接收和處理的過(guò)程中,由于受多種因素的影響,如系統(tǒng)噪聲、曝光不足或過(guò)量、傳輸過(guò)程中的誤差以及人為因素等等,均會(huì)對(duì)石材大板圖像產(chǎn)生一定的噪聲干擾。噪聲會(huì)惡化圖像質(zhì)量,有時(shí)會(huì)使提取的信息減少甚至淹沒(méi)某些有用特征,給分析帶來(lái)困難。因此,對(duì)圖像進(jìn)行預(yù)處理是非常必要的,這樣可以去除噪聲,使其更接近真實(shí)圖像,更有利于對(duì)石材大板圖像進(jìn)行后續(xù)處理。圖像預(yù)處理主要包括濾波和增強(qiáng)。

2.1.1 圖像灰度化

圖像的灰度化是圖像增強(qiáng)處理技術(shù)中一種非?;尽⒅苯拥膱D像處理方法。圖像的增強(qiáng)用于調(diào)整圖像的對(duì)比度,為了獲得對(duì)后續(xù)計(jì)算機(jī)處理、分析過(guò)程更有利的圖像,需要對(duì)采集的原始圖像進(jìn)行圖像增強(qiáng),從而淡化背景,消除噪聲干擾,提高對(duì)比度,突出圖像中的重要細(xì)節(jié)[1]。

本文采用的是加權(quán)平均值法:R=G=B=aR+bG+cB??紤]到圖像的合理性,取a=0.11,b=0.59,c=0.30,即采用公式(1)進(jìn)行灰度轉(zhuǎn)換:

其中:為轉(zhuǎn)換后的灰度圖像在點(diǎn)處的灰度值;、和分別為彩色圖像在點(diǎn)處的紅色分量值、綠色分量值和藍(lán)色分量值。

在OpenCV函數(shù)庫(kù)中,圖像的灰度化可以通過(guò)cvCvtColor(const CvArr* src,CvArr* dst,int code)函數(shù)實(shí)現(xiàn),其中src為原彩色圖像,dst為處理后的圖像,code為色彩空間轉(zhuǎn)換方式,在這里code定義為CV_RGB2GRAY。彩色石材大板圖像經(jīng)過(guò)式(1)轉(zhuǎn)換后,變成灰度圖像。圖2所示為4個(gè)彩色石材圖像灰度化后的結(jié)果。

2.1.2 圖像平滑

圖像的平滑處理技術(shù)即圖像的去噪聲處理,它是將輸入的圖像進(jìn)行濾波去除噪聲。圖像平滑一是平滑非邊緣區(qū)域,二是使圖像邊緣得到保護(hù)。一個(gè)較好的平滑方法應(yīng)該是既能消掉這些噪聲效應(yīng)又不使圖像的邊緣輪廓和線條模糊。在濾波方法中,最常用的有均值濾波和中值濾波兩種,本文采用此兩種方法分別對(duì)石材大板平滑處理,效果如圖3所示。

這里僅選取了其中的一幅圖像進(jìn)行處理。從圖中可以看出均值濾波和中值濾波對(duì)含有高斯噪聲的圖像都能夠有效地抑制噪聲的干擾,對(duì)含有椒鹽噪聲的圖像也能抑制部分噪聲。但通過(guò)比較明顯可以看出,,中值濾波在椒鹽噪聲處理方面的能力是均值濾波無(wú)法比擬的,因此,本文采用中值濾波對(duì)圖像進(jìn)行濾波去噪。

2.2 圖像分割與邊緣檢測(cè)

圖像分割是圖像處理和計(jì)算機(jī)視覺中基本而關(guān)鍵的技術(shù)之一,其目的就是將目標(biāo)物體與背景分離開來(lái),為后續(xù)的處理提供堅(jiān)實(shí)的基礎(chǔ)。圖像分割的方法主要包括閾值法、邊緣檢測(cè)法、區(qū)域跟蹤法等。本論文采用的是邊緣檢測(cè)法。

2.2.1 邊緣檢測(cè)

檢測(cè)石材大板邊緣是其輪廓提取的基礎(chǔ)。邊緣檢測(cè)實(shí)現(xiàn)的難點(diǎn)在于邊緣檢測(cè)的精度和抗噪聲的能力。邊緣檢測(cè)有很多算法,例如Roberts算子、Sobel算子、Prewitt算子、拉普拉斯算子等[2]。

(1)Roberts算子

Roberts算子采用的是對(duì)角方向相鄰的兩個(gè)像素之差。從圖像處理的實(shí)際效果來(lái)看,邊緣定位準(zhǔn),對(duì)噪聲敏感。Roberts算子是一種利用局部差分算子尋找邊緣的算子,該算子對(duì)具有陡峭邊緣且含噪聲少的圖像效果較好。

(2)Sobel算子

Sobel邊緣檢測(cè)算子是先做加權(quán)平均,再微分,然后求梯度。以下兩個(gè)卷積核形成了Sobel邊緣檢測(cè)算子,圖中的每個(gè)點(diǎn)都用這兩個(gè)核做卷積,其中一個(gè)對(duì)垂直邊緣影響最大,而另一個(gè)對(duì)水平邊緣影響最大。邊緣檢測(cè)算子的中心與中心像素相對(duì)應(yīng),進(jìn)行卷積運(yùn)算。兩個(gè)卷積核的最大值作為該點(diǎn)的輸出位。運(yùn)算結(jié)果是一幅邊緣幅度圖像。在邊沿檢測(cè)中,Sobel算子對(duì)于像素的位置的影響做了加權(quán),加權(quán)平均邊寬2像素,因此效果更好。Sobel算子都對(duì)噪聲具有很好的抑制能力,但仍然不能完全排除檢測(cè)出來(lái)的邊緣中存在虛假邊緣的情況。

(3)Prewitt算子

Prewitt算子與Sobel算子基本相同,只是沒(méi)有加權(quán),所有系數(shù)全為1。Prewitt算子產(chǎn)生一幅邊緣強(qiáng)度圖像。

(4)拉普拉斯算子

拉普拉斯(Laplacian)算子是一種二階導(dǎo)數(shù)算子,對(duì)一個(gè)連續(xù)函數(shù), Laplacian算子是不依賴于邊緣方向的二階微分算子,對(duì)圖像中的階躍型邊緣點(diǎn)定位準(zhǔn)確。該算子對(duì)噪聲非常敏感,它使噪聲成分得到加強(qiáng)。這兩個(gè)特性使得該算子容易丟失一部分邊緣的方向信息,造成一些不連續(xù)的檢測(cè)邊緣,同時(shí)抗噪聲能力比較差。

圖4為不同邊緣檢測(cè)算子對(duì)石材大板邊緣進(jìn)行檢測(cè)的結(jié)果。

從圖4中可以看出,不同的邊緣檢測(cè)算法應(yīng)用到石材大板圖像上會(huì)有不同的檢測(cè)效果,通過(guò)比較可以發(fā)現(xiàn)Sobel和Prewitt算子的處理效果相對(duì)較好。經(jīng)多次試驗(yàn)比較,而且由于Sobel算子對(duì)于水平和垂直邊緣的檢測(cè)有更好的效果,因此效果相對(duì)較好。

2.2.2 圖像二值化

圖像的二值化處理就是將圖像上每點(diǎn)的灰度值變?yōu)?或者255,也就是將整個(gè)圖像呈現(xiàn)出明顯的黑白效果。在數(shù)字圖像處理中,二值化是一種簡(jiǎn)單有效的方法。設(shè)定某一閾值,可以用將圖像的數(shù)據(jù)分成兩部分:大于的像素群和小于的像素群。因此圖像二值化可按公式(5)進(jìn)行:

式中,是原始圖像中位于處像素的灰度;是二值化后該處的像素值,它只能取0或1。

圖5所示為用二值化方法提取的石材大板輪廓,通過(guò)這組圖像處理過(guò)程我們可以發(fā)現(xiàn),這類提取石材輪廓的方法適用于石材大板和圖像背景圖案有很大的區(qū)別的圖像,而且我們也可以看出這種方法的提取效果很好。

2.2.3 數(shù)學(xué)形態(tài)學(xué)處理

數(shù)學(xué)形態(tài)學(xué)(Mathematical Morphology)是由一組形態(tài)學(xué)的代數(shù)運(yùn)算子組成的,它的基本運(yùn)算有4個(gè):膨脹(或擴(kuò)張)、腐蝕(或侵蝕)、開啟和閉合,它們?cè)诙祱D像和灰度圖像中各有特點(diǎn)。數(shù)字圖像處理中的形態(tài)學(xué)處理是指將數(shù)字形態(tài)學(xué)作為工具從圖像中提取對(duì)于表達(dá)和描繪區(qū)域形狀有用處的圖像分量,比如邊界、骨架以及凸殼,還包括用于預(yù)處理或后處理的形態(tài)學(xué)過(guò)濾、細(xì)化和修剪等[3]。

本文采用的是閉運(yùn)算,先膨脹,反復(fù)膨脹后得到需要的狀態(tài),如圖6(2)所示。很明顯邊界得到了擴(kuò)張,于是逐步進(jìn)行腐蝕,以恢復(fù)原始邊界,如圖6(3)所示。最后提取石材大板輪廓,如圖6(4)所示。輪廓提取是接下來(lái)計(jì)算石材大板尺寸的基礎(chǔ),最終實(shí)現(xiàn)在線測(cè)量尺寸。

3、結(jié)論

本文介紹了石材大板在線測(cè)量系統(tǒng)的重要階段,先后介紹了圖像的灰度化處理、平滑處理、二值化、圖像分割和數(shù)學(xué)形態(tài)學(xué)處理的相關(guān)原理及算法,提取了石材大板的邊緣輪廓信息。本文的設(shè)計(jì)為石材領(lǐng)域的發(fā)展提供了一個(gè)創(chuàng)新點(diǎn),將其應(yīng)用到現(xiàn)有石材加工設(shè)備上可以實(shí)現(xiàn)石材加工自動(dòng)化水平,解決了國(guó)內(nèi)石材企業(yè)針對(duì)不規(guī)則外型的石材大板不能進(jìn)行實(shí)時(shí)測(cè)量的困擾,提高了生產(chǎn)效率和經(jīng)濟(jì)效益。

計(jì)算機(jī)視覺論文:基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀的設(shè)計(jì)與實(shí)現(xiàn)

摘 要: 針對(duì)傳統(tǒng)四輪定位儀精度不高、操作復(fù)雜的問(wèn)題,設(shè)計(jì)了一套基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀,給出了該儀器基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)方法及攝像頭拍攝連續(xù)圖像的處理方法。最后分析了該車輛四輪定位儀的工作過(guò)程及工作原理,并與手工測(cè)量的車輛四輪定位參數(shù)進(jìn)行了對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀的設(shè)計(jì)理論和方法都是正確的。

關(guān)鍵詞: 計(jì)算機(jī)視覺; 攝像機(jī)定標(biāo); 圖像處理; 四輪定位

0 引 言

隨著汽車行駛速度的加快,影響車輛安全性的車輪定位參數(shù)就越發(fā)的重要。當(dāng)車軸、轉(zhuǎn)向機(jī)構(gòu)和車架發(fā)生磨損和變形[1]后,車輪定位將會(huì)失準(zhǔn)從而影響車輛的安全性。但現(xiàn)有的四輪定位儀精度不高、操作復(fù)雜,嚴(yán)重的影響了車輪定位調(diào)校的效率[2?4]。

針對(duì)上述問(wèn)題,設(shè)計(jì)了一套基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀。給出了該儀器基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)方法及攝像頭拍攝連續(xù)圖像的處理方法,并分析了該四輪定位儀的工作原理,最后通過(guò)實(shí)驗(yàn)證明了該儀器設(shè)計(jì)理論和測(cè)量方法的正確性。

1 基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)

1.1 圖像坐標(biāo)系、攝像機(jī)坐標(biāo)系與世界坐標(biāo)系

攝像機(jī)拍攝的圖像采用標(biāo)準(zhǔn)電視信號(hào)的形式存儲(chǔ)于計(jì)算機(jī)中,然后計(jì)算機(jī)使用數(shù)模板轉(zhuǎn)換為數(shù)字圖像。在圖1所示的直角坐標(biāo)系[(u,v)]中,各像素的坐標(biāo)[(u,v)]表示該像素在整個(gè)數(shù)組中的列數(shù)編碼和行數(shù)編碼。但并沒(méi)有物理單位能夠表示出該像素在整幅圖像中的具體位置,所以還需創(chuàng)建以物理單位為刻度的圖像坐標(biāo)系。圖像坐標(biāo)系以圖像內(nèi)一點(diǎn)作為坐標(biāo)原點(diǎn),其中[x]軸 與[u]軸平行,[y]軸與[v]軸平行,具體如圖1所示,[(u,v)]表示以像素作為單位的圖像坐標(biāo)系,[(x,y)]表示以物理單位毫米作為單位的圖像坐標(biāo)系,兩個(gè)坐標(biāo)系均為圖像坐標(biāo)系,但所采用的坐標(biāo)單位不同。

攝像機(jī)的光心為[O]點(diǎn),攝像機(jī)的光軸為[zc]軸,垂直于圖像平面,[xc]軸與圖像坐標(biāo)系的[x]軸平行,[yc]軸與圖像坐標(biāo)系的[y]軸平行。圖像坐標(biāo)系的坐標(biāo)原點(diǎn)為圖像平面和光軸的交點(diǎn),[xc]軸,[yc]軸和[zc]軸與點(diǎn)[O]組成的坐標(biāo)系即為攝像機(jī)坐標(biāo)系,[OO1]即為攝像機(jī)焦距。

1.2 基于2D平面靶標(biāo)的攝像機(jī)定標(biāo)

由于3D立體靶標(biāo)加工精度受到一定的限制且制作成本較高,此處采用2D平面靶進(jìn)行攝像機(jī)定標(biāo)[5]。在定標(biāo)過(guò)程中,攝像機(jī)以多于兩個(gè)方位對(duì)同一個(gè)平面靶標(biāo)進(jìn)行拍攝,平面靶標(biāo)和攝像機(jī)均能夠自由移動(dòng)且無(wú)需知曉其運(yùn)動(dòng)參數(shù)。在定標(biāo)過(guò)程中,攝像機(jī)內(nèi)部參數(shù)始終為定常數(shù),僅外部參數(shù)發(fā)生變化。

2 圖像處理

為了降低圖像的噪聲干擾,靶盤為黑底,上面有若干個(gè)白色圓斑,并以圓心作為特征點(diǎn),為了取得特征點(diǎn)(白色橢圓中心)的二維圖像坐標(biāo),首先進(jìn)行圖像閾值分割,然后完成邊緣檢測(cè),最后尋找特征點(diǎn)坐標(biāo)[6]。四輪定位系統(tǒng)工作中拍攝的靶盤圖像如圖3所示。

2.1 圖像閾值分割和邊緣檢測(cè)

根據(jù)實(shí)際觀測(cè),將閾值設(shè)置為150,則閾值分割處理后的結(jié)果如圖4所示。

2.2 Hough變換求取橢圓參數(shù)

對(duì)于平面上的任意橢圓,設(shè)橢圓圓心為點(diǎn)[c,]在平面上任取一點(diǎn)[p,]則點(diǎn)[p]距橢圓上任意點(diǎn)的最大距離必然大于點(diǎn)[c]距橢圓上任意點(diǎn)的最大距離。根據(jù)橢圓的該性質(zhì),可以通過(guò)尋找平面內(nèi)距橢圓上任意點(diǎn)的最大距離數(shù)值最小的點(diǎn)來(lái)確定橢圓圓心,而且找到的這個(gè)最大距離的最小值即為橢圓的長(zhǎng)軸長(zhǎng)度。通過(guò)該方法,可以得到橢圓長(zhǎng)、短軸長(zhǎng),橢圓圓心點(diǎn)橫、縱坐標(biāo)和旋轉(zhuǎn)角度5個(gè)參數(shù)中的3個(gè),剩下的2個(gè)橢圓參數(shù)就能夠通過(guò)Hough變換的方法求得,算法的具體實(shí)現(xiàn)步驟如下:

(1) 首先對(duì)需處理的圖像完成邊緣檢測(cè),取得二值化的圖像邊緣輪廓,將邊緣輪廓圖上的各點(diǎn)數(shù)據(jù)存入數(shù)組[A;]

(2) 針對(duì)二維平面上的所有點(diǎn),分別計(jì)算與上步中得到的數(shù)組[A]中點(diǎn)的距離,得到所有點(diǎn)與數(shù)組[A]中點(diǎn)的最大距離,在計(jì)算的最大距離中的最小值對(duì)應(yīng)的點(diǎn)就是橢圓圓心的橫縱坐標(biāo)[p,q,]該最大距離就是橢圓長(zhǎng)軸的長(zhǎng)度[a;]

(3) 將第一步中數(shù)組[A]所有點(diǎn)的數(shù)值與橢圓參數(shù)[p,q,a]代入橢圓方程[E,]橢圓方程為:

然后在二維空間內(nèi)對(duì)參數(shù)[b,θ]進(jìn)行統(tǒng)計(jì)分析,得到一組峰值大于一定閾值的參數(shù)即為橢圓的參數(shù)。

2.3 特征點(diǎn)三維坐標(biāo)求取

通過(guò)前面的分析可知,當(dāng)靶盤上圓的實(shí)際大小與圖像上橢圓長(zhǎng)、短軸尺寸都知道時(shí),攝像機(jī)與圓心間的距離為:

式中:[F]表示攝像機(jī)鏡頭的焦距;[P]表示圓半徑;[A]表示橢圓長(zhǎng)軸長(zhǎng)度,[A=μ×N,][μ]表示像元尺寸,[N]表示圖像中橢圓長(zhǎng)軸的長(zhǎng)度,單位為像素。

根據(jù)式(3)世界坐標(biāo)系與圖像坐標(biāo)系的關(guān)系,可以通過(guò)求解該方程得到特征點(diǎn)坐標(biāo)[(xw,yw,zw)。]此處選取測(cè)量靶盤中相距0.075 m的兩圓心的距離進(jìn)行實(shí)驗(yàn),攝像機(jī)拍到的照片如圖6所示。

3 四輪定位儀的工作流程及原理

3.1 工作流程

基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位系統(tǒng)由兩臺(tái)數(shù)字?jǐn)z相機(jī)、計(jì)算機(jī)主機(jī)和四個(gè)靶盤組成,具體如圖7所示。

攝像機(jī)僅能獲取單側(cè)靶盤的圖像,紅外線由特制的光源發(fā)射,靶盤接收到紅外線后,將其反射至高性能數(shù)字?jǐn)z像機(jī)成像,攝像機(jī)依據(jù)獲取的圖像通過(guò)計(jì)算得出相機(jī)與目標(biāo)之間的距離,然后將數(shù)據(jù)處理后就能夠得出車輪的定位參數(shù),車輪定位參數(shù)的測(cè)量流程具體如下:將汽車放置于舉升機(jī)上,使汽車進(jìn)入攝像機(jī)的拍攝視角范圍;打開攝像機(jī),固定方向盤后推動(dòng)汽車行駛,然后拍攝行駛中的靶盤;根據(jù)攝像機(jī)拍攝到的圖像(三幅以上)計(jì)算出車輪的外傾角和前束角;將汽車整體固定使其無(wú)法前后移動(dòng),轉(zhuǎn)動(dòng)方向盤,獲取車輪轉(zhuǎn)動(dòng)過(guò)程中靶盤的圖像,然后計(jì)算出主銷后傾角和內(nèi)傾角。

3.2 建立測(cè)量基準(zhǔn)平面?車身平面

在汽車行駛過(guò)程中,靶盤本身是傾斜的,車輛前輪兩個(gè)旋轉(zhuǎn)中心點(diǎn)即為汽車前輪定位平面;同樣,車輛后輪兩個(gè)旋轉(zhuǎn)中心點(diǎn)即為后輪定位平面。這兩個(gè)面作為整個(gè)四輪定位測(cè)量系統(tǒng)的基準(zhǔn)平面,其優(yōu)點(diǎn)是該平面無(wú)需依賴于重力和重力傳感器。所以,在車輛行駛過(guò)程中,不論車輛是前后傾斜還是左右傾斜,都不會(huì)影響車輪定位參數(shù)的測(cè)量[7]。

3.3 汽車定位參數(shù)數(shù)學(xué)模型的建立

靶盤固定于車輪,所以可將靶盤和車輪當(dāng)做一個(gè)剛體來(lái)分析,車輪的運(yùn)動(dòng)可分解為平動(dòng)和旋轉(zhuǎn)兩個(gè)分運(yùn)動(dòng)。由于車輪的旋轉(zhuǎn)軸與車輪輪面垂直,所以可將車輪前束角和外傾角看作是車輪旋轉(zhuǎn)軸與各坐標(biāo)軸間的夾角。

由于汽車前輪上安裝的兩靶盤是完全相同的,且其能夠與車輪共同當(dāng)做一個(gè)剛體處理[8],汽車車輪運(yùn)動(dòng)驅(qū)動(dòng)靶盤運(yùn)動(dòng),將靶盤的運(yùn)動(dòng)分解成平移運(yùn)動(dòng)和旋轉(zhuǎn)運(yùn)動(dòng),同時(shí)假設(shè)靶盤先平移后旋轉(zhuǎn)。在靶盤的旋轉(zhuǎn)過(guò)程中,車輪滾動(dòng)一圈,則靶盤上所有白色圓心的運(yùn)動(dòng)軌跡均是圓。但在四輪定位儀的實(shí)際測(cè)量中,車輪滾動(dòng)軌跡達(dá)不到一圈,靶盤圓心軌跡是一段弧,但仍能夠通過(guò)圓弧上任意三點(diǎn)求出軌跡圓心。在車輪的平動(dòng)過(guò)程中,左右靶盤上同一位置的白色圓心的連線隨車輪平動(dòng)形成前輪定位平面,后輪則形成后輪定位平面。

在汽車轉(zhuǎn)向過(guò)程中,車輪繞主銷旋轉(zhuǎn),通過(guò)旋轉(zhuǎn)前后靶盤特征點(diǎn)的坐標(biāo)變化就能夠得出主銷軸線本身與[X,Y,Z]軸間的夾角[α,β,γ,]進(jìn)一步就可求出主銷后傾角和內(nèi)傾角,具體求解示意圖如圖9所示。

4 實(shí) 驗(yàn)

為了驗(yàn)證本文所設(shè)計(jì)的車輪定位儀的準(zhǔn)確性,選取車輪外傾角和前束角進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)通過(guò)車輪外傾角和前束角的變化,從四輪定位儀中輸出各定位參數(shù)的變化,同時(shí)選取手工測(cè)量作為對(duì)比數(shù)據(jù)。各組實(shí)驗(yàn)數(shù)據(jù)如表2~表4所示。

5 結(jié) 論

針對(duì)傳統(tǒng)四輪定位儀精度不高、操作復(fù)雜這一問(wèn)題,設(shè)計(jì)了一套基于圖像處理與計(jì)算機(jī)視覺的車輛四輪定位儀。給出了該儀器的設(shè)計(jì)方法并進(jìn)行了測(cè)量精度實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明所設(shè)計(jì)的四輪定位儀操作簡(jiǎn)單并具有較高的精度。但為了進(jìn)一步提高儀器的測(cè)量精度,后續(xù)還要對(duì)圖像質(zhì)量和圖像處理算法進(jìn)行改進(jìn),并提高攝像機(jī)的定標(biāo)精度。

計(jì)算機(jī)視覺論文:陌上花“衣+”:人工智能計(jì)算機(jī)視覺引擎

時(shí)展日新月異,人們的生活也瞬息萬(wàn)變。人們每天會(huì)接受到很多視覺信息,隨著時(shí)間的流逝,城市中的每一處光影、每一個(gè)街角,都定格著屬于它的美好。“衣+” (北京陌上花科技有限公司)人工智能計(jì)算機(jī)視覺引擎將AR(增強(qiáng)現(xiàn)實(shí))和AI(人工智能)融合,會(huì)讓你眼中的世界完全不同,它更智能化、更懂你的需求,把你所看到的視覺信息經(jīng)過(guò)人工智能“大腦系統(tǒng)”處理后,通過(guò)AR展現(xiàn)和交互,帶給你更多全新的驚喜與感動(dòng)。

小時(shí)候,我們都有過(guò)這樣的夢(mèng)想:生活實(shí)景都變成游戲,隨時(shí)隨地看到的場(chǎng)景、人物、好看的好吃的好玩的都能動(dòng)起來(lái),穿越時(shí)空,虛擬和現(xiàn)實(shí)世界夢(mèng)幻疊加?!耙?”將AR技術(shù)和人工智能技術(shù)深度結(jié)合,使用復(fù)雜的計(jì)算機(jī)視覺技術(shù)和深度學(xué)習(xí)算法,去理解場(chǎng)景,然后增強(qiáng)場(chǎng)景,幫你達(dá)成這個(gè)愿望。仿佛擁有一雙慧眼+超強(qiáng)大腦,而且這只是“衣+”暫時(shí)制定的一個(gè)小目標(biāo)而已。

AR技術(shù)是通過(guò)計(jì)算機(jī)系統(tǒng)提供的信息疊加用戶對(duì)現(xiàn)實(shí)世界感知的技術(shù),將虛擬的信息應(yīng)用到真實(shí)世界,并將計(jì)算機(jī)生成的虛擬物體、場(chǎng)景或系統(tǒng)提示信息疊加到真實(shí)場(chǎng)景中,從而實(shí)現(xiàn)對(duì)現(xiàn)實(shí)的增強(qiáng)。更通俗一點(diǎn)的說(shuō)法是,它是一種全新的人機(jī)交互技術(shù),利用攝像頭、傳感器、實(shí)時(shí)計(jì)算和匹配技術(shù),將真實(shí)的環(huán)境和虛擬的物體實(shí)時(shí)地疊加到同一個(gè)畫面或空間。用戶可以通過(guò)虛擬現(xiàn)實(shí)系統(tǒng)感受到在客觀物理世界中所經(jīng)歷的“身臨其境”的逼真性,還能突破空間、時(shí)間,以及其他客觀限制,感受到在真實(shí)世界中無(wú)法親身經(jīng)歷的體驗(yàn)。

“衣+”是世界領(lǐng)先的人工智能計(jì)算機(jī)視覺引擎,致力于讓計(jì)算機(jī)看懂世界,屬于人工智能中的感知和認(rèn)知智能,在圖像視頻中對(duì)場(chǎng)景、通用物體、商品、人臉的檢測(cè)、識(shí)別、理解、搜索及推薦均達(dá)到領(lǐng)先水平。陌上花自主研發(fā)的深層次多屬性深度學(xué)習(xí)網(wǎng)絡(luò),是人工智能在云和端上計(jì)算的核心基礎(chǔ)。在國(guó)際頂級(jí)計(jì)算機(jī)視覺競(jìng)賽ImageNet2015和ImageNet2016中,先后獲得五項(xiàng)和三項(xiàng)世界第一。

“衣+”技術(shù)團(tuán)隊(duì)正在做這樣一個(gè)嘗試,利用AR技術(shù)結(jié)合人工智能大數(shù)據(jù)技術(shù)感知認(rèn)知世界,并增強(qiáng)了交互方式,這將大大改變?nèi)藗兊纳睿瑢⑸疃葘W(xué)習(xí)的人工智能科技和AR技術(shù)相結(jié)合應(yīng)用到視頻、直播、時(shí)尚、購(gòu)物、美食、出行、運(yùn)動(dòng)、旅行等生活體驗(yàn)的各個(gè)方面,提供全生活場(chǎng)景智能服務(wù),打造前所未有的智能視覺體驗(yàn)。

增強(qiáng)現(xiàn)實(shí)技術(shù),不僅展現(xiàn)了真實(shí)世界的信息,而且將虛擬的信息同時(shí)顯示出來(lái),兩種信息相互補(bǔ)充、疊加。在視覺化的增強(qiáng)現(xiàn)實(shí)中,用戶利用AR設(shè)備,把真實(shí)世界與電腦圖形合成在一起?!耙?”AR技術(shù)結(jié)合人工智能,以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ)實(shí)現(xiàn)感知認(rèn)知,能將人眼看到的所有信息,包括商品、物體、食物、服飾、汽車、建筑等,都精準(zhǔn)匹配出同款及相關(guān)商品。它的展現(xiàn)方式更加生動(dòng)、立體、多樣化,能夠帶給用戶高品質(zhì)、高時(shí)效、一站式的服務(wù)體驗(yàn)。

“衣+”AR技術(shù)和人工智能的結(jié)合實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界的感知和認(rèn)知的能力,可以在圖像視頻中完成對(duì)場(chǎng)景、通用物體、商品、人臉的檢測(cè)、識(shí)別、理解、搜索等。如今,每個(gè)月有上億次的商品推薦通過(guò)“衣+”邊看邊買引擎來(lái)完成,幫助用戶搜索、識(shí)別他們所看到的物品。目前“衣+”支持服飾、3C數(shù)碼、商超、家居、日用品、交通工具等超過(guò)幾百類商品的檢測(cè)和識(shí)別。

通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行深度學(xué)習(xí),“衣+”視覺引擎能夠檢測(cè)識(shí)別視頻或圖像中的商品,并通過(guò)分析商品特征,準(zhǔn)確判斷商品類目等商品信息。在餐飲方面,當(dāng)用戶用不同的手持終端對(duì)餐廳的食品進(jìn)行拍攝后,餐廳的位置以及菜品的食材等將即刻呈現(xiàn)在手持終端上,使就餐體驗(yàn)的科技含量越來(lái)越高。

此外,“衣+”利用技術(shù)手段可以實(shí)現(xiàn)對(duì)視頻和圖像中的物體的位置、名稱、運(yùn)動(dòng)軌跡、輪廓等屬性的實(shí)時(shí)分析。目前已支持超過(guò)10000類常用物體、大于400類室內(nèi)外場(chǎng)景的識(shí)別。

利用深度學(xué)習(xí)技術(shù),“衣+”還可以在視頻、圖像中實(shí)現(xiàn)人臉關(guān)鍵點(diǎn)檢測(cè),可用于相機(jī)、直播等多種娛樂(lè)場(chǎng)景。讓場(chǎng)景營(yíng)銷變得更自然、更直觀、更有趣味?!耙?”人臉屬性識(shí)別,可以準(zhǔn)確識(shí)別出人物的性別、年齡、種族、情緒、顏值、性感、時(shí)尚等屬性信息,平均準(zhǔn)確率超過(guò)93%。基于深度學(xué)習(xí)的人臉對(duì)比技術(shù),實(shí)現(xiàn)人臉相似度測(cè)量,可用于人臉聚類、敏感人物監(jiān)控等場(chǎng)景。這一切,都是在人工智能計(jì)算機(jī)視覺搜索引擎中實(shí)時(shí)完成。

目前,AR技術(shù)越來(lái)越火熱,并將全面融入人們的日常生活。目前,“衣+”和阿里云、華為、優(yōu)酷土豆、微博、360、華數(shù)、京東、天貓魔盒、CIBN、英偉達(dá)、趣拍、花椒等數(shù)十家頂級(jí)機(jī)構(gòu)深度合作,通過(guò)提供邊看邊買引擎、圖像視頻內(nèi)容分析引擎、人臉屬性分析引擎服務(wù)海量用戶,同時(shí)幫助用戶實(shí)現(xiàn)場(chǎng)景營(yíng)銷、智能分析和內(nèi)容互動(dòng)。AR技術(shù)與人工智能相融合的市場(chǎng)將快速增長(zhǎng)。“衣+”也將不斷利用無(wú)處不在的AR技術(shù)和人工智能技術(shù),創(chuàng)造一個(gè)智能世界,將生活中的美好愿望變?yōu)楝F(xiàn)實(shí)。

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用

摘 要

在我國(guó)市場(chǎng)經(jīng)濟(jì)不斷發(fā)展的盛況下,我國(guó)科技發(fā)展水平也緊隨其后,成為世界上的科技強(qiáng)國(guó)之一。在計(jì)算機(jī)水平的不斷提高下,計(jì)算機(jī)視覺技術(shù)應(yīng)運(yùn)而生。其中,計(jì)算機(jī)視覺技術(shù)被應(yīng)用與各個(gè)領(lǐng)域,并在各個(gè)領(lǐng)域都得到廣泛有效的應(yīng)用,比如軍事領(lǐng)域、醫(yī)療領(lǐng)域、工業(yè)領(lǐng)域等。本文針對(duì)計(jì)算機(jī)視覺技術(shù)在交通領(lǐng)域中的應(yīng)用進(jìn)行分析。

【關(guān)鍵詞】計(jì)算機(jī)視覺 交通領(lǐng)域 探究

近年來(lái),隨著科技水平的提高,計(jì)算機(jī)視覺技術(shù)逐漸被人們熟知并廣泛應(yīng)用。相較于其他傳感器來(lái)說(shuō),視覺能獲得更多的信息。因此,在我國(guó)交通領(lǐng)域中,也對(duì)計(jì)算機(jī)視覺技術(shù)進(jìn)行研究完善,將計(jì)算機(jī)視覺技術(shù)應(yīng)用在交通領(lǐng)域各個(gè)方面中,并取得了顯著的成效。

1 計(jì)算機(jī)視覺的概述及基本體系結(jié)構(gòu)

1.1 計(jì)算機(jī)視覺概述

通過(guò)使用計(jì)算機(jī)和相關(guān)設(shè)備,對(duì)生物視覺進(jìn)行模擬的方式,就是計(jì)算機(jī)視覺。對(duì)采集到的圖片或視頻進(jìn)行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場(chǎng)景,是計(jì)算機(jī)視覺的主要任務(wù)。

計(jì)算機(jī)視覺是一門學(xué)問(wèn),它就如何通過(guò)計(jì)算機(jī)和照相機(jī)的運(yùn)用,使人們獲得被拍攝對(duì)象的數(shù)據(jù)與信息所需等問(wèn)題進(jìn)行研究。簡(jiǎn)單的說(shuō),就是讓計(jì)算機(jī)通過(guò)人們給其安裝上的“大腦”和“眼睛”,對(duì)周圍環(huán)境進(jìn)行感知。

計(jì)算機(jī)視覺是一門綜合性學(xué)科,在各個(gè)領(lǐng)域都有所作為,已經(jīng)吸引了各個(gè)領(lǐng)域的研究者對(duì)其研究。同時(shí),計(jì)算機(jī)視覺也是科學(xué)領(lǐng)域中一個(gè)具有重要挑戰(zhàn)性的研究。

1.2 計(jì)算機(jī)視覺領(lǐng)域基本體系結(jié)構(gòu)

提出第一個(gè)較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計(jì)算機(jī)視覺工作者基本接受的計(jì)算機(jī)視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對(duì)視覺系統(tǒng)框架的各個(gè)角度、各個(gè)階段、各個(gè)功能進(jìn)行分析研究,得出了計(jì)算機(jī)視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。

2 計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用

2.1 牌照識(shí)別

車輛的唯一身份是車輛牌照。在檢測(cè)違規(guī)車輛、稽查被盜車輛和管理停車場(chǎng)工作中,車輛牌照的有效識(shí)別與檢測(cè)具有重要的作用和應(yīng)用價(jià)值。然而在實(shí)際應(yīng)用工作中,雖然車牌識(shí)別技術(shù)相對(duì)成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識(shí)別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識(shí)別技術(shù)和車牌字符分割技術(shù)是組成車牌識(shí)別技術(shù)的重要部分。

2.2 車輛檢測(cè)

目前,城市交通路口處紅綠燈的間隔時(shí)間是固定不變的,但是受交通路口的位置不同、時(shí)間不同的影響,每個(gè)交通路口的交通流量也是持續(xù)變化的。此外,對(duì)于某些交通區(qū)域來(lái)說(shuō),公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計(jì)算機(jī)視覺技術(shù),對(duì)交通路口的不同時(shí)間、不同位置的交通情況進(jìn)行分析計(jì)算,并對(duì)交通流量進(jìn)行預(yù)測(cè),有利于為交通警察縮短出警時(shí)間、為交通路口的紅綠燈根據(jù)實(shí)際情況設(shè)置動(dòng)態(tài)變化等技術(shù)提供支持。

2.3 統(tǒng)計(jì)公交乘客人數(shù)

城市公共交通的核心內(nèi)容是城市公交調(diào)度問(wèn)題,一個(gè)城市如何合理的解決公交調(diào)度問(wèn)題,是緩解城市運(yùn)力和運(yùn)量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問(wèn)題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟(jì)利益和社會(huì)效益的提高做出了巨大的貢獻(xiàn)。由于在不同的地域、不同的時(shí)間,公交客流會(huì)存在不均衡性,高峰時(shí)段的公交乘客過(guò)多,平峰時(shí)段的公交乘客過(guò)少,造成了公交調(diào)度不均衡問(wèn)題,使有限資源浪費(fèi)嚴(yán)重。在計(jì)算機(jī)視覺智能公交系統(tǒng)中,自動(dòng)乘客計(jì)數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動(dòng)乘客計(jì)數(shù)技術(shù),是對(duì)乘客上下車的時(shí)間和地點(diǎn)自動(dòng)收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時(shí)間和地點(diǎn)兩方面對(duì)客流分析,為城市公交調(diào)度進(jìn)行合理的安排。

2.4 對(duì)車道偏離程度和駕駛員工作狀態(tài)判斷

交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車道偏離的主要原因。針對(duì)此種現(xiàn)象,為減少交通事故的發(fā)生,計(jì)算機(jī)視覺中車道偏離預(yù)警系統(tǒng)被研究開發(fā)并被廣泛應(yīng)用。針對(duì)駕駛員眨眼頻率,利用計(jì)算機(jī)視覺對(duì)駕駛員面部進(jìn)行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對(duì)駕駛員的工作狀態(tài)進(jìn)行判斷。此外,根據(jù)道路識(shí)別技術(shù),對(duì)車輛行駛狀態(tài)進(jìn)行檢測(cè),也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計(jì)算機(jī)視覺的基礎(chǔ)上,檢測(cè)駕駛員疲勞狀態(tài)的有效方法。

2.5 路面破損檢測(cè)

最常見的路面損壞方式就是裂縫。利用計(jì)算機(jī)視覺,及時(shí)發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進(jìn)行修補(bǔ),有利于節(jié)省維護(hù)成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計(jì)算機(jī)視覺進(jìn)行路面檢測(cè),相較于之前人工視覺檢測(cè)相比,有效提高了視覺檢測(cè)的效率,增強(qiáng)了自動(dòng)化程度,提高了安全性,為市民的出行安全帶來(lái)了更高保障。

3 結(jié)論

本文從計(jì)算機(jī)視覺的概述,及計(jì)算機(jī)視覺基本體系結(jié)構(gòu),和計(jì)算機(jī)視覺在交通領(lǐng)域中的應(yīng)用三面進(jìn)行分析,可見計(jì)算機(jī)視覺在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計(jì)算機(jī)視覺在現(xiàn)展過(guò)程中的重要性。隨著計(jì)算機(jī)視覺技術(shù)的越來(lái)越成熟,交通領(lǐng)域的檢測(cè)管理一定會(huì)加嚴(yán)格,更加安全。

計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺技術(shù)的推廣與應(yīng)用

【摘要】由于計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)視覺技術(shù)也得到了很大的發(fā)展。從產(chǎn)生的時(shí)間來(lái)看,計(jì)算機(jī)視覺產(chǎn)生于上個(gè)世紀(jì)中葉,當(dāng)時(shí)它的主要工作內(nèi)容是進(jìn)行統(tǒng)計(jì)模式識(shí)別,較為簡(jiǎn)單,目前為止已經(jīng)經(jīng)過(guò)了長(zhǎng)時(shí)間的發(fā)展,工作內(nèi)容明顯增加,依然發(fā)展為一門獨(dú)立的學(xué)科,而且在多個(gè)領(lǐng)域都得到了廣泛的應(yīng)用。對(duì)于人們的生活產(chǎn)生了很大的影響。本文主要是簡(jiǎn)單介紹計(jì)算機(jī)視覺技術(shù)的發(fā)展歷程,并分析它在那些社會(huì)生產(chǎn)領(lǐng)域中得到了推廣以及應(yīng)用。

【關(guān)鍵詞】計(jì)算機(jī)視覺技術(shù) 推廣 應(yīng)用

在人工智能領(lǐng)域的研究中,計(jì)算機(jī)視覺是主要的研究對(duì)象之一,目前它已經(jīng)發(fā)展為一門獨(dú)立的科學(xué)學(xué)科,主要是對(duì)相關(guān)的理論以及技術(shù)進(jìn)行研究,從而建立一個(gè)完善的人工信息系統(tǒng)。

一、計(jì)算機(jī)視覺技術(shù)的產(chǎn)生與發(fā)展歷程

計(jì)算機(jī)視覺產(chǎn)生于20世紀(jì)50年代,其當(dāng)時(shí)主要的工作內(nèi)容為統(tǒng)計(jì)模式識(shí)別,尤其是需要進(jìn)行分析二維圖像的特點(diǎn)和作用,例如對(duì)航空?qǐng)D片進(jìn)行研究、對(duì)顯微圖片進(jìn)行分析等。直至60年代初,Roberts使用計(jì)算機(jī)從大量的數(shù)字圖像當(dāng)中選取出棱柱體、長(zhǎng)方體等物體的三維圖形,并且分析物體空間的主要特點(diǎn)。在70年代初期,視覺應(yīng)用系統(tǒng)開始得到應(yīng)用,然后過(guò)了幾十年之后,專家們已經(jīng)了解了機(jī)器視覺的特點(diǎn),并且開設(shè)了對(duì)應(yīng)的課程。到了80年代中期,計(jì)算機(jī)視覺已經(jīng)逐漸被人們應(yīng)用與工作和生活當(dāng)中。計(jì)算機(jī)技術(shù)的不斷發(fā)展,使得計(jì)算機(jī)視覺系統(tǒng)的實(shí)用性得以提升,現(xiàn)已被大量使用于機(jī)器人學(xué)、幾何計(jì)算等領(lǐng)域,直接影響著人們的生活。

二、計(jì)算機(jī)視覺技術(shù)的推廣與應(yīng)用領(lǐng)域

2.1應(yīng)用于工業(yè)生產(chǎn)領(lǐng)域

目前為止計(jì)算機(jī)視覺技術(shù)已經(jīng)普遍應(yīng)用于工業(yè)生產(chǎn)領(lǐng)域中,除了在工業(yè)探傷、檢測(cè)方面得到了推廣,而且還在辦公以及生產(chǎn)自動(dòng)化等各方面都得到了廣泛的應(yīng)用。一般來(lái)說(shuō)在工業(yè)生產(chǎn)中推廣計(jì)算機(jī)視覺技術(shù),能夠在很大程度上提高自動(dòng)化程度,從而提高產(chǎn)品生產(chǎn)的效率,同時(shí)還能防止人工的失誤,導(dǎo)致不必要的損失。

2.2應(yīng)用于農(nóng)業(yè)生產(chǎn)領(lǐng)域中

從農(nóng)業(yè)生產(chǎn)領(lǐng)域的角度來(lái)看,計(jì)算機(jī)視覺技術(shù)的應(yīng)用也越愛越普遍,一方面主要是利用該技術(shù)全程監(jiān)測(cè)農(nóng)作物的生產(chǎn)過(guò)程,已達(dá)到預(yù)防病害蟲的作用,另一方面利用該技術(shù)對(duì)農(nóng)產(chǎn)品進(jìn)行檢測(cè),以便對(duì)其進(jìn)行分類與分級(jí)。由于在農(nóng)業(yè)生產(chǎn)領(lǐng)域中利用計(jì)算機(jī)視覺技術(shù)能夠?qū)崿F(xiàn)自動(dòng)化管理,因此能夠減少大量的勞動(dòng)力,降低生產(chǎn)的人工成本,進(jìn)一步提高管理生產(chǎn)效率。

2.3應(yīng)用于社會(huì)公共安全領(lǐng)域中

社會(huì)公共安全是人們非常重視的一個(gè)問(wèn)題,計(jì)算機(jī)視覺技術(shù)在這方面也得到了有效的應(yīng)用,不僅應(yīng)用于偵查、犯罪偵破工作中,而且還應(yīng)用于指紋配比、人臉合成等工作中。應(yīng)用這種技術(shù)能夠進(jìn)一步提高犯罪案件的偵破效率,避免更多的犯罪行為發(fā)生,從而影響人們的正常生活。

2.4應(yīng)用于視覺導(dǎo)航領(lǐng)域中

通過(guò)對(duì)計(jì)算機(jī)視覺技術(shù)進(jìn)行長(zhǎng)時(shí)間的研究后,當(dāng)前已將之推廣于視覺導(dǎo)航領(lǐng)域中,主要是應(yīng)用于太空探測(cè)、航天飛行等方面,在此基礎(chǔ)上還應(yīng)用于巡航導(dǎo)彈制導(dǎo)、智能交通等方面。在視覺導(dǎo)航領(lǐng)域中,應(yīng)用計(jì)算機(jī)視覺技術(shù)可以解放大量的勞動(dòng)力,避免工作帶來(lái)的危險(xiǎn),而且還能有效提高工作效率。

2.5應(yīng)用于人機(jī)交互領(lǐng)域中

一般來(lái)說(shuō)在人機(jī)交互領(lǐng)域中應(yīng)用計(jì)算機(jī)視覺技術(shù),可以通過(guò)人的肢體語(yǔ)言、人臉表情進(jìn)行測(cè)定,進(jìn)一步分析人的意愿,從而按照要求認(rèn)真完成指令,這樣不僅可以有效增加交互的方便性,而且還可以有效增加臨場(chǎng)感,具有其他技術(shù)不可替代的作用。

2.6應(yīng)用于虛擬現(xiàn)實(shí)領(lǐng)域中

當(dāng)前計(jì)算機(jī)視覺技術(shù)在虛擬現(xiàn)實(shí)領(lǐng)域中得到了推廣,利用這種技術(shù)可以進(jìn)行不同的軍隊(duì)?wèi)?zhàn)場(chǎng)場(chǎng)景模擬,在此基礎(chǔ)上還能對(duì)飛行員飛行、醫(yī)生手術(shù)等現(xiàn)場(chǎng)進(jìn)行模擬。總之,利用這種技術(shù)能夠帶給人們一種身臨其境的感覺,從而進(jìn)一步提高工作效率。

2.7應(yīng)用于衛(wèi)星遙感領(lǐng)域中

從衛(wèi)星遙感領(lǐng)域的角度來(lái)看,計(jì)算機(jī)視覺技術(shù)的應(yīng)用并不少見,不僅應(yīng)用于礦藏勘探、資源探測(cè)等方面,而且還應(yīng)用于氣象預(yù)報(bào)、自然災(zāi)害監(jiān)測(cè)等方面。一般來(lái)說(shuō)衛(wèi)星遙感涉及的信息量非常大,而且類別也很多,分析識(shí)別工作稍不注意,就會(huì)出現(xiàn)錯(cuò)誤,而利用這種技術(shù)后,能夠快速、有效的進(jìn)行信息的收集以及分析工作,進(jìn)一步提高信息的準(zhǔn)確性。

三、結(jié)語(yǔ)

計(jì)算機(jī)視覺技術(shù)發(fā)展到現(xiàn)在,已經(jīng)在多個(gè)領(lǐng)域得到應(yīng)用與推廣,在虛擬現(xiàn)實(shí)、工農(nóng)業(yè)生產(chǎn)等眾多領(lǐng)域中隨處可見。而隨著社會(huì)的不斷進(jìn)步,市場(chǎng)對(duì)于計(jì)算機(jī)視覺技術(shù)的需求也越來(lái)越大,具有很大的發(fā)展?jié)摿Α榱四軌驖M足市場(chǎng)增長(zhǎng)的需求,使計(jì)算機(jī)視覺技術(shù)得到更廣泛的應(yīng)用,需要研發(fā)人員通過(guò)不斷的努力研制出更加完善的計(jì)算機(jī)視覺技術(shù)系統(tǒng),這是當(dāng)前科研工作的主要課題。

計(jì)算機(jī)視覺論文:基于OpenCV 的計(jì)算機(jī)視覺技術(shù)研究

摘要:該文基于OpenCV的計(jì)算機(jī)視覺技術(shù)進(jìn)行研究,探討了視頻中計(jì)算機(jī)對(duì)運(yùn)動(dòng)物體視覺檢測(cè)的原理,并對(duì)OpenCV的應(yīng)用情況進(jìn)行說(shuō)明,闡述了基于OpenCV的計(jì)算機(jī)視覺技術(shù)體系,最終重點(diǎn)敘述了計(jì)算機(jī)視覺三維模擬技術(shù),以期能為相關(guān)工作提供參考。

關(guān)鍵詞:OpenCV;計(jì)算機(jī)視覺技術(shù);三維模擬技術(shù)

21世紀(jì)是國(guó)際計(jì)算機(jī)技術(shù)高度發(fā)展的時(shí)代,人們生活中的每個(gè)角落都可以看到計(jì)算機(jī)技術(shù)的身影,尤其是現(xiàn)代計(jì)算機(jī)視覺技術(shù)和圖像處理功能發(fā)展更加迅猛,各技術(shù)分支也逐漸趨于成熟。計(jì)算機(jī)視覺技術(shù)主要指的就是利用智能計(jì)算機(jī)系統(tǒng)來(lái)代替人類的眼睛對(duì)現(xiàn)實(shí)三維世界進(jìn)行辨識(shí)和理解,整個(gè)過(guò)程均是計(jì)算機(jī)自我學(xué)習(xí)的過(guò)程,而隨著這項(xiàng)技術(shù)研究的不斷深入,其不再僅僅包含計(jì)算機(jī)技術(shù)科學(xué),同時(shí)還涉獵了包括生理學(xué)、神經(jīng)學(xué)、物理學(xué)、應(yīng)用數(shù)學(xué)等多門學(xué)科,為人類科技的進(jìn)步提供了有效的動(dòng)力。

1 計(jì)算機(jī)對(duì)視頻中運(yùn)動(dòng)物體檢測(cè)的原理概述

在現(xiàn)代計(jì)算機(jī)技術(shù)基礎(chǔ)下,對(duì)視頻當(dāng)中的運(yùn)動(dòng)物體檢測(cè)原理主要包括兩種,分別是從微觀和宏觀的角度出發(fā)。其中宏觀檢測(cè)技術(shù)指的是當(dāng)計(jì)算機(jī)截取了視頻中的某一個(gè)圖像,其以整幅圖像為對(duì)象進(jìn)行檢測(cè);微觀檢測(cè)技術(shù)是指在截取圖像后,根據(jù)實(shí)際需求對(duì)某一區(qū)域內(nèi)的圖像內(nèi)容進(jìn)行檢測(cè)。在計(jì)算機(jī)視覺技術(shù)實(shí)際應(yīng)用時(shí),其第一步就是對(duì)圖像的采集,第二步是對(duì)已經(jīng)采集的圖像進(jìn)行預(yù)分析處理,如果采用宏觀檢測(cè)技術(shù)則對(duì)圖像整體進(jìn)行分析;如果采用微觀檢測(cè)技術(shù)則首先將圖像進(jìn)行分割,然后對(duì)分割后各圖像內(nèi)容中出現(xiàn)的運(yùn)動(dòng)物體影像進(jìn)行分析。在圖像數(shù)據(jù)獲取過(guò)程中應(yīng)用的是背景差分法,這一技術(shù)主要是將背景和運(yùn)動(dòng)物體進(jìn)行分離提取,以獲取沒(méi)有背景圖像的運(yùn)動(dòng)物體影像數(shù)據(jù)。還可以利用幀間差分法,這種方法主要是對(duì)一個(gè)視頻圖像的逐幀畫面進(jìn)行差別比較,從而獲得各幀圖像上的差值,而將這些差值幀圖結(jié)合起來(lái)就是一個(gè)物體在計(jì)算機(jī)視覺下的運(yùn)動(dòng)軌跡?,F(xiàn)代研究者更傾向于將背景和幀間差分法進(jìn)行結(jié)合運(yùn)用,這樣可以獲得無(wú)背景下的運(yùn)動(dòng)物體軌跡,進(jìn)而提升計(jì)算機(jī)視覺系統(tǒng)捕捉數(shù)據(jù)的準(zhǔn)確性。

2 OpenCV的應(yīng)用概述

OpenCV是現(xiàn)代計(jì)算機(jī)視覺技術(shù)當(dāng)中具有開源性的視覺庫(kù),其最早是由俄羅斯Intel分公司所研發(fā),不僅高效,而且具有兼容的優(yōu)勢(shì)。同時(shí)與傳統(tǒng)IPL圖像處理系統(tǒng)相比,OpenCV所處理的圖像數(shù)據(jù)等級(jí)更高,例如在對(duì)運(yùn)動(dòng)物體進(jìn)行特征跟蹤、目標(biāo)分割、運(yùn)動(dòng)軌跡分析以及三維模型重建等方面都有著巨大的優(yōu)勢(shì)。

OpenCV本身編輯的源代碼是開放式的,編寫過(guò)程簡(jiǎn)潔且方便,并且程序中大多數(shù)函數(shù)已經(jīng)通過(guò)了匯編的最優(yōu)化,使其能夠更加高效地被應(yīng)用。在使用OpenCV的攝像機(jī)標(biāo)定模塊已經(jīng)為用戶設(shè)計(jì)了實(shí)用性較強(qiáng)的接口,并且能夠支持Windows界面的操作平臺(tái),使得這一技術(shù)的操作更加簡(jiǎn)便。這一技術(shù)本身操作簡(jiǎn)便,對(duì)于編程人員和檢驗(yàn)人員個(gè)人技能素質(zhì)要求并不高,視覺技術(shù)系統(tǒng)研發(fā)人員可以利用簡(jiǎn)便的操作來(lái)檢驗(yàn)其設(shè)想是否能夠?qū)崿F(xiàn),這就使得現(xiàn)代計(jì)算機(jī)視覺技術(shù)開發(fā)團(tuán)隊(duì)能夠形成更好的協(xié)作研發(fā)關(guān)系,進(jìn)一步提升技術(shù)研究效率。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠大規(guī)模生產(chǎn)視覺檢測(cè)等方面得到了廣泛的應(yīng)用,同時(shí)對(duì)于無(wú)人飛行器的視覺捕捉技術(shù)也有極大的幫助。最為重要的是OpenCV編程語(yǔ)言的兼容性較強(qiáng),編程人員可以根據(jù)自己的意愿對(duì)源代碼進(jìn)行披露,并且國(guó)內(nèi)也已經(jīng)形成了規(guī)模較大的交流社區(qū),給更多同行業(yè)者提供答疑解惑的場(chǎng)所,進(jìn)一步擴(kuò)大了OpenCV的應(yīng)用范圍。

3 基于OpenCV的計(jì)算機(jī)視覺技術(shù)

3.1 基于OpenCV下的運(yùn)動(dòng)物體檢測(cè)技術(shù)

在常規(guī)運(yùn)動(dòng)物體檢測(cè)技術(shù)下,均是直接通過(guò)圖像背景和運(yùn)動(dòng)物體的區(qū)分來(lái)實(shí)現(xiàn)運(yùn)動(dòng)物體的捕捉。而基于OpenCV下的運(yùn)動(dòng)物體檢測(cè)技術(shù)則不僅能夠針對(duì)于圖像背景的分離實(shí)現(xiàn)運(yùn)動(dòng)物體的觀察,還可通過(guò)物體本身特定的信息來(lái)進(jìn)行檢測(cè),主要包括形狀、輪廓以及顏色等。這樣就能夠?qū)崿F(xiàn)在復(fù)雜的背景當(dāng)中將特定的運(yùn)動(dòng)物體完整抽離出來(lái)。其基本流程包括:首先,對(duì)影像數(shù)據(jù)當(dāng)中某一時(shí)間點(diǎn)的圖像進(jìn)行捕捉,然后對(duì)這一視頻圖像的格式進(jìn)行轉(zhuǎn)化;其次,對(duì)轉(zhuǎn)化格式后的視頻圖像進(jìn)行早期處理,并將運(yùn)動(dòng)物體和復(fù)雜的背景區(qū)分開,降低周圍各環(huán)境因素對(duì)運(yùn)動(dòng)物體主體圖像的影響;第三,根據(jù)完成提取后的運(yùn)動(dòng)物體圖像進(jìn)行辨識(shí),然后再?gòu)囊曨l當(dāng)中捕捉擁有相同特征的物體,并對(duì)該物體進(jìn)行跟蹤識(shí)別。而這一過(guò)程的實(shí)質(zhì)則在于先利用圖像捕捉技術(shù)對(duì)畫面進(jìn)行截取,然后同時(shí)利用背景差分法和幀間差分法對(duì)圖像進(jìn)行分割,逐幀地將運(yùn)動(dòng)物體完成提取出來(lái),以供計(jì)算機(jī)進(jìn)行視覺跟蹤處理。

3.2 基于OpenCV的圖像預(yù)處理技術(shù)

一般情況下,計(jì)算機(jī)視覺處理技術(shù)應(yīng)用的環(huán)境情況較為復(fù)雜,大多數(shù)應(yīng)用環(huán)境當(dāng)中均有光照的變化,并且部分計(jì)算機(jī)視覺處理設(shè)備還需要在露天環(huán)境下進(jìn)行工作,此時(shí)周圍環(huán)境中的風(fēng)、溫度、光照、氣候以及運(yùn)動(dòng)物體數(shù)量等對(duì)視頻圖像的采集均有著極大的影響。環(huán)境因素會(huì)使圖像采集的質(zhì)量大幅度降低,同時(shí)圖像當(dāng)中的噪點(diǎn)問(wèn)題也難以避免,而噪點(diǎn)是視覺捕捉和圖像處理當(dāng)中最大的影響因素。因此,在基于OpenCV下的計(jì)算機(jī)視覺技術(shù)在捕捉視頻圖像之后先對(duì)其進(jìn)行預(yù)處理,然后再由系統(tǒng)對(duì)運(yùn)動(dòng)物體進(jìn)行分離、檢測(cè)和跟蹤。一般的預(yù)處理過(guò)程主要包括平滑度濾波、圖像填充、背景實(shí)時(shí)更新等。

1)圖像的平滑度濾波預(yù)處理技術(shù)

由于在實(shí)際計(jì)算機(jī)視覺捕捉過(guò)程中圖像噪點(diǎn)是難以避免的問(wèn)題,以此在對(duì)圖像中運(yùn)動(dòng)物體進(jìn)行檢測(cè)前,應(yīng)該相對(duì)這些噪點(diǎn)進(jìn)行預(yù)處理,降低環(huán)境噪聲對(duì)圖像的影響。圖像的平滑度濾波處理共分為兩種方式,分別為線性和非線性。其中線性處理方式就是通過(guò)計(jì)算機(jī)處理設(shè)備的簡(jiǎn)單運(yùn)算,對(duì)圖像當(dāng)中的噪點(diǎn)進(jìn)行直接清除,但這一技術(shù)使用后會(huì)造成截獲圖像模糊不清的情況,因此僅對(duì)噪點(diǎn)較少的圖像采用該處理方式;非線性濾波處理則是利用復(fù)雜的圖像處理運(yùn)算,將截獲圖像當(dāng)中的噪點(diǎn)無(wú)限縮小,使其不對(duì)圖像整體造成影響,并且可以有效保證圖像的局部調(diào)整,但這種處理方式在運(yùn)算時(shí)速度沒(méi)有線性濾波處理快,因此需應(yīng)用在噪點(diǎn)較多,圖像信息較復(fù)雜的處理當(dāng)中。

2)圖像的填充預(yù)處理技術(shù)

這一處理技術(shù)在使用過(guò)程中運(yùn)算速度較慢,主要是由于其需要對(duì)逐幀的圖像均進(jìn)行處理,也包括兩種處理方式,分別為邊緣填充和腐蝕膨脹處理。其中邊緣填充處理主要指的是在確定運(yùn)動(dòng)物體之后,利用計(jì)算機(jī)系統(tǒng)自身的邊緣檢測(cè)處理技術(shù),對(duì)物體的輪廓進(jìn)行辨識(shí),并利用形態(tài)學(xué)上的漫水填充方式對(duì)運(yùn)動(dòng)物體周圍的噪點(diǎn)進(jìn)行顏色填充,減小其對(duì)畫面整體元素的影響。而腐蝕膨脹處理與邊緣填充處理原理相類似,但這種處理技術(shù)主要是針對(duì)于噪點(diǎn)進(jìn)行腐蝕和膨脹,使其在畫面當(dāng)中所占比例擴(kuò)大,但對(duì)運(yùn)動(dòng)物體本身不造成影響,這使運(yùn)動(dòng)物體和噪點(diǎn)之間的差異就會(huì)更加明顯,就可以將噪點(diǎn)的影響降到最低,但這種處理方法的效果和攝像機(jī)本身的性能、質(zhì)量等有著密切的關(guān)聯(lián)。

3)背景的實(shí)時(shí)更新預(yù)處理技術(shù)

在進(jìn)行運(yùn)動(dòng)物體和背景分離過(guò)程中,計(jì)算機(jī)系統(tǒng)需要對(duì)圖像上的背景元素進(jìn)行辨識(shí),并對(duì)其開展初始化處理,這樣就能夠?yàn)楹笃趯?shí)時(shí)背景圖像的差異進(jìn)行凸顯,以增加前景圖像的效果,降低噪點(diǎn)對(duì)圖像的影響。在運(yùn)用這一技術(shù)時(shí),首先要先對(duì)第一幀的圖像進(jìn)行確定,并將第一幀圖像當(dāng)中的背景圖像元素進(jìn)行辨識(shí),然后在后期圖像更新和運(yùn)動(dòng)物體檢測(cè)過(guò)程中對(duì)背景進(jìn)行實(shí)時(shí)更新處理。在更新的過(guò)程中其流程主要包括:首先,系統(tǒng)要對(duì)所讀取的畫面進(jìn)行有效的判斷,了解該圖像是否為第一幀;其次,將Opencv處理的圖像轉(zhuǎn)變?yōu)閱瓮ǖ阑叶戎?;第三,?duì)轉(zhuǎn)變后的圖像進(jìn)行高斯平滑度濾波處理,將圖像當(dāng)中的噪點(diǎn)進(jìn)行去除;第四,采用形態(tài)學(xué)噪點(diǎn)填充技術(shù)對(duì)圖像當(dāng)中的噪點(diǎn)進(jìn)行二次處理,以獲得所需要更新的背景圖像。

3.3 前景運(yùn)動(dòng)物體的提取技術(shù)

在計(jì)算機(jī)視覺技術(shù)進(jìn)行運(yùn)動(dòng)物體的檢測(cè)時(shí),只有有效保障檢測(cè)流程的準(zhǔn)確度,才能夠有效保障對(duì)前景運(yùn)動(dòng)物體的跟蹤效果。其主要分為兩大步驟,其一是對(duì)二值化后的圖像數(shù)據(jù)進(jìn)行分割處理;其二是在圖像分析前對(duì)其進(jìn)行充分的填充處理,保證前景圖數(shù)據(jù)的完整性。同時(shí),在前景圖像提取的過(guò)程中也分為多個(gè)步驟,其包括:首先,對(duì)所提出的前景圖像和背景圖像進(jìn)行差分處理;其次,將差分處理后的圖像二值化處理;第三,對(duì)背景當(dāng)中前景物體的輪廓或邊緣進(jìn)行辨識(shí),根據(jù)前景圖像的輪廓對(duì)其進(jìn)行填充。由于在實(shí)際操作過(guò)程中,攝像頭所處環(huán)境的變化較大,并且會(huì)在不同場(chǎng)所內(nèi)的不同角度捕捉畫面,因此就需要在前景圖像提取時(shí)有效提高背景圖像實(shí)時(shí)更新的效果。

利用閥值二值化的分割方式能夠有效將前景圖像和背景圖像分離開,從而使目標(biāo)運(yùn)動(dòng)物體能夠呈現(xiàn)獨(dú)立化,并且閥值分割方式開展前要相對(duì)每個(gè)像素點(diǎn)進(jìn)行確定,判斷其是否位于灰度值的范圍內(nèi)。而將該圖像的像素灰度和閥值進(jìn)行對(duì)比后會(huì)出現(xiàn)兩種結(jié)果,分別是灰度值低于或高于閥值。在實(shí)際應(yīng)用過(guò)程中,有效確定圖像的分割閥值T,就能夠降低環(huán)境當(dāng)中光照因素對(duì)圖像質(zhì)量的影響。

4 計(jì)算機(jī)視覺技術(shù)當(dāng)中的三維重建技術(shù)

1)三維重建的視覺系統(tǒng)

計(jì)算機(jī)視覺技術(shù)在對(duì)圖像進(jìn)行捕捉時(shí)可以視為是對(duì)大量的圖像信息進(jìn)行處理,從攝像機(jī)的視覺角度出發(fā),其所輸入的圖像一般為二維屬性,但輸出的信息確是三維數(shù)據(jù),而這種三維空間數(shù)據(jù)能夠提升對(duì)運(yùn)動(dòng)物體所處空間位置、距離等描述的準(zhǔn)確性。在三維重建視覺系統(tǒng)工作過(guò)程中,其相對(duì)基本的圖像數(shù)據(jù)框架進(jìn)行確定,然后利用一個(gè)坐標(biāo)點(diǎn)建立2.5D圖像數(shù)據(jù),即以此點(diǎn)為視角能夠觀察到的圖像數(shù)據(jù),再將2.5D圖像數(shù)據(jù)進(jìn)行整合從而建立三維圖像。

2)雙目視覺系統(tǒng)

當(dāng)人體利用雙眼在不同角度、同一時(shí)間內(nèi)觀察同一個(gè)物體時(shí),就可以利用算法來(lái)測(cè)量該物體和人體之間的距離,而這種方法也被稱為雙目立體感,其應(yīng)用的原理主要是人體視覺差所帶來(lái)的影響。同時(shí)利用兩臺(tái)攝像機(jī)對(duì)同一圖像從不同角度進(jìn)行觀察,就能夠獲得人體雙目觀察后的效果,因此這一三維重建技術(shù)也被稱為“雙目視覺系統(tǒng)”。兩臺(tái)不同的攝像機(jī)即可代表人體雙眼,其對(duì)圖像進(jìn)行逐幀捕獲,但由于角度不同和環(huán)境影響因素的差異,因此造成了圖像差異,必須對(duì)其捕捉的圖像進(jìn)行預(yù)處理。

3)三維重構(gòu)算法

在計(jì)算機(jī)視覺技術(shù)中對(duì)于視頻流的采集主要依靠的是彩色攝像機(jī)、紅外攝像機(jī)、紅外接收攝像頭等設(shè)備。還可以利用微軟所提供的Kinect設(shè)備,在進(jìn)行運(yùn)動(dòng)物體檢測(cè)前能夠?qū)UI進(jìn)行初始化處理,將系統(tǒng)內(nèi)函數(shù)的參數(shù)設(shè)定為用戶信息深度圖、彩圖、骨骼追蹤圖等數(shù)據(jù)。在使用Kinect設(shè)備對(duì)視頻流進(jìn)行打開時(shí),其可以遵循三個(gè)步驟,其一是彩色和深度數(shù)據(jù)的處理;其二是根據(jù)數(shù)據(jù)的索引添加顏色信息,并將其引入到深度圖數(shù)據(jù)當(dāng)中;其三是骨骼追蹤數(shù)據(jù)。

5 結(jié)束語(yǔ)

計(jì)算機(jī)視覺捕捉技術(shù)是現(xiàn)代計(jì)算機(jī)應(yīng)用當(dāng)中較為先進(jìn)的內(nèi)容,其應(yīng)用范圍較廣,對(duì)于運(yùn)動(dòng)物體的捕捉準(zhǔn)確度較高,能夠有效推進(jìn)現(xiàn)代計(jì)算機(jī)模擬技術(shù)的發(fā)展。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的馬鈴薯外部品質(zhì)檢測(cè)的應(yīng)用研究

摘 要計(jì)算機(jī)視覺具有實(shí)時(shí)、客觀、無(wú)損的優(yōu)點(diǎn),能對(duì)馬鈴薯的表面外部品質(zhì)進(jìn)行快速有效的檢測(cè)。本文闡述了應(yīng)用計(jì)算機(jī)視覺技術(shù)對(duì)馬鈴薯進(jìn)行外部品質(zhì)檢測(cè)的必要性,并對(duì)基于計(jì)算機(jī)視覺的馬鈴薯的大小檢測(cè)、形狀檢測(cè)以及表面缺陷檢測(cè)的應(yīng)用進(jìn)行了研究。

【關(guān)鍵詞】計(jì)算機(jī)視覺技術(shù) 馬鈴薯外部品質(zhì) 檢測(cè)

隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)視覺技術(shù)應(yīng)運(yùn)而生并在工業(yè)自動(dòng)化以及農(nóng)產(chǎn)品檢驗(yàn)檢測(cè)等領(lǐng)域成功應(yīng)用。其中,將計(jì)算機(jī)視覺技術(shù)用于以自動(dòng)化采集和品級(jí)分級(jí)為代表的果蔬商品化處理具有非常廣闊的發(fā)展空間。我國(guó)政府將“農(nóng)產(chǎn)品深加工技術(shù)與設(shè)備研究開發(fā)”列為我國(guó)“十五”重大科技攻關(guān)項(xiàng)目的第一項(xiàng),這標(biāo)志著計(jì)算機(jī)視覺技術(shù)在果蔬外部品質(zhì)檢測(cè)中會(huì)發(fā)揮越來(lái)越重要的作用。

馬鈴薯是世界上僅僅排在小麥、水稻和玉米之后的第四種主要農(nóng)作物,種植區(qū)域非常廣泛。馬鈴薯品質(zhì)檢測(cè)是馬鈴薯深加工的一個(gè)關(guān)鍵步驟,目前,該檢驗(yàn)過(guò)程多數(shù)采用人工檢測(cè),不僅成本高、效率低,而且與檢驗(yàn)員的專業(yè)素質(zhì)有密切的關(guān)系,受到人為因素影響的程度較大,嚴(yán)重制約的馬鈴薯加工企業(yè)的發(fā)展。計(jì)算機(jī)視覺技術(shù)能對(duì)農(nóng)產(chǎn)品的某些特性變化和缺陷進(jìn)行識(shí)別,具有客觀、無(wú)損害等特點(diǎn)。本文對(duì)基于計(jì)算機(jī)視覺的馬鈴薯外部品質(zhì)檢測(cè)的應(yīng)用進(jìn)行了研究。

1 應(yīng)用計(jì)算機(jī)視覺技術(shù)對(duì)馬鈴薯進(jìn)行外部品質(zhì)檢測(cè)的必要性

隨著“麥當(dāng)勞”、“肯德基”的餐飲服務(wù)業(yè)的快速發(fā)展,炸薯?xiàng)l、炸薯片已經(jīng)成為一種休閑食品深受消費(fèi)者的喜愛,推動(dòng)了我國(guó)馬鈴薯產(chǎn)業(yè)的發(fā)展。然而,情況并不十分樂(lè)觀,與國(guó)外的馬鈴薯企業(yè)相比,我國(guó)馬鈴薯加工企業(yè)生產(chǎn)規(guī)模小、生產(chǎn)產(chǎn)品單一、技術(shù)設(shè)備落后、產(chǎn)品質(zhì)量不高的現(xiàn)象導(dǎo)致我國(guó)的馬鈴薯產(chǎn)品銷售困難,經(jīng)濟(jì)效益逐漸下滑。

基于以上現(xiàn)狀,對(duì)馬鈴薯的加工研究還有很長(zhǎng)的一段路程。企業(yè)要擴(kuò)大生產(chǎn)規(guī)模,針對(duì)中國(guó)的消費(fèi)趨勢(shì)與消費(fèi)水平開發(fā)出新的馬鈴薯產(chǎn)品,從而提高我國(guó)馬鈴薯產(chǎn)品的競(jìng)爭(zhēng)力。這就要求馬鈴薯加工企業(yè)要對(duì)馬鈴薯的加工技術(shù)進(jìn)行創(chuàng)新,保證產(chǎn)品質(zhì)量。其中,馬鈴薯外部品質(zhì)檢測(cè)對(duì)馬鈴薯產(chǎn)品的最終品質(zhì)起著決定性作用。當(dāng)前的人工檢測(cè)方式已經(jīng)不再適應(yīng)社會(huì)發(fā)展的要求,利用計(jì)算機(jī)視覺檢驗(yàn)代替人工檢驗(yàn)成為社會(huì)發(fā)展的必然趨勢(shì),這是因?yàn)橛?jì)算機(jī)視覺技術(shù)具有以下優(yōu)點(diǎn):

(1)精度高,能夠進(jìn)行定量測(cè)量。

(2)自動(dòng)化程度高,一次就可完成包括大小、形狀、顏色以及缺陷在內(nèi)的檢測(cè)和分析,并能進(jìn)行綜合識(shí)別。

(3)無(wú)損檢測(cè),計(jì)算機(jī)視覺檢測(cè)過(guò)程不需要接觸產(chǎn)品,是通過(guò)傳感器掃面獲取圖像的,不會(huì)造成產(chǎn)品的損傷。

(4)信息量大,可對(duì)大量信息進(jìn)行采集,對(duì)光譜的敏感范圍也很廣。

2 基于計(jì)算機(jī)視覺的馬鈴薯外部品質(zhì)檢測(cè)的應(yīng)用研究

2.1 馬鈴薯大小的檢測(cè)方法

馬鈴薯的大小檢測(cè)不僅影響馬鈴薯深加工的商業(yè)價(jià)值,在在遺傳和育種方面也有很高的應(yīng)用價(jià)值。

利用計(jì)算機(jī)視覺技術(shù)對(duì)馬鈴薯大小的檢測(cè)步驟如下:先從攝像機(jī)中獲取馬鈴薯的圖像信息,在圖像信息的基礎(chǔ)上對(duì)馬鈴薯三維空間的幾何信息進(jìn)行計(jì)算,并由此重建和識(shí)別馬鈴薯。而馬鈴薯物體表面某點(diǎn)的三維幾何位置與其在圖像中對(duì)應(yīng)點(diǎn)之間的相互關(guān)系是由攝像機(jī)成像的幾何模型決定的,這些幾何參數(shù)成為攝像機(jī)參數(shù)。要想準(zhǔn)確的獲取這些攝像機(jī)參數(shù),就必須將實(shí)驗(yàn)與計(jì)算相結(jié)合,此過(guò)程成為系統(tǒng)定標(biāo)。

系統(tǒng)定標(biāo)的基本步驟:根據(jù)設(shè)定好的攝像機(jī)模型和特定的實(shí)驗(yàn)條件包括形狀、尺寸等已知的定標(biāo)參照物,經(jīng)過(guò)對(duì)馬鈴薯圖像的處理,并利用一系列的數(shù)學(xué)轉(zhuǎn)換和計(jì)算方法將攝像機(jī)模型的內(nèi)部和外部參數(shù)計(jì)算出來(lái),從而建立照片與實(shí)物的聯(lián)系推算出馬鈴薯的真實(shí)尺寸。

2.2 馬鈴薯形狀的檢測(cè)方法

根據(jù)《中國(guó)馬鈴薯栽培學(xué)》中的知識(shí),我們可以把馬鈴薯的塊莖形狀分為三類,分別是圓形、長(zhǎng)筒形和橢圓形,除了這三種形狀,其余都是這三種形狀的變形。此次研究將馬鈴薯分為圓形、橢圓形和長(zhǎng)筒形,并且采用橢圓的短長(zhǎng)軸比來(lái)模擬馬鈴薯的縱橫直徑之間的關(guān)系。

2.2.1 馬鈴薯形狀特征參數(shù)的提取

將馬鈴薯橢圓的短長(zhǎng)軸比R作為形狀特征參數(shù),并按照R的大小將馬鈴薯進(jìn)行分類。當(dāng)R小于0.67時(shí),稱之為長(zhǎng)筒馬鈴薯;當(dāng)R大于0.85時(shí),稱之為圓形馬鈴薯;當(dāng)R介于0.67到0.85之間時(shí),稱之為橢圓形馬鈴薯。

2.2.2 結(jié)果與分析

隨機(jī)抽取114塊馬鈴薯,對(duì)抽取的馬鈴薯進(jìn)行正反兩面拍照,挑選清晰度最高的228張圖片。人工分類后進(jìn)行計(jì)算機(jī)視覺分類,操作步驟具體如下:

(1)用DIPS預(yù)處理:B通道灰度化,中值濾波和Otsu分割;

(2)通過(guò)計(jì)算機(jī)視覺技術(shù)提取馬鈴薯圖片的短長(zhǎng)軸比R;

(3)將人工分類與計(jì)算機(jī)視覺分類進(jìn)行對(duì)比,并得出正確率。

根據(jù)圖表,我們可以看出在228張僅有兩張圖片被分類錯(cuò)誤,正確率高達(dá)99.1%,而這兩個(gè)分類錯(cuò)誤的馬鈴薯的短長(zhǎng)軸比處于0.67周圍,分別為0.667604 , 0.67193和0.671887, 0.661063,又因?yàn)閷?duì)馬鈴薯形狀的分類不需要類似工業(yè)生產(chǎn)那樣精密,所以,當(dāng)正反兩面短長(zhǎng)軸比接近時(shí)都可看作是橢圓形。

2.3 馬鈴薯的缺陷檢測(cè)

計(jì)算機(jī)視覺技術(shù)具有實(shí)時(shí)、客觀、無(wú)損的檢測(cè)特點(diǎn),能對(duì)馬鈴薯的表面缺陷和某些特征要素進(jìn)行快速檢測(cè)。基于此,國(guó)內(nèi)外很多研究學(xué)者進(jìn)行了大量的實(shí)驗(yàn)研究,在1998年開發(fā)了利用PC機(jī)輔助的實(shí)時(shí)馬鈴薯檢測(cè)系統(tǒng),能夠?qū)︸R鈴薯的重量、顏色以及形狀進(jìn)行快速檢測(cè);2000年,相關(guān)研究者在此基礎(chǔ)上建立了計(jì)算機(jī)視覺檢測(cè)系統(tǒng),不僅能實(shí)現(xiàn)大小、形狀的檢測(cè),還能對(duì)馬鈴薯表面的生長(zhǎng)裂縫、機(jī)械裂縫、綠皮等表面缺陷進(jìn)行檢測(cè)。當(dāng)前對(duì)馬鈴薯表面缺陷進(jìn)行檢測(cè)的主要計(jì)算機(jī)視覺技術(shù)包括缺陷分割法和缺陷識(shí)別法兩種方法。

3 結(jié)論

本文應(yīng)用計(jì)算機(jī)視覺技術(shù)對(duì)馬鈴薯的大小、形狀和表面缺陷等外部品質(zhì)進(jìn)行了檢測(cè),但是還未能實(shí)現(xiàn)利用計(jì)算機(jī)視覺技術(shù)對(duì)馬鈴薯的表面缺陷進(jìn)行分類這一技術(shù)。因此,相關(guān)部門要加大研究力度,爭(zhēng)取早日完善計(jì)算機(jī)視覺技術(shù),從而推動(dòng)我國(guó)馬鈴薯加工企業(yè)快速高效的發(fā)展。

計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的通訊機(jī)殼部件精密測(cè)量方法

摘要:為解決通訊機(jī)殼部件測(cè)量中遇到的圓擬合和邊緣提取不準(zhǔn)確的問(wèn)題,提出了利用加權(quán)函數(shù)進(jìn)行修正的方法。首先,針對(duì)圓擬合過(guò)程中容易受到干擾點(diǎn)影響的情況,提出采用雙平方形式的加權(quán)函數(shù)對(duì)圓擬合過(guò)程進(jìn)行修正,去除了離群值較大的點(diǎn),從而使圓擬合更準(zhǔn)確。為了準(zhǔn)確的定位邊緣,提出了利用三角形模糊隸屬函數(shù)作為加權(quán)函數(shù),對(duì)邊緣選取過(guò)程進(jìn)行修正,從而達(dá)到準(zhǔn)確提取邊緣的目的。同時(shí),本文采用了魯棒性強(qiáng)的字符提取算法及支持向量機(jī)的字符檢測(cè)算法,實(shí)現(xiàn)了字符提取和識(shí)別。

關(guān)鍵詞:加權(quán)函數(shù);圓擬合;邊緣選取;字符檢測(cè)

通訊天線設(shè)備的電性能直接與設(shè)備的各個(gè)零部件的精度相關(guān),通訊天線零部件的高精度是保障通信質(zhì)量的基本條件。通訊機(jī)殼零部件的尺寸精度、幾何形狀精度、相互位置精度、表面粗糙度等都有嚴(yán)格規(guī)范和公差范圍。在檢測(cè)過(guò)程中不但要高精度地測(cè)量幾何尺寸、幾何形狀和相互位置精度,同時(shí)還要識(shí)別零部件表面的各種符號(hào)、數(shù)字和字母等。本文以通訊機(jī)殼零部件測(cè)量為例,以滿足精度、提高可靠性為目的,研究了基于單目計(jì)算機(jī)視覺條件下滿足亞像素精度的檢測(cè)方法,其關(guān)鍵檢測(cè)技術(shù)主要有標(biāo)定技術(shù)、復(fù)雜輪廓的基元擬合技術(shù)、模糊測(cè)量技術(shù)和字符提取技術(shù)等。文中針對(duì)機(jī)殼部件測(cè)量中,存在圓擬合與邊緣提取不準(zhǔn)確的問(wèn)題,提出了利用加權(quán)函數(shù)進(jìn)行修正的方法。該方法的基本思想是:圓擬合不準(zhǔn)確主要是由于受到較大的離群點(diǎn)影響,因此采用一種雙平方模式的加權(quán)函數(shù)來(lái)去除這些離群點(diǎn),從而得到準(zhǔn)確的擬合圓。邊緣提取不準(zhǔn)確也是由于提取到了不需要的邊緣,因此采用三角形模式的加權(quán)函數(shù)對(duì)不需要的邊緣進(jìn)行抑制,只允許正確的邊緣輸出,從而達(dá)到正確檢測(cè)目的。檢測(cè)結(jié)果表明,所提出的方法能夠滿足測(cè)量要求。由于機(jī)殼部件表面的字符也要求識(shí)別,因此本文根據(jù)字符及其背景,選擇了魯棒性強(qiáng)的動(dòng)態(tài)閥值分割算法和支持向量機(jī)分類器實(shí)現(xiàn)了字符的檢測(cè)和識(shí)別。

1 攝像機(jī)標(biāo)定技術(shù)

本文采用傳統(tǒng)的攝像機(jī)標(biāo)定方法,利用一個(gè)標(biāo)定板與其圖像的對(duì)應(yīng)約束關(guān)系來(lái)確定攝像機(jī)的內(nèi)參數(shù)和外參數(shù)。測(cè)量中,采用的是遠(yuǎn)心相機(jī)模型。從三維空間坐標(biāo)到二維圖像坐標(biāo)的映射關(guān)系可以使用一個(gè)固定數(shù)量的參數(shù)來(lái)表示:

2 最小二乘法的加權(quán)擬合

由于部件的邊界點(diǎn)組成的輪廓會(huì)產(chǎn)生大量的數(shù)據(jù),而我們所關(guān)心的是確定部件輪廓的位置信息,因此需要將輪廓擬合成直線、圓、橢圓等基元,進(jìn)而確定被測(cè)部件的形狀精度、相互位置精度等關(guān)鍵參數(shù)。本文提出一種圓擬合算法,該算法基于各個(gè)擬合點(diǎn)的權(quán)重值的大小對(duì)圓進(jìn)行擬合,使得到圓更為精確。

3 模糊測(cè)量

相對(duì)于經(jīng)典標(biāo)準(zhǔn)的測(cè)量方法,模糊測(cè)量對(duì)邊緣選擇更加靈活。它可以依據(jù)圖像的對(duì)比度、位置、尺寸及灰度值等信息實(shí)現(xiàn)測(cè)量。

設(shè)模糊集合記為;并在[0,1]閉區(qū)間的特征函數(shù)稱為隸屬函數(shù),記為,它表示對(duì)于的隸屬程度,用它來(lái)描述“亦此亦彼”的模糊概念。在經(jīng)典集合論中,集合元素要么屬于或不屬于集合,該集合的邊界是清晰的。模糊集理論則允許有關(guān)集合元素模糊漸進(jìn)評(píng)估,這就是通過(guò)隸屬函數(shù)來(lái)描述的。模糊集合的定義式為:

由于在圖像中的灰度值存在模糊性,其主要體現(xiàn)在物體的邊緣,因此適合用模糊理論對(duì)圖像邊緣的不確定性進(jìn)行描述。對(duì)單一不確定性測(cè)量,在量化的區(qū)域內(nèi),包含準(zhǔn)確的值,即在gray zone范圍內(nèi)[6]。對(duì)物體進(jìn)行測(cè)量前,要選擇模糊隸屬函數(shù)。常用的有Triangular、S-curve function、Z-function和Pi-function四種。其他隸屬函數(shù)可由這四種組合而成[7]。在實(shí)際的測(cè)量中,由于光照等因素影響,常導(dǎo)致邊緣檢測(cè)不準(zhǔn)確,進(jìn)而影響測(cè)量結(jié)果,圖2(a)所示為由于檢測(cè)出多個(gè)邊緣,其測(cè)量結(jié)果有多個(gè)。

5 結(jié)論

本文研究了基于單目計(jì)算機(jī)視覺的機(jī)殼測(cè)量方法。針對(duì)測(cè)量中圓擬合不準(zhǔn)確的問(wèn)題,提出了圓擬合算法的改進(jìn),即對(duì)擬合過(guò)程中,先計(jì)算各個(gè)點(diǎn)的加權(quán)值,對(duì)大于指定值的視為離群點(diǎn),將其忽略已達(dá)到去除離群點(diǎn)的目的,從而得到更準(zhǔn)確的圓。對(duì)檢測(cè)到多個(gè)邊緣的問(wèn)題,根據(jù)其正確的邊緣位置信息,設(shè)計(jì)相應(yīng)的加權(quán)函數(shù),只選擇需要的邊緣輸出,從而得到正確的測(cè)量結(jié)果。加權(quán)函數(shù)的方法的優(yōu)點(diǎn)是使檢測(cè)結(jié)果更準(zhǔn)確;其缺點(diǎn)是增加了計(jì)算量,從而使檢測(cè)時(shí)間加長(zhǎng)。因此,對(duì)于檢測(cè)時(shí)間要求比較苛刻的場(chǎng)合,該方法還有進(jìn)一步改進(jìn)的空間。另外本文還根據(jù)檢測(cè)要求,運(yùn)用動(dòng)態(tài)閥值分割算法和SVM分類器對(duì)機(jī)殼表面的字符進(jìn)行了提取和識(shí)別。