計(jì)算機(jī)視覺的前景精品(七篇)

時(shí)間：2024-01-01 15:43:49

序論：寫作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感，挖掘那些隱藏在內(nèi)心深處的真相，好投稿為您帶來了七篇計(jì)算機(jī)視覺的前景范文，愿它們成為您寫作過程中的靈感催化劑，助力您的創(chuàng)作。

計(jì)算機(jī)視覺的前景

篇(1)

關(guān)鍵詞：OpenCV；計(jì)算機(jī)視覺技術(shù)；三維模擬技術(shù)

中圖分類號(hào)：TP391 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1009-3044（2015）30-0137-02

21世紀(jì)是國際計(jì)算機(jī)技術(shù)高度發(fā)展的時(shí)代，人們生活中的每個(gè)角落都可以看到計(jì)算機(jī)技術(shù)的身影，尤其是現(xiàn)代計(jì)算機(jī)視覺技術(shù)和圖像處理功能發(fā)展更加迅猛，各技術(shù)分支也逐漸趨于成熟。計(jì)算機(jī)視覺技術(shù)主要指的就是利用智能計(jì)算機(jī)系統(tǒng)來代替人類的眼睛對(duì)現(xiàn)實(shí)三維世界進(jìn)行辨識(shí)和理解，整個(gè)過程均是計(jì)算機(jī)自我學(xué)習(xí)的過程，而隨著這項(xiàng)技術(shù)研究的不斷深入，其不再僅僅包含計(jì)算機(jī)技術(shù)科學(xué)，同時(shí)還涉獵了包括生理學(xué)、神經(jīng)學(xué)、物理學(xué)、應(yīng)用數(shù)學(xué)等多門學(xué)科，為人類科技的進(jìn)步提供了有效的動(dòng)力。

1 計(jì)算機(jī)對(duì)視頻中運(yùn)動(dòng)物體檢測的原理概述

在現(xiàn)代計(jì)算機(jī)技術(shù)基礎(chǔ)下，對(duì)視頻當(dāng)中的運(yùn)動(dòng)物體檢測原理主要包括兩種，分別是從微觀和宏觀的角度出發(fā)。其中宏觀檢測技術(shù)指的是當(dāng)計(jì)算機(jī)截取了視頻中的某一個(gè)圖像，其以整幅圖像為對(duì)象進(jìn)行檢測；微觀檢測技術(shù)是指在截取圖像后，根據(jù)實(shí)際需求對(duì)某一區(qū)域內(nèi)的圖像內(nèi)容進(jìn)行檢測。在計(jì)算機(jī)視覺技術(shù)實(shí)際應(yīng)用時(shí)，其第一步就是對(duì)圖像的采集，第二步是對(duì)已經(jīng)采集的圖像進(jìn)行預(yù)分析處理，如果采用宏觀檢測技術(shù)則對(duì)圖像整體進(jìn)行分析；如果采用微觀檢測技術(shù)則首先將圖像進(jìn)行分割，然后對(duì)分割后各圖像內(nèi)容中出現(xiàn)的運(yùn)動(dòng)物體影像進(jìn)行分析。在圖像數(shù)據(jù)獲取過程中應(yīng)用的是背景差分法，這一技術(shù)主要是將背景和運(yùn)動(dòng)物體進(jìn)行分離提取，以獲取沒有背景圖像的運(yùn)動(dòng)物體影像數(shù)據(jù)。還可以利用幀間差分法，這種方法主要是對(duì)一個(gè)視頻圖像的逐幀畫面進(jìn)行差別比較，從而獲得各幀圖像上的差值，而將這些差值幀圖結(jié)合起來就是一個(gè)物體在計(jì)算機(jī)視覺下的運(yùn)動(dòng)軌跡。現(xiàn)代研究者更傾向于將背景和幀間差分法進(jìn)行結(jié)合運(yùn)用，這樣可以獲得無背景下的運(yùn)動(dòng)物體軌跡，進(jìn)而提升計(jì)算機(jī)視覺系統(tǒng)捕捉數(shù)據(jù)的準(zhǔn)確性。

2 OpenCV的應(yīng)用概述

OpenCV是現(xiàn)代計(jì)算機(jī)視覺技術(shù)當(dāng)中具有開源性的視覺庫，其最早是由俄羅斯Intel分公司所研發(fā)，不僅高效，而且具有兼容的優(yōu)勢。同時(shí)與傳統(tǒng)IPL圖像處理系統(tǒng)相比，OpenCV所處理的圖像數(shù)據(jù)等級(jí)更高，例如在對(duì)運(yùn)動(dòng)物體進(jìn)行特征跟蹤、目標(biāo)分割、運(yùn)動(dòng)軌跡分析以及三維模型重建等方面都有著巨大的優(yōu)勢。

OpenCV本身編輯的源代碼是開放式的，編寫過程簡潔且方便，并且程序中大多數(shù)函數(shù)已經(jīng)通過了匯編的最優(yōu)化，使其能夠更加高效地被應(yīng)用。在使用OpenCV的攝像機(jī)標(biāo)定模塊已經(jīng)為用戶設(shè)計(jì)了實(shí)用性較強(qiáng)的接口，并且能夠支持Windows界面的操作平臺(tái)，使得這一技術(shù)的操作更加簡便。這一技術(shù)本身操作簡便，對(duì)于編程人員和檢驗(yàn)人員個(gè)人技能素質(zhì)要求并不高，視覺技術(shù)系統(tǒng)研發(fā)人員可以利用簡便的操作來檢驗(yàn)其設(shè)想是否能夠?qū)崿F(xiàn)，這就使得現(xiàn)代計(jì)算機(jī)視覺技術(shù)開發(fā)團(tuán)隊(duì)能夠形成更好的協(xié)作研發(fā)關(guān)系，進(jìn)一步提升技術(shù)研究效率。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠大規(guī)模生產(chǎn)視覺檢測等方面得到了廣泛的應(yīng)用，同時(shí)對(duì)于無人飛行器的視覺捕捉技術(shù)也有極大的幫助。最為重要的是OpenCV編程語言的兼容性較強(qiáng)，編程人員可以根據(jù)自己的意愿對(duì)源代碼進(jìn)行披露，并且國內(nèi)也已經(jīng)形成了規(guī)模較大的交流社區(qū)，給更多同行業(yè)者提供答疑解惑的場所，進(jìn)一步擴(kuò)大了OpenCV的應(yīng)用范圍。

3 基于OpenCV的計(jì)算機(jī)視覺技術(shù)

3.1 基于OpenCV下的運(yùn)動(dòng)物體檢測技術(shù)

在常規(guī)運(yùn)動(dòng)物體檢測技術(shù)下，均是直接通過圖像背景和運(yùn)動(dòng)物體的區(qū)分來實(shí)現(xiàn)運(yùn)動(dòng)物體的捕捉。而基于OpenCV下的運(yùn)動(dòng)物體檢測技術(shù)則不僅能夠針對(duì)于圖像背景的分離實(shí)現(xiàn)運(yùn)動(dòng)物體的觀察，還可通過物體本身特定的信息來進(jìn)行檢測，主要包括形狀、輪廓以及顏色等。這樣就能夠?qū)崿F(xiàn)在復(fù)雜的背景當(dāng)中將特定的運(yùn)動(dòng)物體完整抽離出來。其基本流程包括：首先，對(duì)影像數(shù)據(jù)當(dāng)中某一時(shí)間點(diǎn)的圖像進(jìn)行捕捉，然后對(duì)這一視頻圖像的格式進(jìn)行轉(zhuǎn)化；其次，對(duì)轉(zhuǎn)化格式后的視頻圖像進(jìn)行早期處理，并將運(yùn)動(dòng)物體和復(fù)雜的背景區(qū)分開，降低周圍各環(huán)境因素對(duì)運(yùn)動(dòng)物體主體圖像的影響；第三，根據(jù)完成提取后的運(yùn)動(dòng)物體圖像進(jìn)行辨識(shí)，然后再從視頻當(dāng)中捕捉擁有相同特征的物體，并對(duì)該物體進(jìn)行跟蹤識(shí)別。而這一過程的實(shí)質(zhì)則在于先利用圖像捕捉技術(shù)對(duì)畫面進(jìn)行截取，然后同時(shí)利用背景差分法和幀間差分法對(duì)圖像進(jìn)行分割，逐幀地將運(yùn)動(dòng)物體完成提取出來，以供計(jì)算機(jī)進(jìn)行視覺跟蹤處理。

3.2 基于OpenCV的圖像預(yù)處理技術(shù)

一般情況下，計(jì)算機(jī)視覺處理技術(shù)應(yīng)用的環(huán)境情況較為復(fù)雜，大多數(shù)應(yīng)用環(huán)境當(dāng)中均有光照的變化，并且部分計(jì)算機(jī)視覺處理設(shè)備還需要在露天環(huán)境下進(jìn)行工作，此時(shí)周圍環(huán)境中的風(fēng)、溫度、光照、氣候以及運(yùn)動(dòng)物體數(shù)量等對(duì)視頻圖像的采集均有著極大的影響。環(huán)境因素會(huì)使圖像采集的質(zhì)量大幅度降低，同時(shí)圖像當(dāng)中的噪點(diǎn)問題也難以避免，而噪點(diǎn)是視覺捕捉和圖像處理當(dāng)中最大的影響因素。因此，在基于OpenCV下的計(jì)算機(jī)視覺技術(shù)在捕捉視頻圖像之后先對(duì)其進(jìn)行預(yù)處理，然后再由系統(tǒng)對(duì)運(yùn)動(dòng)物體進(jìn)行分離、檢測和跟蹤。一般的預(yù)處理過程主要包括平滑度濾波、圖像填充、背景實(shí)時(shí)更新等。

1）圖像的平滑度濾波預(yù)處理技術(shù)

由于在實(shí)際計(jì)算機(jī)視覺捕捉過程中圖像噪點(diǎn)是難以避免的問題，以此在對(duì)圖像中運(yùn)動(dòng)物體進(jìn)行檢測前，應(yīng)該相對(duì)這些噪點(diǎn)進(jìn)行預(yù)處理，降低環(huán)境噪聲對(duì)圖像的影響。圖像的平滑度濾波處理共分為兩種方式，分別為線性和非線性。其中線性處理方式就是通過計(jì)算機(jī)處理設(shè)備的簡單運(yùn)算，對(duì)圖像當(dāng)中的噪點(diǎn)進(jìn)行直接清除，但這一技術(shù)使用后會(huì)造成截獲圖像模糊不清的情況，因此僅對(duì)噪點(diǎn)較少的圖像采用該處理方式；非線性濾波處理則是利用復(fù)雜的圖像處理運(yùn)算，將截獲圖像當(dāng)中的噪點(diǎn)無限縮小，使其不對(duì)圖像整體造成影響，并且可以有效保證圖像的局部調(diào)整，但這種處理方式在運(yùn)算時(shí)速度沒有線性濾波處理快，因此需應(yīng)用在噪點(diǎn)較多，圖像信息較復(fù)雜的處理當(dāng)中。

2）圖像的填充預(yù)處理技術(shù)

這一處理技術(shù)在使用過程中運(yùn)算速度較慢，主要是由于其需要對(duì)逐幀的圖像均進(jìn)行處理，也包括兩種處理方式，分別為邊緣填充和腐蝕膨脹處理。其中邊緣填充處理主要指的是在確定運(yùn)動(dòng)物體之后，利用計(jì)算機(jī)系統(tǒng)自身的邊緣檢測處理技術(shù)，對(duì)物體的輪廓進(jìn)行辨識(shí)，并利用形態(tài)學(xué)上的漫水填充方式對(duì)運(yùn)動(dòng)物體周圍的噪點(diǎn)進(jìn)行顏色填充，減小其對(duì)畫面整體元素的影響。而腐蝕膨脹處理與邊緣填充處理原理相類似，但這種處理技術(shù)主要是針對(duì)于噪點(diǎn)進(jìn)行腐蝕和膨脹，使其在畫面當(dāng)中所占比例擴(kuò)大，但對(duì)運(yùn)動(dòng)物體本身不造成影響，這使運(yùn)動(dòng)物體和噪點(diǎn)之間的差異就會(huì)更加明顯，就可以將噪點(diǎn)的影響降到最低，但這種處理方法的效果和攝像機(jī)本身的性能、質(zhì)量等有著密切的關(guān)聯(lián)。

3）背景的實(shí)時(shí)更新預(yù)處理技術(shù)

在進(jìn)行運(yùn)動(dòng)物體和背景分離過程中，計(jì)算機(jī)系統(tǒng)需要對(duì)圖像上的背景元素進(jìn)行辨識(shí)，并對(duì)其開展初始化處理，這樣就能夠?yàn)楹笃趯?shí)時(shí)背景圖像的差異進(jìn)行凸顯，以增加前景圖像的效果，降低噪點(diǎn)對(duì)圖像的影響。在運(yùn)用這一技術(shù)時(shí)，首先要先對(duì)第一幀的圖像進(jìn)行確定，并將第一幀圖像當(dāng)中的背景圖像元素進(jìn)行辨識(shí)，然后在后期圖像更新和運(yùn)動(dòng)物體檢測過程中對(duì)背景進(jìn)行實(shí)時(shí)更新處理。在更新的過程中其流程主要包括：首先，系統(tǒng)要對(duì)所讀取的畫面進(jìn)行有效的判斷，了解該圖像是否為第一幀；其次，將Opencv處理的圖像轉(zhuǎn)變?yōu)閱瓮ǖ阑叶戎?；第三，?duì)轉(zhuǎn)變后的圖像進(jìn)行高斯平滑度濾波處理，將圖像當(dāng)中的噪點(diǎn)進(jìn)行去除；第四，采用形態(tài)學(xué)噪點(diǎn)填充技術(shù)對(duì)圖像當(dāng)中的噪點(diǎn)進(jìn)行二次處理，以獲得所需要更新的背景圖像。

3.3 前景運(yùn)動(dòng)物體的提取技術(shù)

在計(jì)算機(jī)視覺技術(shù)進(jìn)行運(yùn)動(dòng)物體的檢測時(shí)，只有有效保障檢測流程的準(zhǔn)確度，才能夠有效保障對(duì)前景運(yùn)動(dòng)物體的跟蹤效果。其主要分為兩大步驟，其一是對(duì)二值化后的圖像數(shù)據(jù)進(jìn)行分割處理；其二是在圖像分析前對(duì)其進(jìn)行充分的填充處理，保證前景圖數(shù)據(jù)的完整性。同時(shí)，在前景圖像提取的過程中也分為多個(gè)步驟，其包括：首先，對(duì)所提出的前景圖像和背景圖像進(jìn)行差分處理；其次，將差分處理后的圖像二值化處理；第三，對(duì)背景當(dāng)中前景物體的輪廓或邊緣進(jìn)行辨識(shí)，根據(jù)前景圖像的輪廓對(duì)其進(jìn)行填充。由于在實(shí)際操作過程中，攝像頭所處環(huán)境的變化較大，并且會(huì)在不同場所內(nèi)的不同角度捕捉畫面，因此就需要在前景圖像提取時(shí)有效提高背景圖像實(shí)時(shí)更新的效果。

利用閥值二值化的分割方式能夠有效將前景圖像和背景圖像分離開，從而使目標(biāo)運(yùn)動(dòng)物體能夠呈現(xiàn)獨(dú)立化，并且閥值分割方式開展前要相對(duì)每個(gè)像素點(diǎn)進(jìn)行確定，判斷其是否位于灰度值的范圍內(nèi)。而將該圖像的像素灰度和閥值進(jìn)行對(duì)比后會(huì)出現(xiàn)兩種結(jié)果，分別是灰度值低于或高于閥值。在實(shí)際應(yīng)用過程中，有效確定圖像的分割閥值T，就能夠降低環(huán)境當(dāng)中光照因素對(duì)圖像質(zhì)量的影響。

4 計(jì)算機(jī)視覺技術(shù)當(dāng)中的三維重建技術(shù)

1）三維重建的視覺系統(tǒng)

計(jì)算機(jī)視覺技術(shù)在對(duì)圖像進(jìn)行捕捉時(shí)可以視為是對(duì)大量的圖像信息進(jìn)行處理，從攝像機(jī)的視覺角度出發(fā)，其所輸入的圖像一般為二維屬性，但輸出的信息確是三維數(shù)據(jù)，而這種三維空間數(shù)據(jù)能夠提升對(duì)運(yùn)動(dòng)物體所處空間位置、距離等描述的準(zhǔn)確性。在三維重建視覺系統(tǒng)工作過程中，其相對(duì)基本的圖像數(shù)據(jù)框架進(jìn)行確定，然后利用一個(gè)坐標(biāo)點(diǎn)建立2.5D圖像數(shù)據(jù)，即以此點(diǎn)為視角能夠觀察到的圖像數(shù)據(jù)，再將2.5D圖像數(shù)據(jù)進(jìn)行整合從而建立三維圖像。

2）雙目視覺系統(tǒng)

當(dāng)人體利用雙眼在不同角度、同一時(shí)間內(nèi)觀察同一個(gè)物體時(shí)，就可以利用算法來測量該物體和人體之間的距離，而這種方法也被稱為雙目立體感，其應(yīng)用的原理主要是人體視覺差所帶來的影響。同時(shí)利用兩臺(tái)攝像機(jī)對(duì)同一圖像從不同角度進(jìn)行觀察，就能夠獲得人體雙目觀察后的效果，因此這一三維重建技術(shù)也被稱為“雙目視覺系統(tǒng)”。兩臺(tái)不同的攝像機(jī)即可代表人體雙眼，其對(duì)圖像進(jìn)行逐幀捕獲，但由于角度不同和環(huán)境影響因素的差異，因此造成了圖像差異，必須對(duì)其捕捉的圖像進(jìn)行預(yù)處理。

3）三維重構(gòu)算法

在計(jì)算機(jī)視覺技術(shù)中對(duì)于視頻流的采集主要依靠的是彩色攝像機(jī)、紅外攝像機(jī)、紅外接收攝像頭等設(shè)備。還可以利用微軟所提供的Kinect設(shè)備，在進(jìn)行運(yùn)動(dòng)物體檢測前能夠?qū)UI進(jìn)行初始化處理，將系統(tǒng)內(nèi)函數(shù)的參數(shù)設(shè)定為用戶信息深度圖、彩圖、骨骼追蹤圖等數(shù)據(jù)。在使用Kinect設(shè)備對(duì)視頻流進(jìn)行打開時(shí)，其可以遵循三個(gè)步驟，其一是彩色和深度數(shù)據(jù)的處理；其二是根據(jù)數(shù)據(jù)的索引添加顏色信息，并將其引入到深度圖數(shù)據(jù)當(dāng)中；其三是骨骼追蹤數(shù)據(jù)。

5 結(jié)束語

計(jì)算機(jī)視覺捕捉技術(shù)是現(xiàn)代計(jì)算機(jī)應(yīng)用當(dāng)中較為先進(jìn)的內(nèi)容，其應(yīng)用范圍較廣，對(duì)于運(yùn)動(dòng)物體的捕捉準(zhǔn)確度較高，能夠有效推進(jìn)現(xiàn)代計(jì)算機(jī)模擬技術(shù)的發(fā)展。

參考文獻(xiàn)：

[1] 張?？?基于Opencv的人手識(shí)別與跟蹤定位技術(shù)研究與實(shí)現(xiàn)[D].昆明：云南大學(xué)，2013.

篇(2)

關(guān)鍵詞：計(jì)算機(jī)；視覺檢測技術(shù)；原理；應(yīng)用

中圖分類號(hào)：TP391.41

受到CIMS的推動(dòng)和影響，諸多企業(yè)的發(fā)展趨勢逐步趨向于個(gè)性化以及自動(dòng)化，這種大的發(fā)展趨勢間接的對(duì)我國的計(jì)算機(jī)輔助技術(shù)提出了更高的要求，計(jì)算機(jī)相關(guān)技術(shù)的發(fā)展面臨著更加嚴(yán)峻的挑戰(zhàn)。就現(xiàn)階段分析來看，計(jì)算機(jī)輔助檢測技術(shù)在現(xiàn)代諸多企業(yè)中得到了廣泛的應(yīng)用。隨著柔性制造系統(tǒng)的不斷進(jìn)步與發(fā)展，驅(qū)動(dòng)圖像處理軟件、現(xiàn)場總線技術(shù)的日趨成熟，檢測系統(tǒng)的靈敏性、智能化特點(diǎn)愈發(fā)受到人們的關(guān)注，在這種大的發(fā)展趨勢之下，計(jì)算機(jī)視覺檢測技術(shù)得到了較快的發(fā)展。基于計(jì)算機(jī)視覺系統(tǒng)現(xiàn)已經(jīng)廣泛應(yīng)用于現(xiàn)場監(jiān)控、工況監(jiān)視等諸多環(huán)境之中。

1 關(guān)于對(duì)視覺技術(shù)的相關(guān)研究

1.1 基于計(jì)算機(jī)的視覺檢測技術(shù)的原理分析和探究

圖像技術(shù)主要指的就是通過各種途徑所實(shí)現(xiàn)的對(duì)圖像的獲取以及進(jìn)一步的深入加工和處理技術(shù)。根據(jù)視覺檢測技術(shù)的抽象程度以及對(duì)圖像處理方式的不同，可以大致將圖像的處理和加工技術(shù)劃分為三個(gè)最主要的層次，這三個(gè)層次分別是圖像的加工處理、圖像的分析以及對(duì)于圖像的理解。將這三個(gè)層次進(jìn)行進(jìn)一步的結(jié)合，便是圖像工程。計(jì)算機(jī)視覺檢測技術(shù)是一門新興的計(jì)算機(jī)檢測技術(shù)，該技術(shù)建立在對(duì)計(jì)算機(jī)視覺研究的基礎(chǔ)之上，吸收和借鑒相關(guān)的研究成果，借助于傳感器來實(shí)施三維測量，進(jìn)而有效獲得被測物體的空間具置信息，故而可以很好的滿足當(dāng)代制造業(yè)的發(fā)展需求。區(qū)別于一般的圖像處理系統(tǒng)，計(jì)算機(jī)視覺檢測技術(shù)所獲取的相關(guān)數(shù)據(jù)信息更為精準(zhǔn)和迅速，其環(huán)境適應(yīng)性更強(qiáng)。

基于計(jì)算機(jī)的視覺檢測技術(shù)注重計(jì)算理論的輔導(dǎo)作用，以應(yīng)用為目標(biāo)進(jìn)行視覺技術(shù)分析。自上世紀(jì)七十年代以來，我國關(guān)于對(duì)計(jì)算機(jī)視覺檢測技術(shù)的研究又取得了顯著的進(jìn)步，并且逐步邁入更為實(shí)質(zhì)性的研究階段，在該階段中，逐步開始從通過從多個(gè)角度（諸如光學(xué)角度、生理學(xué)角度以及投影射影角度等等）對(duì)其成像問題加以分析。以Marr為代表的專家更是建立了一些一般性的視覺性處理模型來輔助該技術(shù)的研究。

1.2 視覺檢測技術(shù)中傳感器的作用

在計(jì)算機(jī)的控制下配有相關(guān)的視覺檢測系統(tǒng)，在該視覺檢測系統(tǒng)中，主要有三個(gè)主要方面的主要作用：第一，對(duì)于視覺傳感器模型的分析以及確定；第二，進(jìn)行圖像數(shù)據(jù)分散與整理的相關(guān)工作；第三，CAD模型的建立。傳感器的主要作用就是對(duì)測量棒材的多個(gè)截面進(jìn)行分析，將所收集得到的數(shù)據(jù)經(jīng)由圖像采集卡采集后，傳到相關(guān)的圖像處理系統(tǒng)中，進(jìn)而進(jìn)一步輔助準(zhǔn)確的模型的建立。

2 基于計(jì)算機(jī)的視覺檢測技術(shù)的應(yīng)用研究分析

2.1 基于計(jì)算機(jī)的視覺檢測技術(shù)的發(fā)展?fàn)顩r研究

在研究的初步階段，相關(guān)技術(shù)人員借助于數(shù)字化的圖像處理技術(shù)，主要就是為了進(jìn)一步提高所獲得的數(shù)字照片的清晰度和質(zhì)量要求，進(jìn)而更為精準(zhǔn)、科學(xué)、規(guī)范的對(duì)照片所提供的信息加以辨別，為航空衛(wèi)星圖片的讀取、識(shí)別和分類做準(zhǔn)備。在這一系列的視覺工作中，其中最為主要和常見的工作主要是包括分類、識(shí)別判讀以及三維結(jié)構(gòu)的構(gòu)建。

基于計(jì)算機(jī)的視覺檢測技術(shù)借助于對(duì)計(jì)算機(jī)視覺技術(shù)，將所獲得的被觀察物品的相關(guān)信息加以信號(hào)轉(zhuǎn)換，并傳遞給圖像處理系統(tǒng)，圖像處理系統(tǒng)通過甄別和判斷不同照片像素的分布和亮度等訊息，將其進(jìn)一步轉(zhuǎn)換成為數(shù)字化信號(hào)，接下來由計(jì)算機(jī)的圖像系統(tǒng)抽出符合目標(biāo)特征的信號(hào)加以運(yùn)算，對(duì)下一步的設(shè)備動(dòng)作加以決定和執(zhí)行。

就現(xiàn)階段而言，我國的計(jì)算機(jī)視覺檢測技術(shù)系統(tǒng)在諸多領(lǐng)域均有所應(yīng)用，最為典型的領(lǐng)域諸如醫(yī)學(xué)的輔助診斷、機(jī)器人的感應(yīng)系統(tǒng)、智能化的人機(jī)接口等均是建立在該技術(shù)的基礎(chǔ)之上。借助于計(jì)算機(jī)視覺技術(shù)這一手段，可以有效提高對(duì)產(chǎn)品檢測的效率，提高精準(zhǔn)度，這種新型的視覺檢測技術(shù)相比較于傳統(tǒng)的人眼在流水線上的跟進(jìn)，其具有顯著的優(yōu)越性，其獲取測量結(jié)構(gòu)迅速、檢測結(jié)果可以直接被觀察、可以進(jìn)行自動(dòng)識(shí)別以及定位準(zhǔn)確和實(shí)時(shí)性的特點(diǎn)，這就很好的避免了由于人的一些主觀性因素所導(dǎo)致的誤差出現(xiàn)。

二十世紀(jì)以來，基于生物特性的計(jì)算機(jī)視覺檢測技術(shù)得到了空前的發(fā)展，具體表現(xiàn)在人臉識(shí)別、生硬識(shí)別、指紋識(shí)別以及虹膜的識(shí)別中，形式日趨靈活和復(fù)雜多變。借助于計(jì)算機(jī)的視覺檢測技術(shù)，可以有效對(duì)用戶的身份進(jìn)行鑒定和識(shí)別、判定用戶的特殊信息等。除此之外，還可以將基于計(jì)算機(jī)的視覺識(shí)別技術(shù)逐步推廣到其他領(lǐng)域，如海關(guān)的安全檢查以及出口、入口的安全控制等領(lǐng)域。

2.2 基于計(jì)算機(jī)的視覺檢測技術(shù)的相關(guān)應(yīng)用分析

2.2.1 數(shù)碼相機(jī)中所采用的圖像采集技術(shù)

視覺檢測技術(shù)的一個(gè)顯著特點(diǎn)就是有效提高了生產(chǎn)的柔性和自動(dòng)化程度，本世紀(jì)以來，數(shù)碼相機(jī)憑借其高分辨率，快速成像、顯像，功能豐富多變以及性價(jià)比較高的特定風(fēng)靡全球，逐步取代了傳統(tǒng)的照相機(jī)，傳統(tǒng)的照相機(jī)主要采用的是CCD 攝像頭，其主要的核心及時(shí)采集卡，顯然這種采集系統(tǒng)已經(jīng)逐步落后于時(shí)展的腳步，現(xiàn)已逐步被淘汰。

2.2.2 微文字識(shí)別系統(tǒng)的相關(guān)研發(fā)和設(shè)計(jì)

隨著科學(xué)技術(shù)的不斷進(jìn)步與發(fā)展，大規(guī)模集成電路得到了較快的進(jìn)步，基于計(jì)算機(jī)的視覺檢測系統(tǒng)的成本得到了極大的降低，基于計(jì)算機(jī)視覺檢測技術(shù)的微文字識(shí)別系統(tǒng)的研發(fā)也被提到了日程中來。微文字識(shí)別系統(tǒng)的處理芯片大多是借助于數(shù)字信號(hào)處理芯片來實(shí)現(xiàn)圖像的識(shí)別，進(jìn)而借助先進(jìn)的語音合成技術(shù)將朗讀變?yōu)榭赡?。此外，為了便于使用，該系統(tǒng)的體積被盡可能的縮小，并且可根據(jù)美觀度和實(shí)用性等設(shè)計(jì)為各種形狀。

2.2.3 特殊用紙水印在線檢測系統(tǒng)

基于計(jì)算機(jī)的視覺檢測技術(shù)可以在某一特定領(lǐng)域代替人的主觀判斷，諸如水印質(zhì)量的自動(dòng)檢測方面。區(qū)別于普通的工作人員，計(jì)算機(jī)可以實(shí)現(xiàn)長時(shí)間工作，對(duì)于誤差范圍的控制可以通過設(shè)置等實(shí)現(xiàn)，而且在計(jì)算機(jī)執(zhí)行任務(wù)期間，所受到的客觀和主觀因素相對(duì)較少，這就極大程度上避免了由于人的因素所導(dǎo)致的失誤性操作，進(jìn)而有效提高了工作效率以及檢測的精準(zhǔn)度。這一優(yōu)點(diǎn)，在水印質(zhì)量標(biāo)準(zhǔn)的認(rèn)定中具有十分重要的意義和作用，通過研發(fā)一定的程序和軟件，可以制定出一套操作性強(qiáng)、權(quán)威性較高的水印清晰度量化標(biāo)準(zhǔn)。

3 基于計(jì)算機(jī)的視覺檢測技術(shù)的發(fā)展展望

綜合分析來看，計(jì)算機(jī)視覺檢測技術(shù)現(xiàn)已有大約四十年的歷史，作為一種新興的檢測技術(shù)，該技術(shù)的顯著優(yōu)越性不言而喻，該檢測技術(shù)以其高精度、反應(yīng)靈敏迅速、智能化、自動(dòng)化等特點(diǎn)被廣泛應(yīng)用于諸多領(lǐng)域和行業(yè)之中，并取得了顯著的成，可以說，該技術(shù)具有十分廣闊的發(fā)展前景。但是，不可否認(rèn)，基于計(jì)算機(jī)的視覺檢測技術(shù)并不是十分的成熟，在其設(shè)計(jì)和研發(fā)過程中仍然存在著諸多不足，而且視覺檢測技術(shù)是一項(xiàng)設(shè)計(jì)到心理、生理等多方面知識(shí)的復(fù)雜性技術(shù)，涉及領(lǐng)域眾多，更強(qiáng)大功能的實(shí)現(xiàn)需要人類知識(shí)的不斷拓展和延伸，因此，必須意識(shí)到該檢測技術(shù)發(fā)展道路上的困難和挑戰(zhàn)。

4 結(jié)束語

隨著科學(xué)技術(shù)的不斷進(jìn)步與發(fā)展，經(jīng)濟(jì)的發(fā)展對(duì)于新技術(shù)的研發(fā)提出了更高的挑戰(zhàn)，再者由于廣大人民群眾生活質(zhì)量的不斷提高，對(duì)于生活水平也有了進(jìn)一步的認(rèn)識(shí)和了解?；谟?jì)算機(jī)的視覺檢測技術(shù)的研發(fā)和進(jìn)步，無疑更好推動(dòng)了高速發(fā)展的經(jīng)濟(jì)，不斷滿足了人民群眾日益提高生活需求。由此來看，深入對(duì)視覺檢測技術(shù)的研究和探究無疑具有十分重要的作用，筆者衷心希望，以上關(guān)于對(duì)我國基于計(jì)算機(jī)的視覺檢測技術(shù)的相關(guān)探究能夠被相關(guān)負(fù)責(zé)人合理的吸收和采納，進(jìn)而更好的推動(dòng)科學(xué)技術(shù)的創(chuàng)新和進(jìn)步，推動(dòng)經(jīng)濟(jì)的不斷進(jìn)步與發(fā)展。

參考文獻(xiàn)：

[1]李旭港.計(jì)算機(jī)視覺及其發(fā)展與應(yīng)用[J].中國科技縱橫，2010（06）：42.

[2]張江明，張娟.淺談制造業(yè)中計(jì)算機(jī)視覺檢測技術(shù)的應(yīng)用與發(fā)展[J].科技創(chuàng)新導(dǎo)報(bào)，2011（24）：1.

篇(3)

關(guān)鍵詞：計(jì)算機(jī)視覺；智能交通；監(jiān)控系統(tǒng)

中圖分類號(hào)：TP277

近些年來，隨著我國人民生活水平提高，使私家車輛的數(shù)目急劇增長，并且車輛的增長速度遠(yuǎn)遠(yuǎn)超出市政建設(shè)的力度。這樣的事實(shí)導(dǎo)致城市交通擁堵、違規(guī)通車、車禍增加，所以迫切的要求加快市政建設(shè)，實(shí)施高效率的交通監(jiān)控措施，基于計(jì)算機(jī)視覺的智能交通監(jiān)控系統(tǒng)也由此得到了相應(yīng)的廣泛的發(fā)展和應(yīng)用。那么，計(jì)算機(jī)視覺技術(shù)下的智能交通監(jiān)管系統(tǒng)究竟應(yīng)該如何設(shè)計(jì)與實(shí)現(xiàn)呢？

1 計(jì)算機(jī)視覺下的智能交通監(jiān)控系統(tǒng)

1.1 計(jì)算機(jī)視覺技術(shù)

計(jì)算機(jī)視覺技術(shù)即利用各種圖像攝錄設(shè)備將通過對(duì)視覺目標(biāo)進(jìn)行識(shí)別、跟蹤、測量并將由此獲取的視覺信息傳輸至計(jì)算機(jī)并進(jìn)而利用圖像技術(shù)進(jìn)行視覺信息處理以達(dá)到進(jìn)一步進(jìn)行智能化處理的視覺處理技術(shù)。

1.2 智能交通系統(tǒng)（ITS）

智能交通系統(tǒng)（ITS）是指通過現(xiàn)代化的網(wǎng)絡(luò)信息技術(shù)、自動(dòng)控制技術(shù)等有效綜合手段在一定范圍內(nèi)建立的全方位發(fā)揮作用的交通運(yùn)輸綜合管理和控制系統(tǒng)。作為交通運(yùn)輸管理體系的一場新的革命，近年來，由此技術(shù)進(jìn)一步開發(fā)形成的監(jiān)控系統(tǒng)已經(jīng)在各個(gè)道路的關(guān)鍵路口、路段和其他交通繁忙地域普遍建立，為交通運(yùn)輸管理提供了自動(dòng)化、智能化的信息收集和處理等多方面的服務(wù)。但是，隨著城市建設(shè)的迅猛發(fā)展和人流、車流量的猛增，更加智能化的交通管理系統(tǒng)的開發(fā)和利用顯然也成為了當(dāng)務(wù)之急。

2 計(jì)算機(jī)視覺下的智能交通監(jiān)管系統(tǒng)的建立

正是基于新的發(fā)展需要，我們有必要把計(jì)算機(jī)視覺和智能交通監(jiān)控系統(tǒng)進(jìn)一步結(jié)合起來，首先通過計(jì)算機(jī)視覺分別對(duì)各個(gè)道路的關(guān)鍵路口、路段和其他交通繁忙地域等相應(yīng)位置實(shí)時(shí)進(jìn)行交通信息采集，然后，通過信息傳輸系統(tǒng)、或者進(jìn)行處理后存入服務(wù)器并將處理過的實(shí)時(shí)交通信息及時(shí)傳輸?shù)奖O(jiān)控指揮系統(tǒng)，以實(shí)現(xiàn)對(duì)于各個(gè)道路的關(guān)鍵路口、路段和其他交通繁忙地域的實(shí)時(shí)監(jiān)控和管理。由此，顯然就需要設(shè)計(jì)以下各個(gè)子系統(tǒng)并共同構(gòu)建為一個(gè)完整的體系。

計(jì)算機(jī)視覺下的智能交通監(jiān)管系統(tǒng)

實(shí)時(shí)交通信息收集系統(tǒng)

監(jiān)控指揮系統(tǒng)

高質(zhì)量信息存儲(chǔ)傳輸系統(tǒng)

圖1 計(jì)算機(jī)視覺下的智能交通監(jiān)管系統(tǒng)工作程序示意圖

3 智能交通監(jiān)控系統(tǒng)的實(shí)現(xiàn)

計(jì)算機(jī)視覺下的智能交通監(jiān)管系統(tǒng)實(shí)現(xiàn)的第一步是通過實(shí)時(shí)交通信息收集系統(tǒng)實(shí)時(shí)進(jìn)行交通信息采集，即通過對(duì)于運(yùn)動(dòng)物體的分割，在圖像找出有意義的部分，抽出運(yùn)動(dòng)目標(biāo)的特征，進(jìn)而通過連續(xù)畫面間的變化判斷目標(biāo)的運(yùn)動(dòng)狀況。在這一系統(tǒng)運(yùn)行中，首先可以“攝像頭讀入”的初始視頻，使用相應(yīng)的算法提取“背景”，然后通過原圖與背景運(yùn)算形成相應(yīng)的“前景”，由此即可進(jìn)一步通過矩形框的使用來達(dá)到“運(yùn)動(dòng)目標(biāo)檢測”與信息采錄的目的。

圖2 視覺監(jiān)控系統(tǒng)原理圖

3.1 系統(tǒng)功能實(shí)現(xiàn)

對(duì)運(yùn)動(dòng)物體的檢測主要有光流法以及差分法兩種方法，由于光流法比較復(fù)雜和耗時(shí)，實(shí)時(shí)檢測很難實(shí)現(xiàn)，因而，現(xiàn)有實(shí)時(shí)交通信息收集系統(tǒng)一般通過差分法的應(yīng)用來進(jìn)行開發(fā)和實(shí)現(xiàn)。

3.1.1 幀間差分法

幀間差分法對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行分割處理過程中使用較多也最為簡單實(shí)用的一種方法，其基本原理就是通過在連續(xù)的圖像序列中兩個(gè)或三個(gè)相鄰幀間采用基于像素的幀間差分并且閾值化來提取圖像的運(yùn)動(dòng)區(qū)域，進(jìn)而通過逐象素比較獲取前后兩幀圖像之間的差別來判斷運(yùn)動(dòng)物體的移動(dòng)狀況。在實(shí)際操作中，一般可以假設(shè)用于獲取序列圖像的視頻設(shè)備為靜止物體，設(shè)視頻中連續(xù)兩幀的圖像為It（x，y）和It+1（x，y），然后通過對(duì)連續(xù)兩幀的圖像相應(yīng)的像素進(jìn)行比較，利用Dt（x，y）=It+1 （x，y）-It（x，y）這一方程求出相應(yīng)的閾值來檢測出運(yùn)動(dòng)物體的移動(dòng)狀況：

Mt（x，y）=

當(dāng)然，必須注意的是，由于幀間差分法所得到的差分圖像在現(xiàn)實(shí)中并非由理想封閉的輪廓區(qū)域組成的，因而，運(yùn)動(dòng)目標(biāo)的輪廓自然也就往往是局部的、不連續(xù)的，且其誤差往往隨著運(yùn)動(dòng)物體速度的增大而增大，因而，這一方法并不適于對(duì)于高速運(yùn)動(dòng)目標(biāo)的有效檢測。

3.1.2 背景差分法

與幀間差分法不同，背景差分法則是利用當(dāng)前圖像與背景圖像的差分來檢測物體運(yùn)動(dòng)狀況一種方法。其基本原理是在可控制環(huán)境下，通過對(duì)于運(yùn)動(dòng)背景的固定假設(shè)，設(shè)待檢測運(yùn)動(dòng)物體的圖像為I（x，y），背景圖像為B（x，y），通過輸入圖像與背景模型進(jìn)行比較，利用D（x，y）=I（x，y）-B（x，y）這一方程求得到圖像中的各像素的變化信息，進(jìn)而檢測運(yùn)動(dòng)物體的移動(dòng)狀況：

Mt（x，y）=

當(dāng)然，在實(shí)際運(yùn)用中，背景差分法的關(guān)鍵，是要建立一個(gè)背景模型，并更新模型。

3.2 程序功能的實(shí)現(xiàn)

本程序功能實(shí)現(xiàn)所主要使用的是OpenCV函數(shù)。OpenCV能夠?qū)崿F(xiàn)對(duì)圖像數(shù)據(jù)的操作，包括分配、釋放、復(fù)制、設(shè)置和轉(zhuǎn)換數(shù)據(jù)，以及對(duì)攝像頭的定標(biāo)、對(duì)運(yùn)動(dòng)的分析等。在函數(shù)實(shí)現(xiàn)上，用到了Cv圖像處理的連接部件函數(shù)，運(yùn)動(dòng)分析與對(duì)象跟蹤中的背景統(tǒng)計(jì)量的累積相關(guān)函數(shù)等相關(guān)的函數(shù)。本系統(tǒng)就是運(yùn)用圖3介紹使用到的函數(shù)名及其功能和使用格式等來實(shí)現(xiàn)對(duì)視頻流的運(yùn)動(dòng)車輛的輪廓檢測的。

圖3 尋找輪廓程序主要算法流程

實(shí)驗(yàn)證明，本系統(tǒng)能夠較好地實(shí)現(xiàn)對(duì)視頻流的運(yùn)動(dòng)目標(biāo)的輪廓檢測和對(duì)象跟蹤，并能實(shí)時(shí)更新背景，車輛跟蹤正確率在95%以上，雖然存在著輪廓檢測正確率稍差的缺點(diǎn)，但其主要原因是由于攝像頭所處的角度和運(yùn)動(dòng)目標(biāo)靠近程度的影響，從根本上并不影響對(duì)于運(yùn)動(dòng)目標(biāo)的實(shí)際檢測。

4 結(jié)束語

加快城鎮(zhèn)化進(jìn)程是我國發(fā)展的大趨勢，在這一趨勢下，城市病的治理當(dāng)然可以離不開現(xiàn)代化的科學(xué)技術(shù)。但是，必須注意的是，無論多么先進(jìn)的管理系統(tǒng)，最終都只有通過人的行為才能夠發(fā)揮有效的作用，在這個(gè)意義上，設(shè)計(jì)與使用先進(jìn)的交通監(jiān)控系統(tǒng)固然是解決交通問題的技術(shù)條件，但是，交通問題的解決，最終還必須依賴于人的素質(zhì)的全面提高。

參考文獻(xiàn)：

[1]戴俊喬.城市道路交通視頻監(jiān)控系統(tǒng)架構(gòu)和性能的研究[J].科技與創(chuàng)新，2014（06）.

[2]張偉龍，李剛，王雨翔.基于計(jì)算機(jī)視覺的智能交通監(jiān)控系統(tǒng)[J].小型微型計(jì)算機(jī)系統(tǒng)，2014（07）.

[3]龐其富.淺談城市軌道交通視頻監(jiān)控系統(tǒng)設(shè)計(jì)方案[J].通訊世界，2014（01）.

篇(4)

提起數(shù)字媒體，人們通常會(huì)想到傳媒行業(yè)，其實(shí)數(shù)字媒體的應(yīng)用絕不局限于傳媒。隨著寬帶網(wǎng)絡(luò)的普及，人們在日常業(yè)務(wù)處理過程中，正面對(duì)越來越豐富的網(wǎng)上媒體和內(nèi)容，包括各種視頻、音頻、文本、圖像等。下面，就讓我們跟著諸位數(shù)字媒體方面的專家一起來分享這個(gè)繽紛的世界。

三維幾何建模與形狀表示

北京大學(xué)視覺與聽覺信息處理國家重點(diǎn)實(shí)驗(yàn)室主任教育部長江學(xué)者獎(jiǎng)勵(lì)計(jì)劃特聘教授查紅彬

精彩問答

在背景比較復(fù)雜、有干擾的情況下模型檢索的效果怎么樣？

在模型檢索的時(shí)候并沒有考慮背景，因?yàn)檫@是做模型檢索比較容易的部分。模型檢索一般是沒有背景的，但也可以做，但是要推廣到背景比較復(fù)雜的物體上識(shí)別可能有很大的問題，因?yàn)檫@時(shí)候匹配不僅僅是局部匹配，而是兩個(gè)子集和子集的匹配問題，到目前為止，我們只是做沒有背景的模型檢索。

為什么要重新談?wù)撊S形狀表示問題？在多媒體信息處理領(lǐng)域里面，有兩個(gè)比較重要的方向，這也是計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域里兩個(gè)重要的方向，一個(gè)是計(jì)算機(jī)視覺，一個(gè)是計(jì)算機(jī)圖形學(xué)。計(jì)算機(jī)視覺是從圖像中通過識(shí)別或重建處理，得到一個(gè)對(duì)對(duì)象物的描述。反過來說圖形學(xué)，是對(duì)一個(gè)對(duì)象和場景的描述，通過繪制和動(dòng)畫生成圖像和視頻。它們從處理過程來說是逆過程，這兩個(gè)領(lǐng)域之間有密切的關(guān)聯(lián)。

我們現(xiàn)在考慮計(jì)算機(jī)三維建?；蚰Ｐ偷拿枋?，考慮的不僅僅是計(jì)算機(jī)視覺或計(jì)算機(jī)圖形學(xué)所包含的內(nèi)容。這里面簡單列舉一下，比如基于模型的三維物體識(shí)別和場景識(shí)別，這兩個(gè)應(yīng)該是典型的計(jì)算機(jī)視覺里面考慮的應(yīng)用。除了這以外還可以用模型干別的事情，比如繪制，還包括基于這樣模型的設(shè)計(jì)、變形、動(dòng)畫等等。除了兩個(gè)單獨(dú)研究的應(yīng)用之外，還要想怎么把兩者結(jié)合起來，把虛擬和真實(shí)的東西無縫連接到一起，這些都牽涉到三維模型。

我們考慮的三維模型跟以前相比，應(yīng)用領(lǐng)域大了很多，要達(dá)到這個(gè)要求，對(duì)模型的表達(dá)、形狀的表達(dá)也都有了更高的要求。

怎樣找到一些更新更有效地表達(dá)形式來符合這些要求呢？這里有四個(gè)方面，現(xiàn)在能不能建立一個(gè)形狀空間，把考慮的對(duì)象完整地在形狀空間里面表達(dá)出來。第二點(diǎn)就是針對(duì)形狀的特性，表達(dá)要具有柔性，對(duì)象物的表面不都是連續(xù)的，也有一些非連續(xù)性和不規(guī)律性，這些特性怎樣能夠進(jìn)行柔性處理。第三個(gè)是需要一些描述是局部性的，另外一些要求描述是整體性的，這兩者之間如何有一個(gè)很好的結(jié)合方法。第四是在大量的計(jì)算當(dāng)中，包括變形和動(dòng)畫中有很多編輯的工具，所以我們要求對(duì)現(xiàn)在的形狀表達(dá)有一些比較高的要求。

在計(jì)算機(jī)視覺里面有一個(gè)老大難就是識(shí)別，已有模型，但是眼前看到的是一部分三維數(shù)據(jù)，怎么用這部分?jǐn)?shù)據(jù)和模型數(shù)據(jù)匹配來識(shí)別它呢？這就牽涉到局部匹配，我們要解決局部匹配需要什么描述？我們要有一個(gè)模型，從大量的數(shù)據(jù)中建立一個(gè)模型庫，并從中抽取很多特征，把這些特征進(jìn)行組織。這里面牽涉三個(gè)比較大的問題，第一個(gè)是形狀空間怎么構(gòu)造，沒有很好的特征表達(dá)或整理的形式，后面的匹配以及其他的工作就很難做。第二個(gè)是怎么定義基于這種特征的相似度。第三個(gè)是怎樣在形狀空間當(dāng)中搜索到最優(yōu)的匹配。

針對(duì)這些問題我們最近一兩年做了一些工作，最近提出一個(gè)廣義形狀分布(Generalized Shape Distributions)描述方式，主要目的有兩點(diǎn)，能不能在三維形狀表示過程當(dāng)中，找到一些最關(guān)鍵的描述指令，并從中找到相互關(guān)系，把整體和局部結(jié)合起來。如果把之間的關(guān)系描述出來，就能把局部結(jié)構(gòu)性的信息用整體觀點(diǎn)加進(jìn)去，這兩件工作就是我們做這件事情的主要目的。

在形狀描述問題上，我們還有很多工作要做，除了局部、整體描述之外，我們要想辦法把他們結(jié)合到一起。今后幾年要用更多的模式識(shí)別的辦法，來解決面臨的圖形學(xué)或虛擬現(xiàn)實(shí)和計(jì)算機(jī)視覺當(dāng)中的很多問題。

生活中的計(jì)算機(jī)視覺

香港中文大學(xué)信息工程系終身教授

微軟亞洲研究院視覺計(jì)算組負(fù)責(zé)人湯曉歐

精彩問答

微軟亞洲研究院視覺計(jì)算組在原創(chuàng)思想這一塊，引領(lǐng)下一個(gè)方向有沒有什么考慮，您談到很多對(duì)人們?nèi)粘Ｉ钣绊懞艽蟮膽?yīng)用，但是在背后的更深層的考慮，更新的創(chuàng)意在哪里呢？

我們的研究者都很年輕，我本人也才工作七年的時(shí)間，很多的算法已經(jīng)發(fā)展這么多年了，所以在開始的時(shí)候比較容易想出來的方法，現(xiàn)在已經(jīng)很難有那么多的原創(chuàng)內(nèi)容。我們的工作是去找一些非常原創(chuàng)的內(nèi)容，有的是理論上的，有的是新的發(fā)明，這可以有很大的影響。

圖像通過閃光燈的分割，前景和背景深度差會(huì)不會(huì)影響分割效果，距離會(huì)不會(huì)影響分割效果呢？

我們這個(gè)通過閃光燈對(duì)圖像進(jìn)行分割的技術(shù)，會(huì)一定程度上受到光的強(qiáng)度和距離的影響。

我們主要的研究領(lǐng)域包括計(jì)算機(jī)視覺、模式識(shí)別、圖像處理和視頻處理。下面就為大家介紹幾個(gè)比較典型的應(yīng)用。

如何將圖片的前景和后景分離？我們現(xiàn)在照兩張圖片，一張打閃光燈，一張沒有打閃光燈，這樣拍出來的照片背景沒有變化，但前景變化很厲害。在開閃光燈的情況下拍的照片，前景和后景可以利用一些技術(shù)很容易地分開來。

把一個(gè)圖片的前景切割出來放入另一張圖后，那剩下的圖片缺一塊的怎么辦呢？如何修復(fù)剩下的圖片呢？在例舉的圖片上，大家可以看到不同的區(qū)域，我們可以由一個(gè)算法，從其他的地方借過來，再貼上去，經(jīng)過這樣的處理后，圖像基本上和原來沒有太大的區(qū)別。

如此的修修補(bǔ)補(bǔ)又有什么用呢？比如說，你對(duì)這張圖像不是很滿意，你可以把圖片上不喜歡的部分劃出來，然后利用一些技術(shù)將劃出來的空白部分填上。更有用的地方在于，你照了不想被別人看到的照片后，除了刪除，你多了一個(gè)選擇。你可以把不想讓別人看到的照片部分去掉，并利用一些算法把空白的地方填補(bǔ)上，而且讓別人看不出來。

現(xiàn)在大家的電腦上都會(huì)有很多照片，怎么快速地瀏覽這些照片呢？我們可以把這些圖像都放在一個(gè)屏幕上，可屏幕畢竟有限，怎么才能把照片放得更多一些呢？我們現(xiàn)在做的是可以隨機(jī)把照片放到桌面上，但是電腦會(huì)對(duì)每張照片上的重要信息進(jìn)行篩選，在放盡可能多的照片的同時(shí)，讓每張照片上最重要的信息不被遮掩，而且均勻地分布在桌面上。這樣大家看起來就更清楚了。這個(gè)算法就是怎么讓所有圖像均勻分布，同時(shí)把所有背景都要蓋上。我們可以對(duì)圖像進(jìn)行各種處理，同時(shí)我們也可以利用一些技術(shù)知道別人有沒有處理圖像，對(duì)圖像有沒有做過手腳。

現(xiàn)在我們來說說視頻方面。比如說抖動(dòng)很厲害的圖像，怎么把物體移到中間？一個(gè)辦法是把除移動(dòng)圖像外的公共部分切出來，但是移動(dòng)越大，公共部分就會(huì)越來越小，更好的辦法是用一些技術(shù)把空處填上。

現(xiàn)在MSN的功能已經(jīng)越來越豐富。比如說一段電影，你看到一件比較中意的衣服，只要你把鼠標(biāo)移動(dòng)衣服的覆蓋范圍，你就能很清楚地知道這件衣服的品牌及價(jià)格。如果你把鼠標(biāo)在那件衣服上輕點(diǎn)，電腦就會(huì)直接跳轉(zhuǎn)到這個(gè)衣服的相關(guān)網(wǎng)站。

你在視頻聊天的時(shí)候如果不想讓對(duì)方看到你所處的環(huán)境，你就可以很輕松地把背景模糊掉。如果大家對(duì)自己的長相不是那么有信心，我們可以幫你改變一下你的長相。為自己添一幅酷酷的墨鏡，換上一個(gè)性感的大嘴巴，這些都能輕而易舉地完成。

多媒體傳感器網(wǎng)絡(luò)

北京郵電大學(xué)教授、博士生導(dǎo)師

智能通信軟件與多媒體北京市重點(diǎn)實(shí)驗(yàn)室主任馬華東

傳感器研究是IT非常熱門的話題，首先我為大家介紹一下多媒體傳感器網(wǎng)絡(luò)的基本概念。從早期的巨型機(jī)到今天的小型機(jī)，生物芯片尺寸越來越小，但是效率越來越高；網(wǎng)絡(luò)設(shè)備聯(lián)網(wǎng)和數(shù)據(jù)交換的需求越來越大，設(shè)備之間的傳輸量也越來越大；從信息處理的角度來看，內(nèi)容逐漸占據(jù)了主導(dǎo)地位，由數(shù)據(jù)為中心轉(zhuǎn)到以內(nèi)容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。

傳感器網(wǎng)絡(luò)是一組傳感器節(jié)點(diǎn)，由組織方式協(xié)作地感知采集和處理感知對(duì)象的信息，它的基本特點(diǎn)是造價(jià)低、能量敏感、通信能力有限、計(jì)算能力弱、動(dòng)態(tài)變化?，F(xiàn)在的需求是要求通信能力越來越強(qiáng)，計(jì)算能力應(yīng)付節(jié)點(diǎn)的處理的要求。

右圖是目前主流的傳感器節(jié)點(diǎn)的配置，從配置來講還是比較低的，現(xiàn)在信息處理側(cè)重壓力、溫度、光、震動(dòng)等簡單的數(shù)據(jù)或者是標(biāo)量數(shù)據(jù)。人類獲取信息80%是視覺信息，10%左右是聽覺信息，也就是說90%左右的信息是多媒體信息。傳感器網(wǎng)絡(luò)就是對(duì)音頻、視頻信息獲取后提供給使用者，使其對(duì)環(huán)境信息有一個(gè)全方位的了解，對(duì)傳感器網(wǎng)絡(luò)的應(yīng)用是非常廣泛的。

從網(wǎng)絡(luò)的結(jié)構(gòu)來講，基本結(jié)構(gòu)和原來傳感器網(wǎng)絡(luò)差別不是很大，這里面強(qiáng)調(diào)增加音頻、視頻獲取處理，網(wǎng)絡(luò)傳輸整個(gè)過程的各個(gè)環(huán)節(jié)，同時(shí)這里面最好可以交互。有了這個(gè)概念以后，深入分析一下主要特點(diǎn)，首先是網(wǎng)絡(luò)能力的增強(qiáng)，這樣一個(gè)傳感器網(wǎng)絡(luò)應(yīng)該集信息的采集、處理傳輸、轉(zhuǎn)發(fā)、能量供應(yīng)等方面，除了傳統(tǒng)的標(biāo)量數(shù)據(jù)，音頻、視頻的圖像數(shù)據(jù)，都可以進(jìn)行采集處理。

現(xiàn)在多媒體傳感器網(wǎng)絡(luò)目前有哪些問題呢？從需求來看，現(xiàn)在網(wǎng)絡(luò)是異構(gòu)的信息，媒體信息的格式，種類很多，并且差異非常大，數(shù)據(jù)量比較大，特別是音頻、視頻信息，格式比較復(fù)雜。這些信息傳輸過程中需要高速實(shí)時(shí)地傳輸，對(duì)網(wǎng)絡(luò)傳輸速率也提出了比較高的要求。媒體信息的安全問題，也是網(wǎng)絡(luò)需要考慮的，還有服務(wù)質(zhì)量的問題。針對(duì)這些需求，我們可以看到，通信資源和計(jì)算資源這兩者之間存在非常大的矛盾，或者非常大的鴻溝，如何解決這兩者之間的差距就是我們研究的問題所在。

最后談一下多媒體傳感器網(wǎng)絡(luò)研究的挑戰(zhàn)，首先是節(jié)點(diǎn)的芯片設(shè)計(jì)，這是基礎(chǔ)，這里面需要采用多種技術(shù)，包括軟硬件協(xié)同設(shè)計(jì)的技術(shù)，各種技術(shù)結(jié)合，降低成本、能耗、體積、提高運(yùn)算速度和可靠性。第二是三維場景的覆蓋問題，方向性傳感模型是一個(gè)簡單的二維圖形，實(shí)際上是三維圖形監(jiān)測，這是一個(gè)三維場景方向的問題，研究這個(gè)就復(fù)雜多了。還有一個(gè)問題是服務(wù)質(zhì)量保證問題，在新的網(wǎng)絡(luò)當(dāng)中服務(wù)質(zhì)量體系是什么樣，也是研究的方向。再一個(gè)是信息處理，為了使網(wǎng)絡(luò)傳輸數(shù)據(jù)量比較快，能不能在節(jié)點(diǎn)做信息處理的計(jì)算。當(dāng)然信息的安全也比較重要，用這些節(jié)點(diǎn)獲取多媒體信息怎么保證安全的質(zhì)量，使應(yīng)該看到的人看到這些信息，不應(yīng)該看到的人看不到這些信息。

在多媒體傳感器網(wǎng)絡(luò)中，我們還是做了一些工作，和一些同行學(xué)者也有一些交流，這里面也有一些質(zhì)疑，說多媒體傳感網(wǎng)絡(luò)和原來傳感器網(wǎng)絡(luò)設(shè)計(jì)初衷是不是吻合的，原來沒有想讓它處理這么多信息，原來體積比較小，加上這些信息以后，無疑使它的體積增大，這里面和初衷之間是不是有矛盾，傳感器網(wǎng)絡(luò)研究有沒有必要性，如果有必要性可行不可行，這都是我們目前研究的問題。

篇(5)

1視覺跟蹤算法

1.1KCF算法

KCF（KernelCorrelationFilter)核相關(guān)濾波算法通過目標(biāo)樣本去訓(xùn)練判別分類器，訓(xùn)練判別分類器分析當(dāng)前跟蹤的目標(biāo)是被跟蹤目標(biāo)周圍的背景信息還是被跟蹤目標(biāo)，如圖1所示。KCF通過嶺回歸分類器的學(xué)習(xí)來完成對(duì)目標(biāo)的跟蹤，通過快速傅里葉變化實(shí)現(xiàn)算法的加速運(yùn)算。KCF跟蹤算法在訓(xùn)練階段，利用循環(huán)矩陣?yán)碚?，?duì)視頻目標(biāo)區(qū)域進(jìn)行稠密采樣，獲取正負(fù)樣本，提取方向梯度直方圖（HOG)特征，通過嶺回歸分類器分析所以樣本進(jìn)行訓(xùn)練。在檢測階段，以視頻前一幀目標(biāo)位置為中心進(jìn)行稠密采樣，將得到的所有樣本輸入到嶺回歸分類器，經(jīng)過嶺回歸分類器的分類，得到目標(biāo)的位置。

1.2TLD算法

TLD（Tracking-Learning-Detection）目標(biāo)跟蹤算法由跟蹤模塊(Tracking）、檢測模塊(Detection)、學(xué)習(xí)模塊(Learning)三部分組成，如圖2所示。該算法首先由跟蹤模塊的作用是將被跟蹤目標(biāo)的運(yùn)動(dòng)軌道處理成軌道碎片提供給學(xué)習(xí)模塊進(jìn)行學(xué)習(xí)，學(xué)習(xí)模塊根據(jù)跟蹤模塊的處理結(jié)果進(jìn)行學(xué)習(xí)并對(duì)檢測模塊的錯(cuò)誤進(jìn)行分析，通過學(xué)習(xí)處理后生成訓(xùn)練樣本，檢測模塊在接收到訓(xùn)練樣本后對(duì)相關(guān)參數(shù)和目標(biāo)模型進(jìn)行跟新并對(duì)跟蹤模塊重新初始化，其中跟蹤模塊為中值流跟蹤器，學(xué)習(xí)模塊為P-N目標(biāo)模型學(xué)習(xí)。

1.3視覺跟蹤算法改進(jìn)

KCF跟蹤算法的運(yùn)行速度方面和在目標(biāo)環(huán)境變化不大的情況下跟蹤速度表現(xiàn)優(yōu)異，但其在被跟蹤目標(biāo)出現(xiàn)遮擋、形變、跟丟后無法找回目標(biāo)，反觀TLD解決了被跟蹤目標(biāo)被遮擋、目標(biāo)跟丟無法重新找回的情況，因此將兩個(gè)算法互相融合，取長補(bǔ)短能提高算法的運(yùn)算速度和追蹤效果。融合方法：利用KCF克服TLD的中值流跟蹤器的缺點(diǎn)，將KCF替換TLD的中值流跟蹤器，能夠加快TLD的目標(biāo)跟蹤速度。當(dāng)被跟蹤目標(biāo)在當(dāng)前圖像幀中消失后，KCF會(huì)把盲目地在背景中尋找被跟蹤目標(biāo)，當(dāng)被跟蹤重新出現(xiàn)時(shí)，KCF算法依然在背景中尋找被跟蹤目標(biāo)，導(dǎo)致跟蹤失敗，為了避免這個(gè)錯(cuò)誤的方法，KCF與TLD融合的算法包含了原TLD學(xué)習(xí)模塊，當(dāng)判斷目標(biāo)丟失時(shí)不再盲目地在背景內(nèi)尋找目標(biāo)，當(dāng)目標(biāo)重新出現(xiàn)時(shí)重新跟蹤目標(biāo)，進(jìn)一步提高算法的跟蹤性能。雖然這兩個(gè)算法的融合方法很簡單，但融合后的算法確實(shí)解決了KCF不能跟蹤被遮擋的物體以及目標(biāo)跟蹤后不能找回的缺點(diǎn)，而且算法速度上高于原TLD算法，提高了算法的性能和適用性。

2機(jī)器人控制系統(tǒng)設(shè)計(jì)

機(jī)器人系統(tǒng)總體框架如圖4所示，USB攝像頭拍攝到的圖像信以視頻幀的形式傳入到程序中。首先先進(jìn)行KCF的濾波和特征跟蹤，再經(jīng)由TLD算法的處理運(yùn)算出目標(biāo)狀態(tài)，再通過整合模塊把得到被跟蹤目標(biāo)的位置信息轉(zhuǎn)換為云臺(tái)舵機(jī)轉(zhuǎn)動(dòng)命令發(fā)送，通過CH340模塊將指令由USB轉(zhuǎn)為TTL電平，機(jī)器人下位機(jī)通過STM32單片機(jī)直接或間接地控制各個(gè)模塊實(shí)現(xiàn)機(jī)器人的各個(gè)功能。STM32單片機(jī)在接收到PS2手柄模塊和CH340模塊的控制信號(hào)后，根據(jù)程序存儲(chǔ)器對(duì)應(yīng)的指令執(zhí)行行動(dòng)，如前進(jìn)、水彈槍射擊等。STM32單片機(jī)實(shí)時(shí)接收各模塊的信息，例如編碼電機(jī)的電機(jī)轉(zhuǎn)速，陀螺儀的歐拉角等，根據(jù)各模塊的信息及時(shí)調(diào)整機(jī)器人的運(yùn)動(dòng)狀態(tài)實(shí)現(xiàn)機(jī)器人運(yùn)動(dòng)底盤的靈活移動(dòng)。攝像頭所拍攝的圖像信息并不會(huì)直接交給STM32單片機(jī)除了，而是先經(jīng)由上位機(jī)NUC通過視覺追蹤算法運(yùn)算過后所得的控制指令發(fā)送給單片機(jī)接收，單片機(jī)接收到通過CH340轉(zhuǎn)換的控制指令后控制舵機(jī)云臺(tái)轉(zhuǎn)動(dòng)追蹤目標(biāo)。

3機(jī)器人目標(biāo)跟蹤算法軟件設(shè)計(jì)

目標(biāo)跟蹤算法軟件實(shí)現(xiàn)流程圖如圖5所示。由于該目標(biāo)跟蹤算法的運(yùn)算結(jié)果只返回一個(gè)跟蹤框，并沒有實(shí)際的跟蹤結(jié)果，所以需要獲取被跟蹤目標(biāo)所在圖像中的坐標(biāo)，獲取包圍被跟蹤目標(biāo)的矩形重心后，才能方便實(shí)現(xiàn)目標(biāo)跟蹤算法。計(jì)算出被跟蹤目標(biāo)的矩形包圍框的重心后，先對(duì)圖像幀區(qū)域進(jìn)行劃分，使用漸近式接近目標(biāo)區(qū)域?yàn)楹诵乃枷耄瑢⒚恳粠膱D像劃分為許多相同的矩形區(qū)域。隨后根據(jù)KCF+TLD目標(biāo)跟蹤算法運(yùn)算得出的結(jié)果框的重心與圖像正中心對(duì)比，計(jì)算出被跟蹤目標(biāo)與圖像正中心坐標(biāo)的偏移量，再通過舵機(jī)控制算法計(jì)算出舵機(jī)云臺(tái)的轉(zhuǎn)動(dòng)量，逐幀接近目標(biāo)所在位置，達(dá)到跟蹤效果。

4系統(tǒng)視覺跟蹤算法測試

篇(6)

（長安大學(xué)信息工程學(xué)院，陜西西安710064）

摘要：目前計(jì)算機(jī)視覺在智能交通領(lǐng)域有著廣泛的應(yīng)用，基于三維逆投影圖的車速檢測利用計(jì)算機(jī)視覺，使用線性系統(tǒng)模型進(jìn)行攝像機(jī)標(biāo)定，得到透視投影矩陣，確立三維世界坐標(biāo)與二維圖像序列的映射關(guān)系。通過設(shè)定檢測區(qū)域并得到該區(qū)域的對(duì)應(yīng)逆投影圖，利用車尾陰影特征檢測跟蹤車輛，得到車輛目標(biāo)的位移（s）、時(shí)間（t）的關(guān)系，進(jìn)行速度檢測，該算法具有較好的穩(wěn)定性。

關(guān)鍵詞：智能交通；計(jì)算機(jī)視覺；透視投影矩陣；車速檢測

中圖分類號(hào)：TN911.73?34 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1004?373X（2015）16?0070?03

收稿日期：2015?03?09

基金項(xiàng)目：教育部博士點(diǎn)基金（20120205110001）

0 引言

車速檢測在交通領(lǐng)域中占有重要地位，其檢測方法包括虛擬線圈、雷達(dá)測速等傳統(tǒng)方法，以及利用計(jì)算機(jī)進(jìn)行視頻分析處理的智能交通檢測方法。而在基于視頻進(jìn)行車速檢測的方法中，大部分通過直接分析二維圖像得到車輛速度。由于攝像機(jī)的透視關(guān)系，二維圖像與真實(shí)物體存在很大差距，存在尺度變換和幾何形變，增加了車速檢測的難度。本文設(shè)計(jì)了一種基于三維逆投影的車速檢測方法，通過對(duì)二維圖像序列進(jìn)行標(biāo)定，進(jìn)行圖像三維重建，得到逆投影圖像序列，該圖像序列中的車輛目標(biāo)具有幾何不變性，其位置、大小與真實(shí)車輛位置、大小一一對(duì)應(yīng)。經(jīng)過檢測逆投影圖像序列中車輛目標(biāo)的車尾陰影特征后，跟蹤連續(xù)幀目標(biāo)，計(jì)算獲取目標(biāo)速度。

1 三維標(biāo)定

攝像機(jī)標(biāo)定是通過確定攝像機(jī)的位置、內(nèi)外參數(shù)和建立成像模型，來確定世界坐標(biāo)系中的物體和它在圖像平面上的成像之間的對(duì)應(yīng)關(guān)系?？臻g物體上某點(diǎn)的三維幾何位置與它在圖像中對(duì)應(yīng)點(diǎn)的相互關(guān)系是由攝像機(jī)成像的幾何模型確定的。在傳統(tǒng)攝像機(jī)標(biāo)定中采用針孔模型，攝像機(jī)坐標(biāo)系與世界坐標(biāo)系之間的關(guān)系可以用旋轉(zhuǎn)矩陣R 與平移向量μ 來表示，因此空間中一點(diǎn)P 在世界坐標(biāo)系和攝像機(jī)坐標(biāo)系下的齊次坐標(biāo)[xW ] ,yW ,zW ,1 T 和[xC ] ,yC,z C,1 T 之間存在如下關(guān)系：

式中：R 為3×3 正交單位矩陣；μ 為三維平移向量，0T = [0,0,0]。

利用針孔模型中的透視映射關(guān)系，可以將上述關(guān)系簡化為式（2）：

式中：(u,v) 為一點(diǎn)的圖像坐標(biāo)；(xW ) ,yW ,zW 為該點(diǎn)的世界坐標(biāo)；mij 為投影矩陣M 的第i 行第j 列元素。

已知n 個(gè)點(diǎn)的圖像坐標(biāo)和世界坐標(biāo)，可以通過式（2）得到一線性方程組：

利用至少已知的6 個(gè)點(diǎn)對(duì)應(yīng)的世界坐標(biāo)和圖像坐標(biāo)，通過最小二乘法可以求解線性方程式（3）的解m，得到投影矩陣M，實(shí)現(xiàn)了三維標(biāo)定[1]。

2 車輛特征提取

車輛特征提取步驟如下：

（1）設(shè)定檢測框[2]。在路面上設(shè)立一虛擬檢測框，該檢測框與實(shí)際路面貼合，長15 m，寬4 m，投影到圖像坐標(biāo)形成圖1（b）所示的ABCD。

（2）恢復(fù)逆投影圖。根據(jù)式（2）可知，三維中的每一個(gè)點(diǎn)通過透視投影矩陣M 變換后，都可以得到圖像坐標(biāo)中與之對(duì)應(yīng)的像素點(diǎn)。根據(jù)M 矩陣恢復(fù)該檢測框中的數(shù)據(jù)，得到大小為240×600的逆投影圖，該圖中的檢測目標(biāo)不存在幾何形變和尺度變換，如圖1（c）所示。

（3）車輛目標(biāo)檢測。檢測框設(shè)立在路面上，所有點(diǎn)的z 坐標(biāo)均為0，由此恢復(fù)得到的逆投影圖中xy 平面的信息是與實(shí)際對(duì)應(yīng)的真實(shí)信息。在恢復(fù)后的逆投影圖中，車尾陰影部分這一明顯特征可以表征車輛目標(biāo)[3]。通過大量實(shí)驗(yàn)研究表明利用車尾陰影作為車輛特征，進(jìn)行車輛目標(biāo)檢測可以很好地避免干擾，減小誤差。

（4）車輛目標(biāo)提取。在獲得的逆投影圖像中提取目標(biāo)，本文通過檢測圖像中車輛目標(biāo)的車尾陰影作為車輛特征，進(jìn)行連續(xù)圖像序列幀中的目標(biāo)跟蹤。圖1（d）中MN為車尾陰影位置所在像素行，該像素行與三維實(shí)際坐標(biāo)一一對(duì)應(yīng)，通過三維坐標(biāo)距離與逆投影圖大小的對(duì)應(yīng)關(guān)系可以得到車尾所在像素行對(duì)應(yīng)的三維坐標(biāo)。

3 車速計(jì)算

在已知的圖像序列中，假設(shè)連續(xù)幀中的目標(biāo)車輛做勻速直線運(yùn)動(dòng)[4?5]。通過勻速直線運(yùn)動(dòng)方程s = vt + s0 計(jì)算目標(biāo)車輛瞬時(shí)速度，利用最小二乘法原理可以很大程度上減小隨機(jī)誤差。當(dāng)有多組（s，t）數(shù)據(jù)時(shí)，可以組成方程組，如式（4）所示：

式中：v 為車輛瞬時(shí)速度；ti 為連續(xù)n 幀對(duì)應(yīng)的時(shí)間（即n/幀頻）；si 為車輛所在的實(shí)際位置。

轉(zhuǎn)換為矩陣形式為：

式（5）是一個(gè)(n × 2) × (2 × 1) = (n × 1) 的矩陣等式，記為AX = b 。

由式（6）可以求出X，得到車輛瞬時(shí)速度v。

4 實(shí)驗(yàn)結(jié)果

通過標(biāo)定后，可以獲得原圖像序列對(duì)應(yīng)的逆投影圖，將逆投影圖二值化后求車尾陰影位置進(jìn)行目標(biāo)車輛的檢測與跟蹤。圖2為同一目標(biāo)車輛的連續(xù)幀處理過程。在該序列圖中檢測并跟蹤目標(biāo)車輛。將檢測到的車尾位置在原逆投影圖中標(biāo)注，如圖3所示。車尾在逆投影圖中的像素行轉(zhuǎn)化為實(shí)際三維距離后可得si ，幀間時(shí)間間隔ti 為40 ms（幀頻為25 Hz），可以得到如表1所示的對(duì)應(yīng)關(guān)系。由式（6）可以解出車輛瞬時(shí)速度為50.55 km/h。

5 結(jié)語

在交通領(lǐng)域中利用計(jì)算機(jī)視覺，通過圖像處理技術(shù)進(jìn)行交通信息的檢測。建立基于攝像機(jī)的透視投影關(guān)系，可以標(biāo)定出三維世界坐標(biāo)與二維圖像坐標(biāo)的對(duì)應(yīng)關(guān)系，從而獲得三維逆投影圖，進(jìn)行車輛目標(biāo)的跟蹤，計(jì)算得到車輛速度信息。通過大量實(shí)驗(yàn)研究表明，該方法可以準(zhǔn)確計(jì)算得到車輛速度，具有較好的穩(wěn)定性和可靠性，在當(dāng)今智能交通領(lǐng)域具有一定的應(yīng)用前景。

參考文獻(xiàn)

[1] 馬頌德，張正友.計(jì)算機(jī)視覺：計(jì)算理論與算法基礎(chǔ)[M].北京：科學(xué)出版社，1998.

[2] HE Xiaochen，YUNG N H C. A novel algorithm for estimating vehicle speed from two consecutive images [C]// IEEE Work?shop on Applications of Computer Vision. [S.l.]：IEEE，2007：111?120.

[3] 宋俊芳.基于視頻的車流量檢測統(tǒng)計(jì)技術(shù)研究[D].西安：長安大學(xué)，2010.

[4] 馬慧明.車速檢測技術(shù)述評(píng)[J].中北大學(xué)學(xué)報(bào)：自然科學(xué)版，2007（z1）：139?144.

[5] 童劍軍，鄒明福.基于監(jiān)控視頻圖像的車輛測速[J].中國圖象圖形學(xué)報(bào)：A輯，2005，10（2）：192?196.

篇(7)

關(guān)鍵詞:運(yùn)動(dòng)目標(biāo)識(shí)別;背景差分法;瞬時(shí)差分法;OpenCV

中圖分類號(hào):TP273

0 引言

運(yùn)動(dòng)目標(biāo)的識(shí)別就是對(duì)包含運(yùn)動(dòng)信息的視頻序列運(yùn)用適當(dāng)?shù)募夹g(shù)進(jìn)行處理,把與背景存在相對(duì)運(yùn)動(dòng)的前景區(qū)分開的過程。它是計(jì)算機(jī)視覺信息提取中的一個(gè)重要問題,也是更高層次視頻分析,如基于對(duì)象的視頻編碼、目標(biāo)跟蹤、運(yùn)動(dòng)分析基礎(chǔ)。目前,運(yùn)動(dòng)目標(biāo)識(shí)別主要有三種方法:背景差分法、瞬時(shí)差分法和光流法。背景差分法可以得到比較完整的運(yùn)動(dòng)目標(biāo)信息,但是背景模型的獲取和更新比較困難。瞬時(shí)差分法容易在目標(biāo)內(nèi)部產(chǎn)生空洞,不能得到完整的目標(biāo)信息。光流法計(jì)算比較復(fù)雜,且抗噪性能差,如果沒有特定的硬件支持,一般很難用于運(yùn)動(dòng)目標(biāo)識(shí)別的實(shí)時(shí)性操作。

在此介紹一種將背景差分法和瞬時(shí)差分法相結(jié)合的運(yùn)動(dòng)目標(biāo)識(shí)別算法,并給出基于OpenCV實(shí)現(xiàn)算法的過程和實(shí)驗(yàn)結(jié)果。

1 算法思想

背景差分法是利用當(dāng)前圖像與背景圖像的差分來識(shí)別出運(yùn)動(dòng)目標(biāo)的方法。背景模型的獲取和更新是該方法中的關(guān)鍵技術(shù)。一種簡單的獲取背景圖像的方法是當(dāng)場景中無任何目標(biāo)出現(xiàn)時(shí)捕獲背景圖像,這種人工的非自適應(yīng)方法獲取的背景圖像僅適用于短時(shí)間內(nèi)的視頻監(jiān)控。目前大多數(shù)算法已經(jīng)放棄這種非自適應(yīng)的背景圖像估計(jì)方法。當(dāng)場景環(huán)境不是很復(fù)雜時(shí),可以使用統(tǒng)計(jì)濾波完成場景中背景圖像的估計(jì),大多數(shù)情況下都可以得到正確的背景估計(jì)圖像,但是當(dāng)場景中有個(gè)別部分做無規(guī)則運(yùn)動(dòng)時(shí),會(huì)引起場景中像素值不斷變化,從而引起估計(jì)誤差?；诟咚菇y(tǒng)計(jì)模型的背景估計(jì)方法在有部分區(qū)域不斷變化的場景中也能比較準(zhǔn)確地估計(jì)出背景模型,但是它的計(jì)算比較復(fù)雜,加上識(shí)別過程中其他操作也可能無法滿足實(shí)時(shí)性需求。

瞬時(shí)差分法是在視頻序列中兩個(gè)相鄰幀間采用基于像素的時(shí)間差分,并且閾值化來提取出運(yùn)動(dòng)目標(biāo)的方法。即將相鄰的兩幀圖像做逐像素相減運(yùn)算,并設(shè)定閾值,若相減的值大于閾值,則將其看作前景圖像(運(yùn)動(dòng)目標(biāo));否則看作是背景圖像。瞬時(shí)差分法對(duì)于動(dòng)態(tài)環(huán)境的適應(yīng)性較強(qiáng),不需要獲取背景圖像。當(dāng)相鄰兩幀圖像的紋理、灰度等信息比較接近時(shí),這種方法通常不能完整地檢測到目標(biāo)的具體內(nèi)容,在物體內(nèi)部產(chǎn)生空洞。但是它可以較準(zhǔn)確地得到運(yùn)動(dòng)物體的輪廓。

在此將使用一種背景差分法和瞬時(shí)差分法相結(jié)合的方法。首先根據(jù)一定數(shù)量的視頻序列,采用基于高斯統(tǒng)計(jì)模型的方法獲得背景圖像。在后續(xù)處理中,對(duì)于每一幀的視頻圖像,首先用瞬時(shí)差分法識(shí)別出運(yùn)動(dòng)目標(biāo)的輪廓,然后用這幀圖像運(yùn)動(dòng)目標(biāo)輪廓以外的區(qū)域?qū)Ρ尘澳Ｐ瓦M(jìn)行基于統(tǒng)計(jì)濾波的更新。這樣就可以減少場景中運(yùn)動(dòng)目標(biāo)對(duì)更新背景模型的影響,同時(shí)保證了系統(tǒng)運(yùn)行時(shí)間的實(shí)時(shí)性,也可以得到較完整的目標(biāo)識(shí)別信息。

2 算法實(shí)現(xiàn)

根據(jù)前文的算法思想,可以得到系統(tǒng)的流程圖如┩1所示。

開放源代碼的計(jì)算機(jī)視覺類庫OpenCV(Open Source Computer Vision Library)是由英特爾公司位于俄羅斯的研究實(shí)驗(yàn)室所開發(fā)的一套可免費(fèi)獲得,并由┮恍┆C函數(shù)和C++類所組成的庫,用來實(shí)現(xiàn)一些常用的圖像處理及計(jì)算機(jī)視覺算法[7[CD*2]10]。下面給出利用OpenCV實(shí)現(xiàn)算法的具體過程和關(guān)鍵部分的代碼:

(1) 捕獲視頻幀

定義捕捉源:

(2) 基于高斯統(tǒng)計(jì)估計(jì)背景模型

定義高斯背景模型:

將高斯背景模型的背景圖像復(fù)制到事先定義的背景圖像pBkImg 中:

(3) 使用瞬時(shí)差分法獲得不包含運(yùn)動(dòng)區(qū)域的當(dāng)前幀,并更新背景。當(dāng)前幀pFrame和前一幀pFrame0做差分,結(jié)果放在差分圖像diff中,并二值化:

接下來要做的操作是,找到差分圖像中的輪廓,得到他們的外接矩形。將面積小的矩形視為噪音拋棄,剩下的則視為運(yùn)動(dòng)目標(biāo)。同時(shí)設(shè)置當(dāng)前幀pFrame和背景pBkImg的ROI為運(yùn)動(dòng)目標(biāo)的外接矩形。先將當(dāng)前幀的ROI置0,再對(duì)當(dāng)前幀與背景的ROI進(jìn)行邏輯(or)運(yùn)算。這樣,對(duì)于運(yùn)動(dòng)目標(biāo)所在區(qū)域,當(dāng)前幀和背景的圖像信息是一樣的,也就達(dá)到了消除運(yùn)動(dòng)目標(biāo)對(duì)背景更新的影響目的。

這段代碼如下所示:

用上述過程得到不包含運(yùn)動(dòng)目標(biāo)信息的當(dāng)前幀更新背景模型:

(4) 進(jìn)行背景差分,得到當(dāng)前幀運(yùn)動(dòng)目標(biāo)識(shí)別結(jié)果的二值圖像pFrImg:

3 實(shí)驗(yàn)結(jié)果

根據(jù)上述算法思想和實(shí)現(xiàn)過程,使用VC++6.0和OpenCV 1.0實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的識(shí)別。經(jīng)過計(jì)算,該算法處理每一幀圖像的時(shí)間大約是16 ms,可以滿足實(shí)時(shí)性系統(tǒng)的要求。使用該算法對(duì)一段交通監(jiān)控圖像進(jìn)行運(yùn)動(dòng)目標(biāo)的識(shí)別,結(jié)果如圖2所示。其中,圖2(a)是當(dāng)前幀圖像,圖2(b)是不包含運(yùn)動(dòng)信息的當(dāng)前幀圖像,用矩形框標(biāo)注出了由幀間差分檢測到運(yùn)動(dòng)目標(biāo)的位置,┩2(c)是當(dāng)前的背景模型,圖2(d)是背景差分的結(jié)果。オ

4 結(jié) 語

由上述實(shí)驗(yàn)結(jié)果可以看出,本文介紹的算法可以較準(zhǔn)確地得到背景圖像,并且實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的識(shí)別。

系統(tǒng)尚需改進(jìn)的地方有對(duì)運(yùn)動(dòng)目標(biāo)邊緣的檢測不夠清楚;如果可以加入陰影的檢測和去除,應(yīng)該會(huì)取得[LL]更好的識(shí)別效果。這些將是進(jìn)一步研究的工作。

參考文獻(xiàn)

[1]劉雪.基于圖像序列的運(yùn)動(dòng)目標(biāo)檢測與跟蹤算法研究[D].山東:山東大學(xué),2007.

[2]許志良,周智恒,曹英烈,等.關(guān)于運(yùn)動(dòng)目標(biāo)檢測的發(fā)展現(xiàn)狀研究[J].移動(dòng)通信,2008(6):35[CD*2]38.

[3]丁忠校.視頻監(jiān)控圖像的運(yùn)動(dòng)目標(biāo)檢測方法綜述[J].電視技術(shù),2008,32(5):72[CD*2]76.

[4]尹彥,耿兆豐.基于背景模型的運(yùn)動(dòng)目標(biāo)檢測與跟蹤[J].微計(jì)算機(jī)信息,2008,24(11):298[CD*2]300.

[5]趙占杰,林小竹,張金燕.基于背景重建的運(yùn)動(dòng)目標(biāo)檢測算法[J].北京石油化工學(xué)院學(xué)報(bào),2008,16(2):27[CD*2]30.

[6]肖麗軍,于哲舟,周栩,等.基于對(duì)稱差分算法的視頻運(yùn)動(dòng)目標(biāo)分割[J].吉林大學(xué)學(xué)報(bào):理學(xué)版,2008,46(4):691[CD*2]696.

[7]賈小軍,喻擎蒼.基于開源計(jì)算機(jī)視覺處理庫OpenCV的圖像處理[J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(4):276[CD*2]278.

[8]馬桂珍,朱玲贊,段麗.基于OpenCV的視頻應(yīng)用程序的開發(fā)方法[J].現(xiàn)代電子技術(shù),2007,30(4):78[CD*2]80.

[9]李振偉,陳,趙有.基于OpenCV的運(yùn)動(dòng)目標(biāo)跟蹤及其實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2008,31(20):128[CD*2]131.

[10]劉瑞禎,于仕琪.OpenCV教程基礎(chǔ)篇[M].北京:北京航空航天大學(xué)出版社,2007.

相關(guān)文章

計(jì)算機(jī)視覺的前景精品(七篇)

篇(1)

篇(2)

篇(3)

篇(4)

篇(5)

篇(6)

篇(7)

計(jì)算物理

航空計(jì)算技術(shù)

計(jì)算機(jī)

現(xiàn)代計(jì)算機(jī)