前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機(jī)視覺總結(jié)主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:計算機(jī)視覺圖像 精密測量 構(gòu)造幾何模型 信號源的接收
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2013)05-1211-02
新型計算機(jī)視覺圖像精密測量是一種基于計算機(jī)程序設(shè)計以及圖像顯示的高精度的關(guān)鍵技術(shù),它廣泛用于測量的領(lǐng)域,對于測量的準(zhǔn)確性有很好的保證。這種關(guān)鍵技術(shù)是幾何了光學(xué)的特性,發(fā)揮了圖像學(xué)的顯影性,把普通的測量技術(shù)瞬間提升到了一個新的高度。在這項關(guān)鍵技術(shù)中包含了物理學(xué)中光的效應(yīng),圖像中的傳感器以及計算機(jī)中的編程軟件,這還不完全,還有一些其他科學(xué)領(lǐng)域知識的輔助,可以說這項關(guān)鍵技術(shù)是一個非常有技術(shù)含量的技術(shù),很值得學(xué)者進(jìn)行研究。
1 計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)的具體形式
在以往的測量中,選擇的測量方式還是完全采用機(jī)械的形式,但是在使用了計算機(jī)視覺圖像精密測量后,完成了許多以往技術(shù)所不能達(dá)到的任務(wù)。在我們的研究中,計算機(jī)視覺圖像測量的原理是通過攝像機(jī)將被處理的對象采集進(jìn)行影像采集,在多個控制點(diǎn)的數(shù)據(jù)采集完成后,系統(tǒng)會自動將這些圖像進(jìn)行整合,得出相關(guān)的幾何多變參數(shù),再在計算機(jī)上以具體的數(shù)據(jù)顯示出來,以供技術(shù)人員使用參照。
在上面所說的攝像機(jī)并不是我們通常意義上生活中使用的攝像機(jī)。它是一種可視化較強(qiáng),表針比較敏感的測試儀??梢詫⒁曈X中的二維形態(tài)通過顯影,記錄在機(jī)械的光譜儀上,再將這種的二維圖像做數(shù)學(xué)處理,有二階矩陣轉(zhuǎn)換為三階矩陣,通過播放儀呈現(xiàn)出三維的影像。這時的圖像變?yōu)榱Ⅲw化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點(diǎn)的數(shù)據(jù),將數(shù)據(jù)整合在系統(tǒng)之內(nèi),然后對于原始的圖像進(jìn)行預(yù)處理,不再經(jīng)過有曝光這個程序,將圖像中關(guān)鍵點(diǎn)的坐標(biāo)在整個內(nèi)部軸面上體現(xiàn)出來,提取數(shù)據(jù)幀數(shù),再運(yùn)用機(jī)器的智能識別系統(tǒng),對控制點(diǎn)的坐標(biāo)進(jìn)行數(shù)據(jù)分析,自動生成圖形,這也可以用于精密測量。它的優(yōu)點(diǎn)就是使用上極其的方面,基本只要架立儀器和打開開關(guān),其他的工作機(jī)械系統(tǒng)都會自動的完成。使用的困難就是造價極其的高,不適合一般企業(yè)使用。在基于計算機(jī)視覺圖像測量中使用上的原理如下:
1) 計算出觀察控制點(diǎn)到計算機(jī)視覺圖像測量儀器的有效距離;
2) 得出觀察點(diǎn)到目標(biāo)控制點(diǎn)之間的三維的運(yùn)動幾何參數(shù);
3) 推斷出目標(biāo)控制點(diǎn)在整個平面上的表面特征( 大多時候要求形成立體視覺);
4) 還通過觀察可以判斷出目標(biāo)物體的幾何坐標(biāo)方位。
在整個計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)中最關(guān)鍵的元件就是壓力應(yīng)變電阻儀,這也是傳感器的一部分。壓力應(yīng)變電阻儀的使用方式是將應(yīng)力片粘貼在控制點(diǎn)位上,事先在物體表面打磨平整,清理干凈后,涂抹丙酮試劑,在液體完全風(fēng)干后就可以黏貼應(yīng)力片,通過導(dǎo)線的聯(lián)接,形成了一小段閉合的電路,時刻讓計算機(jī)視覺圖像系統(tǒng)可以感應(yīng)到并作跟蹤觀察。因受到來自不同方面諧波的影響后,應(yīng)力片會產(chǎn)生一定數(shù)值的電阻,在電路中,這些電阻會轉(zhuǎn)化為電流,視覺圖像系統(tǒng)接收到了電流后就會顯示在儀表盤上相應(yīng)的數(shù)據(jù),我們就可以根據(jù)儀表盤中的數(shù)據(jù)記錄測量中的數(shù)據(jù),很好的解決了原始機(jī)械在使用過程中大量的做無用功所消耗資源的現(xiàn)象。傳感器對每個應(yīng)點(diǎn)都進(jìn)行動態(tài)的測量,將數(shù)據(jù)模轉(zhuǎn)換成現(xiàn)實(shí)中的圖像,精確的成像可以測算出控制點(diǎn)的位置,用計算機(jī)視覺圖像精密測量結(jié)合數(shù)據(jù)方面的相關(guān)的分析,得出施工中的可行性報告分析,減低了施工中的成本,將施工的預(yù)算控制在一個合理的范圍之內(nèi)。
當(dāng)無法觀察到控制點(diǎn)是,計算機(jī)視覺圖像精密測量可以通過接收信號或是相關(guān)的頻率波段來收集數(shù)據(jù),不會因?yàn)橐酝鶞y量的環(huán)境不好,距離太遠(yuǎn),誤差太大的影響。
2 計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)分析
在計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)中解決了很多以往很難完成的任務(wù),但是在使用過程中還是發(fā)生了很多的問題。尤其在視覺圖像的選擇中,無法使用高幀數(shù)的圖片顯示,無法將計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)的優(yōu)點(diǎn)發(fā)揮出來。我們就計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)中常見的問題進(jìn)行討論。
2.1 降低失誤的概率
在很多的數(shù)據(jù)誤差中,有一部分是出現(xiàn)在人為的因素上面。對于機(jī)器的不熟悉和操作中的疏忽都會在一定程度上對圖像的視覺感模擬帶來麻煩。對于網(wǎng)絡(luò)設(shè)備的配置上,要經(jīng)常性的學(xué)習(xí),將配置在可能的情況下設(shè)置的更加合理和使用,保證網(wǎng)絡(luò)連接系統(tǒng)的安全性。為防止更多因操作帶來的誤差,選用系統(tǒng)登入的制度,用戶在通過識別后進(jìn)入系統(tǒng),在采集數(shù)據(jù)后,確定最終數(shù)據(jù)上又相關(guān)的再次確定的標(biāo)識,系統(tǒng)對本身有的登錄服務(wù)器和路由器有相關(guān)的資料解釋,記錄好實(shí)用操作的時間,及時備份。
2.2 對于權(quán)限的控制
權(quán)限控制是針對測量關(guān)鍵所提出的一種安全保護(hù)措施,它是在使用計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)中對用戶和用戶組賦予一定的權(quán)限,可以限制用戶和用戶組對目錄、子目錄、文件、打印機(jī)和其他共享資源的瀏覽和更改。圖像中的運(yùn)行服務(wù)器在停止的情況下可以做出不應(yīng)答的操作指令,立刻關(guān)閉當(dāng)前不適用的界面,加快系統(tǒng)的運(yùn)行速度,對于每天的日志文件實(shí)時監(jiān)控,一旦發(fā)現(xiàn)問題及時解決。對于數(shù)據(jù)終端的數(shù)據(jù)可采用可三維加密的方法,定時進(jìn)行安全檢測等手段來進(jìn)一步加強(qiáng)系統(tǒng)的安全性。如果通過了加密通道,系統(tǒng)可以將數(shù)據(jù)自動的保存和轉(zhuǎn)換為視圖模式,對于數(shù)據(jù)的審計和運(yùn)行可以同時進(jìn)行,這樣就可以很好的保證大地測量中的圖像數(shù)據(jù)安全,利用防護(hù)墻將采集中廢棄的數(shù)據(jù)革除在外,避免數(shù)值之間發(fā)生紊亂的現(xiàn)象,進(jìn)一步改善計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)。
2.3 開啟自動建立備份系統(tǒng)
計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)的完善中會常遇到系統(tǒng)突然崩潰或是圖像受到嚴(yán)重干擾導(dǎo)致無法轉(zhuǎn)換的一系列情況,發(fā)生這種情況最大的可能性就是系統(tǒng)在處理多組數(shù)據(jù)后無法重新還原成進(jìn)入界面。這時為保證圖片轉(zhuǎn)換成數(shù)字的系統(tǒng)數(shù)據(jù)不丟失,我們對系統(tǒng)進(jìn)行備份。選定固定的磁盤保存數(shù)據(jù),定期將產(chǎn)生的數(shù)據(jù)(轉(zhuǎn)換前的圖像和轉(zhuǎn)換后的數(shù)值)導(dǎo)出,保證程序的正常運(yùn)行。當(dāng)系統(tǒng)一旦發(fā)生錯誤,可以盡快的恢復(fù)數(shù)據(jù)的初始狀態(tài),為測量任務(wù)的完成爭取更多的時間。我們還要減少信號源周圍的干擾,定期的更新系統(tǒng)數(shù)據(jù)庫,保持?jǐn)?shù)據(jù)采集的穩(wěn)定性,把攝像機(jī)記錄出的數(shù)據(jù)節(jié)點(diǎn)保存在相應(yīng)的技術(shù)圖紙上,用這樣的方式來知道測量工作。系統(tǒng)備份的數(shù)據(jù)還可以用于數(shù)據(jù)的對比,重復(fù)測量后得出的數(shù)據(jù),系統(tǒng)會自動也備份的數(shù)據(jù)進(jìn)行比對,發(fā)現(xiàn)誤差值在規(guī)定以外,就會做出相應(yīng)的預(yù)警,這樣也能在工作中降低出現(xiàn)誤差的概率。
3 計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)遇到的困難和使用前景
計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)作為一種新興技術(shù)在使用時間上不過十幾年,其使用的程度已經(jīng)無法估算。正是因?yàn)樗暮唵?、使用、精度高以及自動化能力卓越的特點(diǎn)受到了測量單位的廣泛青睞。在測量方面的這些可靠性和穩(wěn)定性也是有目共睹的。在土木和機(jī)械測量的行業(yè)計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)都會有廣泛和良好的使用,前景也是十分的廣闊。但是不容忽視該技術(shù)也有一些弊端。這項關(guān)鍵技術(shù)中涵蓋的學(xué)科非常的多,涉及到的知識也很全面,一旦出現(xiàn)了機(jī)器的故障,在維修上還是一個很大的問題,如何很好的解決計算機(jī)視覺圖像技術(shù)的相關(guān)核心問題就是當(dāng)下亟待解決的。
我們都知道,人的眼睛是可以受到吱聲的控制,想要完成觀測是十分簡單的,但是在計算機(jī)視覺圖像技術(shù)中,畢竟是采取攝像機(jī)取景的模式,在取得的點(diǎn)位有的時候不是特別的有代表性,很難將這些問題具體化、形象化。達(dá)不到我們設(shè)計時的初衷。所以在這些模型的構(gòu)建中和數(shù)據(jù)的轉(zhuǎn)換上必須有嚴(yán)格的規(guī)定和要求,切不可盲目的實(shí)施測量,每項技術(shù)操作都要按規(guī)程來實(shí)施。
上文中也談到了,計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)中最主要的構(gòu)建是傳感器,一個合理的傳感器是體統(tǒng)的“心臟”,我們在儀器的操作中,不能時時刻刻對傳感器進(jìn)行檢查,甚至這種高精度的元件在檢查上也并不是一件簡單的事情,通過不斷的研究,將傳感器的等級和使用方法上進(jìn)行一定的創(chuàng)新也是一項科研任務(wù)。
4 結(jié)束語
在測量工程發(fā)展的今天,很多的測量技術(shù)已經(jīng)離不了計算機(jī)視覺圖像技術(shù)的輔助,該文中詳細(xì)的談到了基于計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)方面的研究,對于之中可能出現(xiàn)的一些問題也提出了相應(yīng)的解決方案。測量工程中計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)可以很好的解決和完善測量中遇到的一些問題,但是也暴露出了很多的問題。
將基于計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)引入到測量工程中來,也是加強(qiáng)了工程建設(shè)的信息化水平??梢灶A(yù)見的是,在未來使用計算機(jī)視覺圖像技術(shù)建立的測量模型會得到更多、更好的應(yīng)用。但作為一個長期復(fù)雜的技術(shù)工程,在這個建設(shè)過程中定會有一些困難的出現(xiàn)。希望通過不斷的發(fā)現(xiàn)問題、總結(jié)經(jīng)驗(yàn),讓計算機(jī)視覺圖像精密測量的關(guān)鍵技術(shù)在測量中作用發(fā)揮的更好。
參考文獻(xiàn):
[1] 湯劍,周芳芹,楊繼隆.計算機(jī)視覺圖像系統(tǒng)的技術(shù)改造[J].機(jī)電產(chǎn)品開發(fā)與創(chuàng)新周刊,2005,14(18):33-36.
[2] 段發(fā)階,等. 拔絲模孔形計算機(jī)視覺檢測技術(shù)[J]. 光電工程時報, 1996,23(13):189-190.
關(guān)鍵詞:計算機(jī)視覺;課堂考勤;深度學(xué)習(xí);MCV架構(gòu)
前言
隨著國家標(biāo)準(zhǔn)《智慧校園總體框架》(Smartcampusoverallframework)的,智慧校園的規(guī)劃與設(shè)計成為了校園建設(shè)的重點(diǎn)項目[1]。而課堂考勤作為學(xué)校教學(xué)管理、學(xué)生評價的重要組成部分,隨著物聯(lián)網(wǎng)技術(shù)、人工智能和移動通信技術(shù)的水平的提高與發(fā)展,更應(yīng)該向著智能化、準(zhǔn)確化的方向發(fā)展[2]。本文研究了的當(dāng)前應(yīng)用的課堂考勤方式,并做了進(jìn)一步的分析,最終根據(jù)社會技術(shù)的革新與發(fā)展[3],提出了一種基于計算機(jī)視覺的實(shí)時課堂考勤系統(tǒng)的設(shè)計。我們的主要工作是搭建了整個系統(tǒng)框架,包括數(shù)據(jù)庫系統(tǒng)、服務(wù)器、計算機(jī)視覺模型、網(wǎng)絡(luò)通信、圖像采集系統(tǒng)、客戶端和網(wǎng)絡(luò)通信系統(tǒng)。
1課堂考勤方式現(xiàn)狀
目前校園中主要的課堂考勤方式存在為兩種,分別是傳統(tǒng)的考勤方式和生物識別的考勤方式。如圖1所示,其中傳統(tǒng)的考勤方式包括點(diǎn)名考勤和通過校園卡進(jìn)行考勤,點(diǎn)名考勤的方式仍然是高校中最常用的考勤手段,因它不受場地的限制,可以根據(jù)點(diǎn)名冊直接核對現(xiàn)場的學(xué)生信息,但這種方式存在的缺點(diǎn)就是花費(fèi)時間,影響上課效率,為此有些教師不進(jìn)行點(diǎn)名,因此影響了考勤的效果。校園卡考勤解決了點(diǎn)名占用課堂時間的問題,但這種方式具有學(xué)生代考勤的漏洞,因?yàn)閷W(xué)生可以拿著別人的校園卡進(jìn)行考勤。生物識別的考勤方式包括指紋考勤和人臉識別考勤,這些方式有效解決了傳統(tǒng)考勤方式代考勤的弊端,但這種方式受設(shè)備硬件的影響,識別能力太慢,尤其是在下課后學(xué)生較多,考勤簽退時容易發(fā)生擁擠等現(xiàn)象,具有安全隱患[4]。因此,為解決當(dāng)前考勤方式存在的一些弊端,本文設(shè)計了一種基于計算機(jī)視覺的實(shí)時課堂考勤系統(tǒng)。
2系統(tǒng)設(shè)計基礎(chǔ)
2.1系統(tǒng)開發(fā)環(huán)境
本文設(shè)計的實(shí)時課堂考勤系統(tǒng)主要是使用Python開發(fā)語言,Python是目前最流行開發(fā)語言之一,主要應(yīng)用于Web服務(wù)設(shè)計、大數(shù)據(jù)、人工智能等領(lǐng)域,它的主要優(yōu)點(diǎn)是開發(fā)效率高、可擴(kuò)展性強(qiáng)、跨平臺和具有可移植性等,滿足了本文系統(tǒng)的設(shè)計要求。另外,在開發(fā)過程還用到了基于Python的第三方軟件開發(fā)包,包括Flask用于搭建系統(tǒng)的Web服務(wù)器;PyQt5用于搭建系統(tǒng)的客戶端;OpenCV用于系統(tǒng)中對圖像視頻的處理;Tensoflow用于開發(fā)計算機(jī)視覺模型,搭建深度學(xué)習(xí)模型,完成人臉檢測和識別任務(wù);Mysqlclient用于管理、訪問、查詢和更新Mysql數(shù)據(jù)庫。
2.2系統(tǒng)開發(fā)框架
本文設(shè)計的實(shí)時課堂考勤系統(tǒng)通信基于Web應(yīng)用,因此選擇一個合適的服務(wù)架構(gòu)有利于提高系統(tǒng)的開發(fā)和部署效率。目前較流行的Web應(yīng)用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)兩種架構(gòu)。本文使用了基于Python和Flask搭建的MVC架構(gòu)[5],該架構(gòu)如圖2所示,主要包括模型層、視圖層和控制器。使用該框架的優(yōu)點(diǎn)是可將視圖層和業(yè)務(wù)邏輯層進(jìn)行分離開發(fā),提高開發(fā)效率,方便系統(tǒng)的部署、維護(hù)和管理。
3系統(tǒng)設(shè)計方式
3.1系統(tǒng)總結(jié)構(gòu)設(shè)計
本文設(shè)計的實(shí)時課堂考勤系統(tǒng)的總體結(jié)構(gòu)如圖3所示。根據(jù)MVC構(gòu)架的設(shè)計,我們將該系統(tǒng)分為了模型層、控制器層和視圖層,另外還包括網(wǎng)絡(luò)通信設(shè)備。
3.2模型層設(shè)計
模型層主要是關(guān)系型數(shù)據(jù)庫模,MySQL是目前使用最多的關(guān)系型數(shù)據(jù)庫系統(tǒng),也是學(xué)校管理系統(tǒng)使用最多的數(shù)據(jù)系統(tǒng),為了更好地與學(xué)校管理系統(tǒng)兼容,我們選擇了MySQL數(shù)據(jù)庫,數(shù)據(jù)表之間的關(guān)系如圖4所示。
3.3控制器層設(shè)計
控制器層主要包括服務(wù)器應(yīng)用軟件和計算機(jī)視覺模型,服務(wù)器應(yīng)用軟件的功能包括系統(tǒng)通信配置、數(shù)據(jù)業(yè)務(wù)處理和系統(tǒng)各模塊間的調(diào)度。計算機(jī)視覺模型是實(shí)時課堂考勤系統(tǒng)的核心模塊,基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)[6],主要作用是進(jìn)行人臉檢測和識別兩個部分,計算機(jī)視覺模型的工作流程如圖5所示。在人臉檢測階段使用VGG16檢測器作為主干網(wǎng)絡(luò),為提高模型的檢測準(zhǔn)確率,通過引入注意力模型和多尺度特征融合對網(wǎng)絡(luò)進(jìn)行了優(yōu)化,有效地從輸入圖片中提取人臉位置信息,得到人臉圖像。在人臉識別階段首先使用FaceNe人臉識別網(wǎng)絡(luò)提取人臉圖像的特征圖,然后通過決策樹算法與待檢測的人臉特征進(jìn)行匹配,從而識別圖片中的學(xué)生信息。
3.4視圖層設(shè)計
本文設(shè)計的實(shí)時考勤系統(tǒng)的模型層主要包括圖像采集系統(tǒng)和客戶端。目前各學(xué)校教室內(nèi)都安裝有監(jiān)控設(shè)備,因此為節(jié)約成本和安裝消耗,圖像采集系統(tǒng)使用教室內(nèi)的監(jiān)控設(shè)備作為圖像采集系統(tǒng),負(fù)責(zé)采集教室現(xiàn)場圖片。客戶端設(shè)計首先在本系統(tǒng)中采用應(yīng)用程序接口,然后在教學(xué)管理系統(tǒng)中設(shè)計圖形化用戶界面,通過應(yīng)用程序接口調(diào)用本系統(tǒng)的功能,從而減少資源浪費(fèi),方便維護(hù)和管理。
4實(shí)時考勤功能的實(shí)現(xiàn)
實(shí)時考勤功能的實(shí)現(xiàn)方式如圖6所示,首先系統(tǒng)啟動后,用戶可以隨時更新考勤信息,比如在數(shù)據(jù)庫中創(chuàng)建新的考勤表等。接著系統(tǒng)會自動讀取考勤表的信息,比如課程所在教室、上課時間。然后啟動考勤程序,進(jìn)行簽到、簽退操作,并將考勤數(shù)據(jù)保存到考勤數(shù)據(jù)表中。整個系統(tǒng)啟動完成后可以自動運(yùn)行,直到關(guān)閉系統(tǒng),而且可以實(shí)時進(jìn)行課堂考勤。
【關(guān)鍵詞】自動控制技術(shù);農(nóng)業(yè)自動化
由于歷史、觀念和技術(shù)等方面的原因, 我國傳統(tǒng)農(nóng)業(yè)機(jī)械與發(fā)達(dá)國家相比有很大差距,已遠(yuǎn)遠(yuǎn)不能適應(yīng)農(nóng)業(yè)的科技進(jìn)步。近些年來, 自動化的研究逐漸被人們所認(rèn)識, 自動控制在農(nóng)業(yè)上的應(yīng)用越來越受到重視。例如,把計算機(jī)技術(shù)、微處理技術(shù)、傳感與檢測技術(shù)、信息處理技術(shù)結(jié)合起來, 應(yīng)用于傳統(tǒng)農(nóng)業(yè)機(jī)械, 極大地促進(jìn)了產(chǎn)品性能的提高。我國農(nóng)業(yè)部門總結(jié)了一些地區(qū)的農(nóng)業(yè)自動化先進(jìn)經(jīng)驗(yàn)(如臺灣地區(qū)的農(nóng)業(yè)生產(chǎn)自動化、漁業(yè)生產(chǎn)自動化、畜牧業(yè)生產(chǎn)自動化及農(nóng)產(chǎn)品貿(mào)易自動化)的開發(fā)與應(yīng)用情況, 同時也汲取了國外一些國家的先進(jìn)經(jīng)驗(yàn)、技術(shù),如日本的四行半喂人聯(lián)合收割機(jī)是計算機(jī)控制的自動化裝置在半喂人聯(lián)合收割機(jī)中的應(yīng)用,英國通過對施肥機(jī)散播肥料的動力測量來控制肥料的精確使用量。這些技術(shù)和方法是我國農(nóng)業(yè)機(jī)械的自動化裝置得到了補(bǔ)充和新的發(fā)展,從而形成了一系列適合我國農(nóng)業(yè)特點(diǎn)的自動化控制技術(shù)。
1.已有的農(nóng)業(yè)機(jī)械及裝置的部分自動化控制
自動化技術(shù)提高了已有農(nóng)業(yè)機(jī)械及裝置的作業(yè)性能和操作性能。浙江省把自動化技術(shù)應(yīng)用于茶葉機(jī)械上,成功研制出6CRK-55型可編程控制加壓茶葉揉捻機(jī),它利用計算機(jī)控制電功加壓機(jī)構(gòu),能根據(jù)茶葉的具體情況編制最佳揉捻程序?qū)崿F(xiàn)揉捻過程的自動控制,是機(jī)電一體化技術(shù)在茶葉機(jī)械上的首次成功應(yīng)用。
1.1應(yīng)用于拖拉機(jī)
在農(nóng)用拖拉機(jī)上已廣泛使用了機(jī)械油壓式三點(diǎn)聯(lián)結(jié)的位調(diào)節(jié)和力調(diào)節(jié)系統(tǒng)裝置, 現(xiàn)又在開發(fā)和采用性能更完善的電子油壓式三點(diǎn)聯(lián)結(jié)裝置。
1.2應(yīng)用于施肥播種機(jī)
根據(jù)行駛速度和檢測種子粒數(shù)來確定播種量是否符合要求的裝置, 以及將馬鈴薯種子割成瓣后播種的裝置等。
1.3應(yīng)用于谷物干燥機(jī)
不受外界條件干擾, 能自動維持熱風(fēng)溫度的裝置停電或干燥機(jī)過熱引起火災(zāi)時,自動掐斷燃料供給的裝置。
2.微灌自動控制技術(shù)
我國從20世紀(jì)年50代就開始進(jìn)行節(jié)水灌溉的研究與推廣據(jù)統(tǒng)計。到1992年,全國共有節(jié)水灌溉工程面積0.133億m2,其中噴灌面積80萬m2, 農(nóng)業(yè)節(jié)水工程取得了巨大的進(jìn)展。灌溉管理自動化是發(fā)展高效農(nóng)業(yè)的重要手段,高效農(nóng)業(yè)和精細(xì)農(nóng)業(yè)要求必須實(shí)現(xiàn)水資源的高效利用。采用遙感遙測等新技術(shù)監(jiān)測土壤墑性和作物生長情況,對灌溉用水進(jìn)行動態(tài)監(jiān)測預(yù)報,實(shí)現(xiàn)灌溉用水管理的自動化和動態(tài)管理。在微灌技術(shù)領(lǐng)域,我國先后研制和改進(jìn)了等流量滴灌設(shè)備、微噴灌設(shè)備、微灌帶、孔口滴頭、壓力補(bǔ)償式滴頭、折射式和旋轉(zhuǎn)式微噴頭、過濾器和進(jìn)排氣閥等設(shè)備,總結(jié)出了一套基本適合我國國情的微灌設(shè)計參數(shù)和計算方法,建立了一批新的試驗(yàn)示范基地。在一些地區(qū)實(shí)現(xiàn)了自動化灌溉系統(tǒng),可以長時間地自動啟閉水泵和自動按一定的輪灌順序進(jìn)行灌溉。這種系統(tǒng)中應(yīng)用了灌水器、土壤水分傳感器、溫度傳感器、壓力傳感器、水位傳感器和雨量傳感器、電線等。
3.自動控制技術(shù)在精準(zhǔn)農(nóng)業(yè)中的應(yīng)用
關(guān)鍵詞:增強(qiáng)現(xiàn)實(shí);計算機(jī)視覺;三維注冊
中圖分類號:TP242 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9599?。?012) 19-0000-02
1 引言
隨著計算機(jī)技術(shù)的迅速發(fā)展,計算機(jī)視覺、虛擬現(xiàn)實(shí)技術(shù)、人工智能、計算機(jī)圖形學(xué)等技術(shù)被廣泛地研究和應(yīng)用,這些技術(shù)引導(dǎo)著人們進(jìn)入了一個信息數(shù)字化的虛擬時代。
增強(qiáng)現(xiàn)實(shí)技術(shù)(Augmented Reality,AR)作為虛擬現(xiàn)實(shí)技術(shù)和計算機(jī)圖形學(xué)相結(jié)合的產(chǎn)物,它是在通過計算機(jī)渲染生成虛擬的物體或文字信息模型的同時,對真實(shí)的場景進(jìn)行標(biāo)定,從而使虛擬的物體能夠被準(zhǔn)確地放置到真實(shí)的場景中,最終通過顯示設(shè)備顯示出來,使用戶處于虛擬和現(xiàn)實(shí)相融合的亦真亦幻的新環(huán)境中,無法清楚地分辨出真實(shí)和虛擬。增強(qiáng)現(xiàn)實(shí)技術(shù)增強(qiáng)了用戶的觀感及其與真實(shí)場景之間的交互。
增強(qiáng)現(xiàn)實(shí)技術(shù)作為虛擬現(xiàn)實(shí)的一個重要分支,是虛擬現(xiàn)實(shí)技術(shù)發(fā)展過程中的產(chǎn)物。如圖1.1所示,該圖為Milgram提出的增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)關(guān)系的一種分類學(xué)表示方法。由圖我們可以看出,虛擬現(xiàn)實(shí)所創(chuàng)建出來的是一種完全虛擬的三維世界,它與真實(shí)的世界相隔離。而增強(qiáng)現(xiàn)實(shí)是以現(xiàn)實(shí)場景為基礎(chǔ),場景中的虛擬物體隨著真實(shí)物體的變化而變化,提供給用戶的是一種復(fù)合的視覺效果,就好像這些虛擬物體真實(shí)的存在于場景中。
2 增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用
增強(qiáng)現(xiàn)實(shí)技術(shù)在20世紀(jì)90年代真正興起,其發(fā)展與20世紀(jì)60年代計算機(jī)圖形學(xué)的迅速發(fā)展密不可分。增強(qiáng)現(xiàn)實(shí)技術(shù)不僅擁有虛擬現(xiàn)實(shí)的各種優(yōu)點(diǎn),同時又有其獨(dú)特的視覺增強(qiáng)功能,因此成為了國內(nèi)外研究機(jī)構(gòu)和知名大學(xué)的研究熱點(diǎn),并廣泛的被應(yīng)用于教育、醫(yī)療、工業(yè)、娛樂、軍事等多個領(lǐng)域。
2.1 教育
增強(qiáng)現(xiàn)實(shí)豐富了教育學(xué)習(xí)生活。傳統(tǒng)的書籍中只存在文字信息,通過增強(qiáng)現(xiàn)實(shí)技術(shù),我們可以透過書籍看見文字相關(guān)的動態(tài)畫面或是影像,圖文并茂,極大的增強(qiáng)了學(xué)生的學(xué)習(xí)興趣。目前的魔法書系統(tǒng)就是這一技術(shù)的很好運(yùn)用,用戶通過頭盔顯示器可以看到書中描述的場景,使讀者可以完全沉浸在虛實(shí)結(jié)合的環(huán)境中,提高學(xué)習(xí)興趣和效率。
2.2 醫(yī)療
增強(qiáng)現(xiàn)實(shí)技術(shù)可以幫助醫(yī)生實(shí)現(xiàn)可視化手術(shù)或手術(shù)培訓(xùn)。準(zhǔn)確地定位真實(shí)場景是增強(qiáng)現(xiàn)實(shí)技術(shù)的一個重要方面,在醫(yī)療中,運(yùn)用增強(qiáng)現(xiàn)實(shí)技術(shù)可以進(jìn)行手術(shù)定位,實(shí)時地收集病人體內(nèi)的3D影像,并將其與真實(shí)的人體相結(jié)合,使得醫(yī)生可以“透視”病人體內(nèi),從而減少手術(shù)的風(fēng)險,該技術(shù)對微創(chuàng)手術(shù)也有著深遠(yuǎn)的意義。手術(shù)培訓(xùn)方面,通過加入虛擬的提示注解,可以提醒醫(yī)生手術(shù)中的一些必要步驟,降低手術(shù)風(fēng)險。
2.3 工業(yè)
增強(qiáng)現(xiàn)實(shí)的另一個應(yīng)用是工業(yè)組裝和維修。通過增強(qiáng)現(xiàn)實(shí)技術(shù)可以顯示出各種設(shè)備零件的內(nèi)部結(jié)構(gòu)圖、使用說明等,方便安裝和維修。顯示的內(nèi)容可以不僅僅是簡單的文字或圖片,更能直接渲染生成3D的圖形,并按步驟一步一步的顯示出來,方便操作。
2.4 娛樂
電影、廣告、游戲、體育比賽轉(zhuǎn)播中,增強(qiáng)現(xiàn)實(shí)技術(shù)也得到了廣泛的運(yùn)用。體育比賽中,能夠在直播現(xiàn)場實(shí)時地插入三維的圖形、動畫、視頻等虛擬的比賽相關(guān)信息或廣告。日常生活中,出現(xiàn)一種增強(qiáng)現(xiàn)實(shí)瀏覽器,它利用多種傳感器將日常需求通過實(shí)景與虛景結(jié)合后呈現(xiàn)在用戶面前,用戶可以通過增強(qiáng)現(xiàn)實(shí)瀏覽器看到實(shí)景的文字介紹、三維模型等,并可以搜索定位。
3 增強(qiáng)現(xiàn)實(shí)相關(guān)技術(shù)
增強(qiáng)現(xiàn)實(shí)系統(tǒng)具有虛實(shí)結(jié)合、三維注冊、實(shí)時交互三個特點(diǎn)。三個特點(diǎn)之間緊密聯(lián)系,要求在合成的場景中虛擬的物體能夠擁有真實(shí)的存在感和位置感。因此顯示技術(shù)、定位技術(shù)、虛實(shí)融合技術(shù)、用戶交互技術(shù)是實(shí)現(xiàn)增強(qiáng)現(xiàn)實(shí)系統(tǒng)的基礎(chǔ)支撐技術(shù)。
3.1 顯示技術(shù)
理想的AR系統(tǒng)的顯示器具有體積小、移動方便、圖像繪制清晰、交互自然等特點(diǎn),但是目前仍不能制造出完成符合這些特點(diǎn)的顯示器。常用的顯示設(shè)備可以分為四類:普通液晶現(xiàn)實(shí)器;頭戴式顯示器;手持式顯示器;投影式顯示器。
液晶顯示器是最為常見,也最容易得到的顯示設(shè)備。但是液晶顯示器體積較大,移動不方便,限制了用戶的活動范圍。頭戴式顯示器,佩戴于用戶的頭部,這種顯示器本身提供了一路或兩路攝像機(jī),采用視頻合成技術(shù),為用戶提供場景的顯示。但是頭戴式顯示器在戶外長時間佩戴很不舒服,因此也不能為用戶廣泛接受。手持式顯示器,較頭戴式顯示器稍有改進(jìn),但是也限制了用戶手部的活動。投影式顯示器能夠?qū)鼍巴队暗捷^大范圍的環(huán)境中,位置固定,適合于室內(nèi)的AR系統(tǒng)。
3.2 定位技術(shù)
增強(qiáng)現(xiàn)實(shí)系統(tǒng)需要將虛擬的物體準(zhǔn)確地放置到真實(shí)的場景中,因此定位技術(shù)顯得尤為重要。目前的定位技術(shù)主要分為兩種:一種是基于硬件的定位技術(shù);一種是基于計算機(jī)視覺技術(shù)的定位技術(shù)。
基于硬件的定位技術(shù)一般使用硬件設(shè)備定位,主要包括:全球衛(wèi)星定位系統(tǒng)、測距儀、導(dǎo)航儀、機(jī)械裝置等。
基于計算機(jī)視覺的定位技術(shù)一般是從真實(shí)場景中獲得一幅或多幅圖像,根據(jù)圖像中的信息,計算出攝像機(jī)和圖形中物體的相對信息,最終恢復(fù)出三維場景的結(jié)構(gòu),從而達(dá)到定位的目的。
基于計算機(jī)視覺的定位技術(shù)主要包括以下幾種:
(1)單視圖法:在一幅圖像中找到六個以上特征點(diǎn)進(jìn)行跟蹤,通過已知的特征點(diǎn)的三維坐標(biāo)和其成像坐標(biāo)進(jìn)行定位。
(2)多視圖法:從多個角度拍攝場景,根據(jù)常用的角點(diǎn)檢測法,檢測多幅圖像的角點(diǎn)并進(jìn)行匹配,從而計算出真實(shí)場景中物體的景深,最終實(shí)現(xiàn)定位。
(3)運(yùn)動目標(biāo)的序列圖像:根據(jù)序列圖像估算運(yùn)動目標(biāo)的各項參數(shù)。
(4)模板匹配法:從多個視角出發(fā)尋找真實(shí)圖像中的物體作為模板數(shù)字化圖像,繼而將虛擬物體疊加到真實(shí)場景。
3.3 虛實(shí)融合技術(shù)
增強(qiáng)現(xiàn)實(shí)技術(shù)中的虛擬融合主要指虛擬物體在真實(shí)場景中的配準(zhǔn),以及虛擬物體與真實(shí)場景的一致性。
在增強(qiáng)現(xiàn)實(shí)系統(tǒng)的實(shí)現(xiàn)過程中,一致性是一個關(guān)鍵性問題。虛實(shí)融合的一致性包括動態(tài)一致性和靜態(tài)一致性。其中,動態(tài)一致性通常指場景的實(shí)時繪制,跟蹤過程中虛擬物體和真實(shí)場景的空間位置的一致性等;靜態(tài)一致性通常指虛擬物體與真實(shí)場景外觀的一致性變化等。
另一方面,為了實(shí)現(xiàn)很好的虛實(shí)融合效果,必須對拍攝真實(shí)場景的相機(jī)進(jìn)行標(biāo)定,并與繪制虛擬物體的虛擬相機(jī)參數(shù)進(jìn)行匹配。攝像機(jī)標(biāo)定主要是對攝像機(jī)的內(nèi)外參數(shù)的確定。目前,攝像機(jī)標(biāo)定技術(shù)已經(jīng)較為成熟,主要可以分為三類:傳統(tǒng)的標(biāo)定法,如張正友標(biāo)定法;自標(biāo)定法,如基于Kruppa方程的自標(biāo)定法;基于主動視覺的標(biāo)定法,如基于射影重建的標(biāo)定法。三類標(biāo)定法各有利弊,并沒有一種可以普遍適用,因此攝像機(jī)標(biāo)定技術(shù)仍是一個研究重點(diǎn)。
3.4 用戶交互技術(shù)
人們總是向往能夠使用自然的方式和虛擬的物體交互,但這是十分困難的,增強(qiáng)現(xiàn)實(shí)系統(tǒng)根據(jù)跟蹤定位獲得的有關(guān)真實(shí)場景的信息對虛擬物體發(fā)出指令。目前,交互技術(shù)主要使用以下三種方式:
(1)在場景中選擇一個或多個特征點(diǎn)作為標(biāo)記點(diǎn),這是增強(qiáng)現(xiàn)實(shí)系統(tǒng)中最基本的交互方式。
(2)使用計算機(jī)識別出人或物體的姿態(tài),進(jìn)而交互操作。
(3)制作特殊工具,能夠通過按鍵等簡單方式觸發(fā)事件。
4 結(jié)束語
本文總結(jié)了現(xiàn)階段增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用領(lǐng)域,并對其涉及到的關(guān)鍵技術(shù)進(jìn)行了闡述。增強(qiáng)現(xiàn)實(shí)技術(shù)作為一個多學(xué)科交叉的研究領(lǐng)域,必將飛速發(fā)展,更多的融入到我們的生活中。
參考文獻(xiàn):
[1]紀(jì)慶革,潘志庚,李祥晨.虛擬現(xiàn)實(shí)在體育體育仿真中的應(yīng)用綜述[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2003,15(11):1333-1338.
[2]陳靖,王涌天,閆達(dá)遠(yuǎn).增強(qiáng)現(xiàn)實(shí)系統(tǒng)及其應(yīng)用[J].計算機(jī)工程與應(yīng)用,2001,15:72-75.
[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.
近年來,計算機(jī)視覺在安防領(lǐng)域的應(yīng)用正備受關(guān)注,身份識別是核心問題。人臉識別是一種基于臉部特征信息進(jìn)行身份識別的技術(shù),人臉檢測是其中的基礎(chǔ)和關(guān)鍵部分。介紹了四種不同的人臉檢測技術(shù),分析了相關(guān)的算法和理論,概述了各自的優(yōu)缺點(diǎn)。最后,討論了人臉檢測技術(shù)今后的研究方向及發(fā)展趨勢。
【關(guān)鍵詞】計算機(jī)視覺 身份識別 人臉檢測
1 人臉檢測問題綜述
在國土安全和社會安全問題日益突顯的背景下,世界各國家都對安防領(lǐng)域進(jìn)行不遺余力地投入。隨著計算機(jī)視覺技術(shù)的不斷發(fā)展,基于生物特征識別的身份識別技術(shù)受到人們的廣泛關(guān)注,在未來一段時間內(nèi)生物識別技術(shù)將成為信息產(chǎn)業(yè)的一次革命。其中人臉識別技術(shù)作為一種極具潛力的生物識別方式,以其識別速度快,主動性強(qiáng),性價比高等顯著的技術(shù)優(yōu)勢,在各個領(lǐng)域都體現(xiàn)出了巨大的商業(yè)價值和社會價值。
人臉檢測是人臉識別的前提和關(guān)鍵,一般采用相機(jī)實(shí)時采集含有人臉的圖像或視頻流,并自動在圖像中對人臉進(jìn)行檢測和跟蹤。人臉的自動檢測是一項頗有難度的工作,主要體現(xiàn)在:(1)不同族群年齡等問題導(dǎo)致人臉的差異性。(2)人臉上的胡須等附屬物對檢測造成的干擾。(3)人體姿態(tài)變化和遮擋物存在對檢測的影響。(4)環(huán)境和硬件條件對圖像采集效果的影響。針對這些問題,國內(nèi)外著名高校和科研機(jī)構(gòu)進(jìn)行了很多相關(guān)的研究,致力于解決在復(fù)雜背景下如何準(zhǔn)確高效地進(jìn)行人臉檢測的問題。
2 實(shí)現(xiàn)人臉檢測的相關(guān)技術(shù)
根據(jù)近年來計算機(jī)視覺領(lǐng)域人臉檢測問題的研究進(jìn)展,本文在這里進(jìn)行總結(jié)性綜述,目前人臉檢測的方法可以分為基于知識和統(tǒng)計兩類,有以下四種常用的檢測算法。
2.1 模板匹配
模板匹配可以分成固定模板和變形模板。固定模板指的是根據(jù)先驗(yàn)數(shù)據(jù)歸納出一個統(tǒng)一的模板,然后根據(jù)一個能量函數(shù)確定被檢測區(qū)域中和模板相關(guān)程度較高的位置,即人臉位置。由于不同人物之間臉部的差異性很大,加上環(huán)境等因素的影響,此方法并不具有很強(qiáng)的實(shí)用性。變形模板原理上和固定模板的操作方式相同,不過變形模板自身的參數(shù)模型在一定范圍內(nèi)具有可變性,因此檢測的動態(tài)范圍更大,檢測效果相對較好一些。
2.2 樣本學(xué)習(xí)
由于人臉的復(fù)雜性,顯式描述十分困難,因此基于統(tǒng)計模式的檢測方法受到了人們的廣泛關(guān)注。此方法將人臉看做一種模式,通過對大量樣本圖像的機(jī)器學(xué)習(xí)完成分類器的構(gòu)造,利用分類器實(shí)現(xiàn)對人臉的檢測判別,在這里問題被轉(zhuǎn)化為模式識別中的二分類的形式。
首先,需要建立一個樣本空間,其中包括“人臉”和“非人臉”的正負(fù)兩種樣本,對樣本圖片歸一化處理后,順序展開后進(jìn)行主分量分解,在大量樣本形成的高維矩陣中計算其特征值和特征向量,然后采用一定的學(xué)習(xí)機(jī)制在特征空間中建立分類,以此可得到用來檢測樣本圖片是否為人臉的正負(fù)判別規(guī)則式,二者為互斥關(guān)系。此檢測方法具有較高的準(zhǔn)確度,但是需要大量的正負(fù)樣本圖片,MIT等一些高校和研究機(jī)構(gòu)建立了開放的人臉庫。
2.3 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(ANN )是將模式的統(tǒng)計特性包含在ANN的結(jié)構(gòu)和參數(shù)中,對于人臉這類復(fù)雜的、難以顯式描述的抽象型模式,這一檢測方法具有其自身特別的優(yōu)勢。
神經(jīng)網(wǎng)絡(luò)方法本質(zhì)上也是基于樣本學(xué)習(xí),首先使用經(jīng)過預(yù)處理的“人臉”樣本以及采用“自舉”方法收集分類器錯分的樣本作為正負(fù)樣本訓(xùn)練各個ANN,然后根據(jù)結(jié)果進(jìn)一步對分類器進(jìn)行修正,構(gòu)造多層感知器(MLP)網(wǎng)絡(luò)作為分類器對人臉進(jìn)行檢測。人工神經(jīng)網(wǎng)絡(luò)是并行分布式系統(tǒng),采用了與傳統(tǒng)人工智能和信息處理技術(shù)不同的原理,模擬大腦神經(jīng)網(wǎng)絡(luò)處理、記憶信息的方式進(jìn)行目標(biāo)檢測。神經(jīng)網(wǎng)絡(luò)模型克服了傳統(tǒng)的基于算數(shù)邏輯符號的人工智能在處理直覺、非結(jié)構(gòu)化信息方面的缺陷,具有自適應(yīng)、自組織和實(shí)時學(xué)習(xí)的特點(diǎn),應(yīng)用在人臉檢測問題中性能表現(xiàn)突出。
2.4 基于隱馬爾可夫模型
隱馬爾可夫模型(HMM)是一種雙重隨機(jī)過程,一種是有限狀態(tài)的馬爾可夫鏈,另一種是序列的觀察值。由于只能通過觀察值得到馬爾可夫鏈的狀態(tài),因此稱之為隱馬爾可夫模型。對于人臉而言,可以把它分為前額、眼睛、鼻子、嘴巴、下巴五個部分來檢測。根據(jù)這五個區(qū)域位置順序不變性,可以分別用相應(yīng)的觀察向量序列檢測每一個部分,使用一個包含五個狀態(tài)的一維連續(xù)HMM來表示人臉。接著對各塊進(jìn)行KL變換,提取每塊一些最大的特征向量作為觀察值對HMM進(jìn)行訓(xùn)練。此后,還提出了一種嵌入式隱馬爾可夫模型,該方法除了將人臉劃分為五塊外,還在每塊中從左至右嵌入了一個HMM。接著進(jìn)行二維DCT變換,把變換后得到的系數(shù)作為訓(xùn)練值。
3 結(jié)束語
人臉檢測是個發(fā)展很快的研究方向,人臉檢測技術(shù)的發(fā)展趨勢是利用多特征,多種分類方式進(jìn)行啟發(fā)式知識與統(tǒng)計學(xué)習(xí)方法的結(jié)合,未來對人臉檢測的研究將會更注重其實(shí)時的應(yīng)用,這就對檢測算法的效率提出了更高的要求。另外,可以消除光照對人臉成像影響的紅外人臉識別技術(shù),加入相互對比機(jī)制的包含正臉、側(cè)臉三維信息的人臉三維模型重建檢測技術(shù)也正在研究當(dāng)中。隨著技術(shù)的不斷進(jìn)步和市場逐漸的規(guī)范化,人臉檢測識別技術(shù)會越來越多地應(yīng)用于社會的各個領(lǐng)域,在促進(jìn)社會發(fā)展的同時方便人們的生活。
參考文獻(xiàn)
[1]許燕,王維蘭.基于視覺運(yùn)動人臉檢測技術(shù)的研究[J].計算機(jī)仿真, 2014(1):434-437.
[2]孫寧,鄒采榮,趙力.人臉檢測綜述[J].電路與系統(tǒng)學(xué)報,2006,11(6):101-108.
作者簡介
姚坤(1990-),男,現(xiàn)為聊城大學(xué)物理科學(xué)與信息工程學(xué)院碩士研究生,主要研究方向?yàn)闄C(jī)器視覺。
一、超聲醫(yī)學(xué)圖像處理方法
1.1計算機(jī)的視覺
我國的計算機(jī)視覺處理手法與醫(yī)學(xué)影像研究處理方法的結(jié)合一直是一個重點(diǎn)研究課題,同時也對我國傳統(tǒng)的醫(yī)學(xué)圖像處理技術(shù)的發(fā)展產(chǎn)生了重要影響。在我國的計算機(jī)視覺領(lǐng)域目前已經(jīng)研究總結(jié)了大量有價值的研究方法和研究技術(shù)。
1.1.1圖像濾波
超聲的圖像濾波應(yīng)用主要作用在于過濾掉斑點(diǎn)噪聲。斑點(diǎn)噪聲主要是因?yàn)槿梭w內(nèi)存在很多實(shí)際尺寸小于波長的人體組織機(jī)構(gòu),同時在后向的散射聲波影響下而產(chǎn)生,斑點(diǎn)和噪聲的出現(xiàn)進(jìn)一步降低了在B超成像過程中的實(shí)際圖像對比以及組織內(nèi)可以提取的詳細(xì)信息數(shù)據(jù)。通過調(diào)查研究可以發(fā)現(xiàn),斑點(diǎn)噪聲的模型可以大致劃分為兩個類別:完全性的隨機(jī)模型、長階次非隨機(jī)模型、斷階次非隨機(jī)模型。目前我國已經(jīng)采用的多種超聲成像濾波算法都可以實(shí)現(xiàn)一定程度的噪聲過濾,并沒有哪一個固定的濾波算法可以實(shí)現(xiàn)應(yīng)用最優(yōu)效果發(fā)揮,對于固定的圖像成像分析可以采用多種定性以及定量形式進(jìn)行計算,從而對各類型濾波進(jìn)行對比分析,所以屬于一種可行性較強(qiáng)的應(yīng)用方案[1]。
1.1.2圖像分割
醫(yī)學(xué)的圖像構(gòu)成處理方法研究過程中,圖像分割一直都是其中一個熱門討論課題。主要的圖像分割目標(biāo)在于按照合理的規(guī)則進(jìn)行圖像像素類型劃分。早期的該部分技術(shù)主要有區(qū)域生長以及聚類,主要是借助圖像的灰度信息,但是應(yīng)用此類方法對于灰度值較為相近的兩種類型物品難以區(qū)分,以邊緣檢測的方法進(jìn)行分析需要結(jié)合梯度信息,但是該類型的方法沒有較為敏感的噪聲反應(yīng)度,同時對于邊緣較為模糊的物體提取存在困難,因?yàn)榇蟛糠值漠a(chǎn)科超聲醫(yī)學(xué)計算機(jī)成像質(zhì)量較差,同時在操作過程中的待分割目標(biāo)也較為復(fù)雜,所以需要利用更加多元化的信息處理方法才能取得更好的分割處理效果。形狀先驗(yàn)操作形式是在活動的具體輪廓和活動模型的提出而受到重視,以神經(jīng)網(wǎng)絡(luò)信息計算方法為分割的主要目標(biāo),同時也可以通過學(xué)習(xí)一種合理的分割形式來提高分割效果[2]。
1.2機(jī)器學(xué)習(xí)
在我國的產(chǎn)前超聲醫(yī)學(xué)處理過程中,機(jī)器學(xué)習(xí)都占據(jù)重要的地位并發(fā)揮著重要的作用,主要是因?yàn)闄C(jī)器學(xué)習(xí)促進(jìn)了我國的產(chǎn)前超聲診斷以及智能化發(fā)展,對于部分沒有充足精確度和分析推導(dǎo)較為困難的問題,可以利用實(shí)際案例中的自動學(xué)習(xí)算法提高準(zhǔn)確性。近些年來,我國大部分的超聲成像醫(yī)學(xué)設(shè)備開始應(yīng)用于臨床實(shí)踐中,從而豐富了總體的超聲醫(yī)學(xué)成像數(shù)據(jù)信息資源,進(jìn)而也提高了機(jī)器學(xué)習(xí)在產(chǎn)前超聲的醫(yī)學(xué)應(yīng)用可行性[3]。
二、產(chǎn)前的應(yīng)用
關(guān)鍵詞: 視頻;火焰檢測;運(yùn)動區(qū)域;顏色模型;頻閃
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)22-5303-04
當(dāng)今社會人們的生活、辦公越來越密集化,物資存儲也更加集中,一旦發(fā)生火災(zāi)將會對人們的生命和財產(chǎn)安全造成巨大的威脅,人們對火災(zāi)預(yù)防重視程度不斷加強(qiáng)。傳統(tǒng)的火災(zāi)預(yù)防技術(shù)主要是基于溫度、煙霧的感應(yīng)[1]。這類方法需要在檢測環(huán)境中安裝溫度或者煙霧傳感器,對火災(zāi)的檢測效果往往會受到距離、溫度、粉塵等物理條件的影響[2]。為了克服傳統(tǒng)火災(zāi)檢測系統(tǒng)存在的問題,研究人員提出了基于視頻分析的火災(zāi)檢測技術(shù)。該類方法通過攝像機(jī)獲取監(jiān)控場景中的實(shí)時視頻畫面,利用圖像處理和視頻分析技術(shù)檢測火災(zāi)的發(fā)生,這種非接觸式的檢測方法直觀主動,對監(jiān)控場景具有普適性,可以克服傳統(tǒng)火災(zāi)檢測系統(tǒng)受物理條件限制的缺點(diǎn)[3]。文獻(xiàn)[4]結(jié)合火焰顏色統(tǒng)計模型和序列模式挖掘的方法,能夠檢測出一幅圖像中的火焰,文獻(xiàn)[5]利用視頻中火焰區(qū)域的火焰顏色概率模型、火焰區(qū)域的形狀以及火焰外形的變化規(guī)律來檢測火災(zāi)的發(fā)生。文獻(xiàn)[6] 采用一種基于色覺和無序性測量的RGB模型來檢測火焰和煙霧,而文獻(xiàn)[7]則是通過在HIS顏色空間下使用直方圖特征分割的方法來判斷是否有火災(zāi)發(fā)生。
為了提高火焰檢測的效率和準(zhǔn)確率,該文首先通過運(yùn)動檢測算法提取出視頻中運(yùn)動的區(qū)域,進(jìn)一步使用火焰顏色模型來選擇出候選區(qū)域,最后根據(jù)火焰的頻閃特性建立簡化的火焰頻閃模型,進(jìn)一步濾除非火焰區(qū)域,提高檢測精度。
1 運(yùn)動區(qū)域提取
運(yùn)動區(qū)域提取的目的是將不斷運(yùn)動的區(qū)域從背景圖像中提取出來,是視頻分析算法的關(guān)鍵基礎(chǔ)環(huán)節(jié),是目標(biāo)定位、識別和跟蹤的前提[8]。
眾所周知,由于受到氣流等因素的影響,火焰在燃燒過程中會持續(xù)不斷的運(yùn)動,該文先使用ViBe(Visual Background Extractor)[9]算法提取出視頻中的運(yùn)動區(qū)域,縮小檢測范圍,提高火焰檢測的效率和精度。
ViBe算法由Olivier Barnich和Marc Van Droogenbroeck于2011年提出,是一種像素級視頻運(yùn)動提取算法,由于它計算簡單,效率較高,能夠較準(zhǔn)確的提取出完整目標(biāo),且占用硬件資源較少,目前得到了廣泛的應(yīng)用。ViBe算法是一種基于統(tǒng)計背景模型的運(yùn)動區(qū)域檢測算法,其基本流程如圖1。算法首先根據(jù)第一幀圖像建立背景模板,圖像的每個像素點(diǎn)在背景模版中都有一個維數(shù)為N的樣本集合,初始化時樣本集合里的值從每個像素點(diǎn)的R[×]R鄰域內(nèi)隨機(jī)抽取。對后續(xù)圖像幀的處理包含匹配和背景更新兩個部分。匹配過程中計算當(dāng)前像素點(diǎn)與其樣本集合中的元素值在顏色空間中的距離,并統(tǒng)計距離小于一定閾值D的元素個數(shù),當(dāng)個數(shù)大于一定閾值T,則判定該像素點(diǎn)為背景點(diǎn),否則判定其為前景點(diǎn)。對判定為背景點(diǎn)的像素要更新對應(yīng)的樣本集合,首先隨機(jī)抽取NUM個樣本集合中的元素,將其值更新為當(dāng)前像素的值。由于視頻幀中的像素點(diǎn)與其鄰域內(nèi)的像素點(diǎn)具有一定的相關(guān)性,所以要隨機(jī)對其鄰域內(nèi)的一個像素點(diǎn)進(jìn)行背景更新。ViBe算法的檢測結(jié)果如圖2。
2 火焰顏色檢測
火焰在一般背景下會呈現(xiàn)出明顯的高亮度,其獨(dú)特的顏色在不同的色彩空間(RGB、HSV等)都具有特定的分布[10]。該文在上述ViBe算法的基礎(chǔ)上利用火焰顏色特性來去除運(yùn)動區(qū)域中非火焰區(qū)域,提高檢測精度。該文使用的火焰顏色分布如下:
3 火焰頻閃模型
火焰在燃燒過程中由于湍流流動導(dǎo)致火焰,即火苗的無序閃動,具體表現(xiàn)為一種持續(xù)的高頻時序變化,研究者們還發(fā)現(xiàn)這種無序閃動具有與燃料和燃器形狀無關(guān)的動態(tài)范圍(10Hz以內(nèi))[11]。文獻(xiàn)[12]采用火焰顏色像素沿時間軸的一維傅里葉變換來檢測火焰的頻閃特性,計算較為復(fù)雜。該文根據(jù)火焰的頻閃特性,統(tǒng)計像素點(diǎn)在固定時域范圍內(nèi)的變化次數(shù),建立一個簡化的火焰頻閃模型。具體算法如下:
1) 建立一個大小為[TIME]的火焰頻閃模型,模型中每個元素為一幅二值圖像,圖像的分辨率與原圖相同,每個像素點(diǎn)表示原圖中該像素點(diǎn)是否發(fā)生變化。
2) 通過ViBe算法獲得第[n]幀圖像的運(yùn)動區(qū)域,與第[n-1]幀圖像的運(yùn)動區(qū)域進(jìn)行比較,獲取當(dāng)前圖像中像素點(diǎn)的變化情況,存入火焰頻閃模型。若1
3) 設(shè)置計數(shù)器[DiffCnt],初始為0,通過火焰頻閃模型獲取當(dāng)前幀運(yùn)動區(qū)域中各個像素點(diǎn)在[TIME]幀內(nèi)的變化次數(shù)[t],若[Tmin]
4) 計算[DiffCnt]與運(yùn)動區(qū)域大小的比值,大于一定的閾值[Alpha],則認(rèn)為當(dāng)前運(yùn)動區(qū)域符合火焰頻閃特性。若視頻未結(jié)束,則跳轉(zhuǎn)(2)。
火焰頻閃模型實(shí)驗(yàn)結(jié)果如圖4,其中[TIME]、[Tmin]、[Tmax]、[Alpha]的取值分別為25、5、15、0.5。
4 實(shí)驗(yàn)結(jié)果
為了驗(yàn)證算法的效果,該文采用了不同環(huán)境下的測試視頻進(jìn)行了實(shí)驗(yàn),結(jié)果如圖5。實(shí)驗(yàn)使用的硬件環(huán)境為:CPU為Pentium? Dual-CoreE6700(主頻為3.2GHz),內(nèi)存2GB,軟件平臺為:操作系統(tǒng)為Windows 7(32位),使用C++語言在Microsoft Visual Studio 2010進(jìn)行編程,調(diào)用OpenCv圖像處理庫。實(shí)驗(yàn)中所用的測試視頻分辨率均為320[×]240。通過上述實(shí)驗(yàn)可以發(fā)現(xiàn)本文提出的算法能夠在不同環(huán)境下檢測出火焰的發(fā)生,且執(zhí)行效率較高,實(shí)驗(yàn)處理一幀圖像平均只需要5ms。但是在復(fù)雜環(huán)境下,該方法也會產(chǎn)生錯誤檢測。
5 總結(jié)
本文通過結(jié)合火焰的運(yùn)動特性、顏色特征以及頻閃特性,提出了一種簡單高效的視頻火焰檢測算法,能夠在不同環(huán)境下檢測出火焰的發(fā)生,具有一定的實(shí)際應(yīng)用價值。但是由于實(shí)際環(huán)境的復(fù)雜性以及算法本身存在的缺陷,該文提出的方法也會產(chǎn)生一些錯誤的檢測。未來的研究工作中準(zhǔn)備進(jìn)一步分析算法錯誤檢測的情況,繼續(xù)提高算法的準(zhǔn)確率。
參考文獻(xiàn):
[1] 袁非牛,廖光煊,張永明,等.計算機(jī)視覺火災(zāi)探測中的特征提取[J]. 中國科學(xué)技術(shù)大學(xué)學(xué)報,2006,36(1):39-43.
[2] 楊俊,王潤生.基于計算機(jī)視覺的視頻火焰檢測技術(shù)[J].中國圖像圖形學(xué)報,2008,13(7):1222-1234.
[3] 高愛蓮.基于視頻的火焰檢測方法研究[D].昆明理工大學(xué),2008.10.
[4] Yu-Chiang Li,Wei-Cheng Wu.Visual Fire Detection Based on Data Mining Technique[C].2011 First International Conference on Robot, Vision and Signal Processing,2011(11):238-331.
[5] Che-Bin Liu and Ahuja N.Vision Based Fire Detection[J]. Proceedings of the 17th International Conference on Pattern Recognition,2004(8):134-137.
[6] Thou-Ho Chen, Ping-Hsueh Wu, and Yung-Chuen Chiou. An Early Fire-Detection Method Based on Image Processing[C]. 2004 International Conference on Image Processing, 2004(10):1707-1710.
[7] 陳威,劉菁華. 顏色直方圖特征分割方法在火災(zāi)探測中的應(yīng)用[J].計算機(jī)技術(shù)與發(fā)展,2011,21(7):199-202.
[8] 侯宏錄,李寧鳥,劉迪迪,等.智能視頻監(jiān)控中運(yùn)動目標(biāo)檢測的研究[J].計算機(jī)技術(shù)與發(fā)展,2012,22(2):49-52.
[9] Barnich O ,Van Droogenbroeck M. ViBe: A Universal Background Subtraction Algorithm for Video Sequences[C]. IEEE Transactions on Image Processing, 2011(6):1709-1724.
[10] 楊俊,王潤生.基于計算機(jī)視覺的視頻火焰檢測技術(shù)[J].2008,13(7):1222-1234.
(1.第二炮兵士官學(xué)校103教研室,山東青州262500;2.第二炮兵士官學(xué)校202教研室,山東青州262500)
摘要:尺度不變局部特征以其良好的尺度、旋轉(zhuǎn)和光照不變性,在計算機(jī)視覺、目標(biāo)識別、三維圖像重構(gòu)等領(lǐng)域中得到了廣泛的應(yīng)用。本文在大量試驗(yàn)數(shù)據(jù)的基礎(chǔ)上,總結(jié)了目前常用的幾種尺度不變特征匹配算法的性能,比較得出各種算法的優(yōu)缺點(diǎn)及其適用領(lǐng)域,并指出尺度不變局部特征檢測算法的研究和發(fā)展趨勢。
關(guān)鍵詞:局部特征;尺度不變;圖像匹配;特征檢測
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A文章編號:1007-9599 (2011) 09-0000-01
Scale-invariant Local Feature Detection Algorithm Study
Cao Juan1,Zhao Xuyang1,Mi Wengpeng2,Hong Chenghua1
(1.Teaching and Research Section103,the PLA Second Artillery Academy,Qingzhou262500,China;2.Teaching and Research Section202,the PLA Second Artillery Academy,Qingzhou262500,China)
Abstract:Scale invariant feature is famous for its wonderful scale invariance,rotation invariance and illumination invariance,which is widely used in computer vision,object categorization,3D image retrieval and so on.Proved by a large number of experiment dates,performance comparisons among the common scale invariant detectors showed us the advantage,disadvantage of each detector in this paper,which can help the new researchers to follow the right way according to their specific requirements.In the end,this paper indicates the developing trend of scale invariant detectors.
Keywords:Local feature;Scale invariant;Image matching;Feature detection
圖像匹配技術(shù)是計算機(jī)視覺、三維圖像標(biāo)定、目標(biāo)識別以及景象匹配導(dǎo)航和制導(dǎo)等領(lǐng)域中的核心技術(shù)之一。而匹配精度在很大程度上取決于特征檢測算子的定位精度。尺度不變特征檢測算法是一種對尺度變化具有良好的協(xié)變特性的算法,對于存在比例變化圖像,可以提供較高的特征點(diǎn)定位精度,為后續(xù)的匹配處理奠定良好的基礎(chǔ)。本文總結(jié)了目前常用的幾種尺度不變局部特征檢測算法,并從實(shí)際應(yīng)用的角度出發(fā),對比各種算法的優(yōu)缺點(diǎn),為工程應(yīng)用中尺度不變算法的選擇提出了建設(shè)性的意見。
一、尺度不變特征檢測算法
尺度不變特征檢測算法的理論基礎(chǔ)來源于尺度空間理論。該理論最早出現(xiàn)于計算機(jī)視覺領(lǐng)域,目的是模擬圖像數(shù)據(jù)的多尺度特征[1],其主要思想是利用尺度空間高斯核與原圖像的卷積對原始圖像進(jìn)行尺度變換,獲得圖像在多尺度下的尺度空間表示序列,通過大尺度下的模糊輪廓和小尺度下的精細(xì)結(jié)構(gòu)等一系列的圖像信息對原始圖像進(jìn)行表達(dá)。目前使用得較多的尺度不變特征檢測算子主要有DOG[2][3][4]、Harris-Laplace[5][6]、Hessian-Laplace[5][7]。下面分別對這些檢測算子進(jìn)行介紹:
(一)DOG。DOG檢測的思想最早是由Crowley和Parker于1984年提出來的。1999年Low改進(jìn)了此方法,并將其應(yīng)用于目標(biāo)識別領(lǐng)域。該算法首先通過對高斯尺度空間的采樣,建立高斯金字塔。高斯金子塔采樣分階,階內(nèi)又分層的結(jié)構(gòu)。每階每層都代表不同尺度值平滑后的高斯圖像,隨著階數(shù)和階內(nèi)層數(shù)的增加尺度值逐漸增大。其金字塔特性體現(xiàn)在不同階處理的圖像大小不同,通過對降維采樣,階數(shù)越高則處理的圖像越小。然后算法對高斯金字塔的相鄰層相減,得到DOG金字塔,其每層的尺度保持為減數(shù)的尺度。這種提取方法以及參數(shù)使得特征點(diǎn)具有很強(qiáng)的旋轉(zhuǎn)和尺度不變特性,并且對于光照、噪聲以及仿射變化都具有一定的魯棒性。(二)Harris-Laplace。該算子將Harris檢測算子的可靠性與自動尺度選擇相結(jié)合,使檢測出的特征點(diǎn)具有尺度不變性。Harris檢測算子以二階動差矩為基礎(chǔ),該矩陣具有旋轉(zhuǎn)不變性,但是要使得它能獨(dú)立于圖像分辨率的變化還需要適應(yīng)尺度變化。本算法通過將基于圖像灰度值的二階動差矩變?yōu)榛诟咚箍臻g的矩陣,構(gòu)造具有尺度適應(yīng)性的二階動差矩,利用該多尺度表達(dá)式來檢測潛在的特征點(diǎn)。然后對于每個潛在的特征點(diǎn),計算其Laplace-of-Gaussian函數(shù)值隨著尺度的變化的響應(yīng)圖像,該圖像的局部極大值點(diǎn)所對應(yīng)的尺度即為特征尺度。對于在選擇的尺度范圍內(nèi)LOG響應(yīng)沒有極值點(diǎn)以及響應(yīng)值低于某個閾值的點(diǎn)則去除。這樣對于滿足要求的興趣點(diǎn),則以其位置和特征尺度對其進(jìn)行標(biāo)注,由此可見Harris-laplace算法提取出的這樣的特征點(diǎn)則具有尺度和旋轉(zhuǎn)不變性。(三)Hessian-Laplace。與Harris-Laplace類似,Hessian-Laplace也是通過兩個度量分別檢測興趣點(diǎn)的位置和尺度的;所不同的是在進(jìn)行興趣點(diǎn)空間定位時,使用尺度歸一化Hessian矩陣的行列式最為度量。研究表明基于Hessian矩陣的檢測算子比基于二階動差矩的算子更穩(wěn)定,特征點(diǎn)的重復(fù)率更高。由于Hessian矩陣可以產(chǎn)生更少的拉伸以及錯誤定位的結(jié)構(gòu),所以Hessian-Laplace特征檢測算子在穩(wěn)定性和速度上都略高于Harris-Laplace。(四)顯著區(qū)域檢測算子(The salient region detector)。2001年,Kadir,T.和Brady,M.提出了顯著性區(qū)域檢測算子。該算子計算以像素點(diǎn)為中心的圓形區(qū)域的灰度值的概率密度函數(shù)(Probability Density Function),然后利用香農(nóng)熵來定義局部區(qū)域灰度值分布的復(fù)雜性,并將其作為顯著性度量,選擇香農(nóng)熵極值點(diǎn)所對應(yīng)的尺度作為特征尺度,并計算當(dāng)前點(diǎn)特征尺度下的顯著度。檢測算子通過比較不同點(diǎn)的顯著度,將其分為不同的等級,并選出最具有代表性的點(diǎn)作為特征點(diǎn)。
二、性能比較
上述幾種檢測算法都是典型的尺度不變特征檢測算法,同時兼具旋轉(zhuǎn)不變性,對于圖像光照變化、背景噪聲以及視角變化引起的仿射、透視變換均具有一定程度上的魯棒性。然而由于不同的檢測算子使用的尺度空間度量函數(shù)不同,所以具有不同的個性化表現(xiàn)。檢測算法評估顯示在尺度變化的情況下,Hessian-Laplace具有最高的點(diǎn)重復(fù)率和定位精度,Harris-Laplace以及DOG算法次之,但是DOG算法的運(yùn)算速度是三者中最快的,是Hessian-Laplace的兩倍,Harris-Laplace的十倍。Harris-Laplace以及Hessian-Laplace對于角點(diǎn)和高度紋理化的點(diǎn)最敏感,而DOG則更適合于處理結(jié)構(gòu)化圖像;顯著區(qū)域檢測算法在速度和定位精度上都相對較差,但是在物體分類識別領(lǐng)域中展現(xiàn)出優(yōu)良的性能。
三、小結(jié)
尺度不變特征以其優(yōu)良的魯棒性成為當(dāng)前特征匹配算法研究中的熱點(diǎn)。其中,DOG算子適用于實(shí)時性要求較高的場合,Hessian-Laplace適用于對定位精度要求較嚴(yán)格的場合,Harris-Laplace適用于紋理圖像,而顯著區(qū)域檢測算法適用于對實(shí)時性要求較低的物體分類識別領(lǐng)域??偟膩碚f,目前尺度不變特征檢測算子運(yùn)算速度相對比較慢,滿足不了景象匹配導(dǎo)航和制導(dǎo)等對實(shí)時性要求高的領(lǐng)域的要求,如何改進(jìn)現(xiàn)有算法的,在不降低精度的情況下提高算法速度,或以精度的略微下降換取速度的較大提高,是目前檢測算子研究的熱點(diǎn);同時尋找新的更簡單局部特征(如圖像的飽和度等),開發(fā)新的特征檢測算子以及檢測算子的硬件實(shí)現(xiàn)也是值得深入研究的方向。
參考文獻(xiàn):
[1]FaugerasO,Robert L.What can two images tell us about the third one[C].Proceedings of the Europe Conference on Computer Vision,1994
[2]Crowley J,Parker,A.A representation for shape based on peaks and ridges in the difference of low pass transform.IEEE Transactions on Pattern Analysis and Machine Intelligence,1984,6(2):156C170
[3]Lowe D.G.Object recognition from local scale-invariant features.In Proceedings of the 7th International Conference on Computer Vision,1999,1150C1157
[4]Lowe D.G..Distinctive Image Features from Scale-Invariant Keypoints,Int’l puter Vision,2004,60(2):91-110
[5]Krystian Mikolajczyk,Cordelia Schmid.Scale&Affine Invariant Interest Point Detectors.International Journal of Computer Vision.2004,60(1):63-86
關(guān)鍵詞:視頻拼接;跟蹤定位;OPENCV
[基金資助]:全國大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練項目(2013XKCX210)廣西高校科學(xué)技術(shù)研究項目:(2013YB092)
引言
隨著安防向著智能化的進(jìn)一步發(fā)展,越來越多的領(lǐng)域?qū)鹘y(tǒng)意義上的視頻監(jiān)控提出了更多的要求。傳統(tǒng)的監(jiān)控攝像機(jī)多為固定攝像機(jī),監(jiān)控視野狹窄,而且運(yùn)動目標(biāo)容易超出監(jiān)控視野范圍,而不能對其連續(xù)跟蹤,這也就導(dǎo)致了監(jiān)控漏洞的出現(xiàn)。如果能夠建立一種既能全局監(jiān)控掌握整體情況,又能針對感興趣目標(biāo)進(jìn)行跟蹤特寫的系統(tǒng),就可以很好地解決全局監(jiān)控與局部跟蹤不可兼得的難題,因此提出了基于視頻拼接的特寫聯(lián)動系統(tǒng)。
1 介紹OPENCV
OPENCV是一個開源的跨平臺計算機(jī)視覺庫,可以運(yùn)行在Linux、Windows和Mac OS等多個操作系統(tǒng)上。它輕量級而且高效,由一系列 C 函數(shù)和少量 C++ 類構(gòu)成,同時提供了Python、Ruby、MATLAB等語言的接口,實(shí)現(xiàn)了圖像處理和計算機(jī)視覺方面的很多通用算法。
2 圖像拼接
OPENCV提供的專門用于全景拼接的類Stitcher,該類可以對無序的任意張圖片進(jìn)行全景拼接,拼接效果如圖2.1所示。
(a)
圖2.1 Stitcher類的拼接效果
可以看出,效果是十分不錯的。不過在時間的處理上,Stitcher封裝的算法表現(xiàn)的并不令人滿意,對兩張320*240的JPG圖像,花費(fèi)了9968毫秒才完成了拼接。所以這個類也只適合用來做圖片的拼接,想要在視頻中做實(shí)時的拼接處理是不可能的。
3 視頻拼接
Stitcher封裝的算法,除了時間,其他各方面都令人滿意。假如需要將其運(yùn)用到視頻拼接上,以每秒播放20幀為例,速度需要提高100多倍,光優(yōu)化代碼是不現(xiàn)實(shí)的。
不過經(jīng)過對Stitcher類的詳細(xì)了解,可以對拼接兩張圖片的條件進(jìn)行總結(jié),就是相機(jī)參數(shù)和img_mask圖片。也就是說,不需要每一次都計算這兩個東西,只需要提取視頻的第一幀進(jìn)行拼接,然后保存這兩個參數(shù),視頻之后的所有幀直接用就行了。OPENCV提供了Stitcher所有的C源代碼,對應(yīng)的拼接算法封裝在estimateTransform和composePanorama函數(shù)中。只需要將這兩個函數(shù)融合成一個,將其中涉及到相機(jī)參數(shù)(代碼中定義為cameras_)和img_mask圖片(代碼中定義為mask_warped)的變量轉(zhuǎn)換成Stitcher類的變量,然后重新定義一個函數(shù),將composePanorama尾部的圖片融入代碼復(fù)制出來就行了。代碼修改后,同樣是320*240的兩張圖片,耗時157毫秒。這樣視頻拼接的功能就可以用Stitcher類來實(shí)現(xiàn)了。
4 跟蹤定位
對圖像場景中的物體進(jìn)行跟蹤,首先需要知道物體是否是活動的。假如物體一直處于不運(yùn)動的狀態(tài),那么這種情況應(yīng)該屬于圖像識別的范疇。如果物體運(yùn)動,必將產(chǎn)生位移,也就是相對于上一幀發(fā)生了像素偏差,然而,圖像背景并沒有移動。這樣一來跟蹤算法顯而易見。
首先需要記錄第一幀的圖像數(shù)據(jù),然后記錄第二幀的圖像數(shù)據(jù),兩幀數(shù)據(jù)圖像做對比,定義如下計算公式:
其中,x,y分別是像素的坐標(biāo),threshold是閾值。一般來說,閾值為零,表示像素沒有發(fā)生位移。不過在實(shí)際情況下,考慮到光線和天氣的影響,像素會在人眼分辨不出來的情況下發(fā)生變化,所以閾值就不同的場景而定。圖片的運(yùn)算結(jié)果如圖4.1所示,考慮到實(shí)際情況,需要對結(jié)果進(jìn)行濾波處理,之后進(jìn)行像素膨脹處理,這兩個步驟主要是將圖像中有明顯位置移動的物體保留下來,過濾掉因光照、天氣產(chǎn)生的噪聲。為了達(dá)到更好的效果,也可以加入對時間的判斷,具體算法可以參見Gary Bradski和Adrian kaebler的learning Opencv[5]的第九章。
5 實(shí)驗(yàn)結(jié)果及分析
實(shí)驗(yàn)結(jié)果基本上每個小章節(jié)的結(jié)尾都已經(jīng)給出,以下給出系統(tǒng)整體運(yùn)行的結(jié)果。本文選用三個校園取景的視頻作為實(shí)驗(yàn)視頻,采用VS2008編譯器,搭建OPENCV2.2.4的環(huán)境,運(yùn)行系統(tǒng)為WINDOWS XP,運(yùn)行效果如圖5.1所示,時間耗費(fèi)如表5.2所示。
圖5.1 拼接及跟蹤的結(jié)果
實(shí)驗(yàn)采用兩個480*360大小的avi視頻,實(shí)時拼接耗時360毫秒,加上跟蹤算法總共消耗386毫秒。實(shí)際應(yīng)用中。從源代碼分析,主要消耗時間的過程有:圖片的重新投影(代碼中定義為warp),耗時109毫秒。投影后的圖片與各自的二值圖像標(biāo)記混合(代碼中定義為feed),耗時32毫秒。所有圖像融合(代碼中定義為blend),耗時47秒。其中wrap和feed執(zhí)行了多次,blend執(zhí)行一次。
6 總結(jié)
本文對視頻拼接的特寫聯(lián)動系統(tǒng)的實(shí)現(xiàn)進(jìn)行了詳細(xì)的介紹。主要通過優(yōu)化OPENCV圖像處理庫來編寫系統(tǒng)程序代碼,通過優(yōu)化Stitcher類算法,從而實(shí)現(xiàn)所需的特定功能。融合了跟蹤算法,有效解決了跨場景跟蹤的難題,有一定的實(shí)用性和研究價值。
參考文獻(xiàn)
[1] MATTHEW BROWN* AND DAVID G LOWE. Automatic Panoramic Image Stitching using Invariant Festures, December 2006
[2] 王小強(qiáng),陳臨強(qiáng),梁旭. 實(shí)時全自動視頻拼接方法, 2011
[3] David G. Lowe. Distanctive Image Festure from Scale-Invariant Keypoints, 2004
[4] Bill Triggs,Philip McLauchlan,Richard Hartley. Bundle Adjustment A modern Synthesis, 2000