時間:2023-09-14 17:44:46
開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇計算機視覺技術,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2015)30-0137-02
21世紀是國際計算機技術高度發展的時代,人們生活中的每個角落都可以看到計算機技術的身影,尤其是現代計算機視覺技術和圖像處理功能發展更加迅猛,各技術分支也逐漸趨于成熟。計算機視覺技術主要指的就是利用智能計算機系統來代替人類的眼睛對現實三維世界進行辨識和理解,整個過程均是計算機自我學習的過程,而隨著這項技術研究的不斷深入,其不再僅僅包含計算機技術科學,同時還涉獵了包括生理學、神經學、物理學、應用數學等多門學科,為人類科技的進步提供了有效的動力。
1 計算機對視頻中運動物體檢測的原理概述
在現代計算機技術基礎下,對視頻當中的運動物體檢測原理主要包括兩種,分別是從微觀和宏觀的角度出發。其中宏觀檢測技術指的是當計算機截取了視頻中的某一個圖像,其以整幅圖像為對象進行檢測;微觀檢測技術是指在截取圖像后,根據實際需求對某一區域內的圖像內容進行檢測。在計算機視覺技術實際應用時,其第一步就是對圖像的采集,第二步是對已經采集的圖像進行預分析處理,如果采用宏觀檢測技術則對圖像整體進行分析;如果采用微觀檢測技術則首先將圖像進行分割,然后對分割后各圖像內容中出現的運動物體影像進行分析。在圖像數據獲取過程中應用的是背景差分法,這一技術主要是將背景和運動物體進行分離提取,以獲取沒有背景圖像的運動物體影像數據。還可以利用幀間差分法,這種方法主要是對一個視頻圖像的逐幀畫面進行差別比較,從而獲得各幀圖像上的差值,而將這些差值幀圖結合起來就是一個物體在計算機視覺下的運動軌跡。現代研究者更傾向于將背景和幀間差分法進行結合運用,這樣可以獲得無背景下的運動物體軌跡,進而提升計算機視覺系統捕捉數據的準確性。
2 OpenCV的應用概述
OpenCV是現代計算機視覺技術當中具有開源性的視覺庫,其最早是由俄羅斯Intel分公司所研發,不僅高效,而且具有兼容的優勢。同時與傳統IPL圖像處理系統相比,OpenCV所處理的圖像數據等級更高,例如在對運動物體進行特征跟蹤、目標分割、運動軌跡分析以及三維模型重建等方面都有著巨大的優勢。
OpenCV本身編輯的源代碼是開放式的,編寫過程簡潔且方便,并且程序中大多數函數已經通過了匯編的最優化,使其能夠更加高效地被應用。在使用OpenCV的攝像機標定模塊已經為用戶設計了實用性較強的接口,并且能夠支持Windows界面的操作平臺,使得這一技術的操作更加簡便。這一技術本身操作簡便,對于編程人員和檢驗人員個人技能素質要求并不高,視覺技術系統研發人員可以利用簡便的操作來檢驗其設想是否能夠實現,這就使得現代計算機視覺技術開發團隊能夠形成更好的協作研發關系,進一步提升技術研究效率。目前已知OpenCV編程系統在航空航天定位、衛星地圖繪制、工廠大規模生產視覺檢測等方面得到了廣泛的應用,同時對于無人飛行器的視覺捕捉技術也有極大的幫助。最為重要的是OpenCV編程語言的兼容性較強,編程人員可以根據自己的意愿對源代碼進行披露,并且國內也已經形成了規模較大的交流社區,給更多同行業者提供答疑解惑的場所,進一步擴大了OpenCV的應用范圍。
3 基于OpenCV的計算機視覺技術
3.1 基于OpenCV下的運動物體檢測技術
在常規運動物體檢測技術下,均是直接通過圖像背景和運動物體的區分來實現運動物體的捕捉。而基于OpenCV下的運動物體檢測技術則不僅能夠針對于圖像背景的分離實現運動物體的觀察,還可通過物體本身特定的信息來進行檢測,主要包括形狀、輪廓以及顏色等。這樣就能夠實現在復雜的背景當中將特定的運動物體完整抽離出來。其基本流程包括:首先,對影像數據當中某一時間點的圖像進行捕捉,然后對這一視頻圖像的格式進行轉化;其次,對轉化格式后的視頻圖像進行早期處理,并將運動物體和復雜的背景區分開,降低周圍各環境因素對運動物體主體圖像的影響;第三,根據完成提取后的運動物體圖像進行辨識,然后再從視頻當中捕捉擁有相同特征的物體,并對該物體進行跟蹤識別。而這一過程的實質則在于先利用圖像捕捉技術對畫面進行截取,然后同時利用背景差分法和幀間差分法對圖像進行分割,逐幀地將運動物體完成提取出來,以供計算機進行視覺跟蹤處理。
3.2 基于OpenCV的圖像預處理技術
一般情況下,計算機視覺處理技術應用的環境情況較為復雜,大多數應用環境當中均有光照的變化,并且部分計算機視覺處理設備還需要在露天環境下進行工作,此時周圍環境中的風、溫度、光照、氣候以及運動物體數量等對視頻圖像的采集均有著極大的影響。環境因素會使圖像采集的質量大幅度降低,同時圖像當中的噪點問題也難以避免,而噪點是視覺捕捉和圖像處理當中最大的影響因素。因此,在基于OpenCV下的計算機視覺技術在捕捉視頻圖像之后先對其進行預處理,然后再由系統對運動物體進行分離、檢測和跟蹤。一般的預處理過程主要包括平滑度濾波、圖像填充、背景實時更新等。
1)圖像的平滑度濾波預處理技術
由于在實際計算機視覺捕捉過程中圖像噪點是難以避免的問題,以此在對圖像中運動物體進行檢測前,應該相對這些噪點進行預處理,降低環境噪聲對圖像的影響。圖像的平滑度濾波處理共分為兩種方式,分別為線性和非線性。其中線性處理方式就是通過計算機處理設備的簡單運算,對圖像當中的噪點進行直接清除,但這一技術使用后會造成截獲圖像模糊不清的情況,因此僅對噪點較少的圖像采用該處理方式;非線性濾波處理則是利用復雜的圖像處理運算,將截獲圖像當中的噪點無限縮小,使其不對圖像整體造成影響,并且可以有效保證圖像的局部調整,但這種處理方式在運算時速度沒有線性濾波處理快,因此需應用在噪點較多,圖像信息較復雜的處理當中。
2)圖像的填充預處理技術
這一處理技術在使用過程中運算速度較慢,主要是由于其需要對逐幀的圖像均進行處理,也包括兩種處理方式,分別為邊緣填充和腐蝕膨脹處理。其中邊緣填充處理主要指的是在確定運動物體之后,利用計算機系統自身的邊緣檢測處理技術,對物體的輪廓進行辨識,并利用形態學上的漫水填充方式對運動物體周圍的噪點進行顏色填充,減小其對畫面整體元素的影響。而腐蝕膨脹處理與邊緣填充處理原理相類似,但這種處理技術主要是針對于噪點進行腐蝕和膨脹,使其在畫面當中所占比例擴大,但對運動物體本身不造成影響,這使運動物體和噪點之間的差異就會更加明顯,就可以將噪點的影響降到最低,但這種處理方法的效果和攝像機本身的性能、質量等有著密切的關聯。
3)背景的實時更新預處理技術
在進行運動物體和背景分離過程中,計算機系統需要對圖像上的背景元素進行辨識,并對其開展初始化處理,這樣就能夠為后期實時背景圖像的差異進行凸顯,以增加前景圖像的效果,降低噪點對圖像的影響。在運用這一技術時,首先要先對第一幀的圖像進行確定,并將第一幀圖像當中的背景圖像元素進行辨識,然后在后期圖像更新和運動物體檢測過程中對背景進行實時更新處理。在更新的過程中其流程主要包括:首先,系統要對所讀取的畫面進行有效的判斷,了解該圖像是否為第一幀;其次,將Opencv處理的圖像轉變為單通道灰度值;第三,對轉變后的圖像進行高斯平滑度濾波處理,將圖像當中的噪點進行去除;第四,采用形態學噪點填充技術對圖像當中的噪點進行二次處理,以獲得所需要更新的背景圖像。
3.3 前景運動物體的提取技術
在計算機視覺技術進行運動物體的檢測時,只有有效保障檢測流程的準確度,才能夠有效保障對前景運動物體的跟蹤效果。其主要分為兩大步驟,其一是對二值化后的圖像數據進行分割處理;其二是在圖像分析前對其進行充分的填充處理,保證前景圖數據的完整性。同時,在前景圖像提取的過程中也分為多個步驟,其包括:首先,對所提出的前景圖像和背景圖像進行差分處理;其次,將差分處理后的圖像二值化處理;第三,對背景當中前景物體的輪廓或邊緣進行辨識,根據前景圖像的輪廓對其進行填充。由于在實際操作過程中,攝像頭所處環境的變化較大,并且會在不同場所內的不同角度捕捉畫面,因此就需要在前景圖像提取時有效提高背景圖像實時更新的效果。
利用閥值二值化的分割方式能夠有效將前景圖像和背景圖像分離開,從而使目標運動物體能夠呈現獨立化,并且閥值分割方式開展前要相對每個像素點進行確定,判斷其是否位于灰度值的范圍內。而將該圖像的像素灰度和閥值進行對比后會出現兩種結果,分別是灰度值低于或高于閥值。在實際應用過程中,有效確定圖像的分割閥值T,就能夠降低環境當中光照因素對圖像質量的影響。
4 計算機視覺技術當中的三維重建技術
1)三維重建的視覺系統
計算機視覺技術在對圖像進行捕捉時可以視為是對大量的圖像信息進行處理,從攝像機的視覺角度出發,其所輸入的圖像一般為二維屬性,但輸出的信息確是三維數據,而這種三維空間數據能夠提升對運動物體所處空間位置、距離等描述的準確性。在三維重建視覺系統工作過程中,其相對基本的圖像數據框架進行確定,然后利用一個坐標點建立2.5D圖像數據,即以此點為視角能夠觀察到的圖像數據,再將2.5D圖像數據進行整合從而建立三維圖像。
2)雙目視覺系統
當人體利用雙眼在不同角度、同一時間內觀察同一個物體時,就可以利用算法來測量該物體和人體之間的距離,而這種方法也被稱為雙目立體感,其應用的原理主要是人體視覺差所帶來的影響。同時利用兩臺攝像機對同一圖像從不同角度進行觀察,就能夠獲得人體雙目觀察后的效果,因此這一三維重建技術也被稱為“雙目視覺系統”。兩臺不同的攝像機即可代表人體雙眼,其對圖像進行逐幀捕獲,但由于角度不同和環境影響因素的差異,因此造成了圖像差異,必須對其捕捉的圖像進行預處理。
3)三維重構算法
在計算機視覺技術中對于視頻流的采集主要依靠的是彩色攝像機、紅外攝像機、紅外接收攝像頭等設備。還可以利用微軟所提供的Kinect設備,在進行運動物體檢測前能夠對NUI進行初始化處理,將系統內函數的參數設定為用戶信息深度圖、彩圖、骨骼追蹤圖等數據。在使用Kinect設備對視頻流進行打開時,其可以遵循三個步驟,其一是彩色和深度數據的處理;其二是根據數據的索引添加顏色信息,并將其引入到深度圖數據當中;其三是骨骼追蹤數據。
5 結束語
計算機視覺捕捉技術是現代計算機應用當中較為先進的內容,其應用范圍較廣,對于運動物體的捕捉準確度較高,能夠有效推進現代計算機模擬技術的發展。
參考文獻:
[1] 張海科.基于Opencv的人手識別與跟蹤定位技術研究與實現[D].昆明: 云南大學,2013.
【關鍵詞】精密測量 計算機視覺圖像 關鍵技術
在現代城市的建設中離不開測量的運用,對于測量而言需要精確的數值來表達建筑物、地形地貌等特征及高度。在以往的測量中無法精準的進行計算及在施工中無法精準的達到設計要求。本文就計算機視覺圖像精密測量進行分析,并對其關鍵技術做以簡析。
1 概論
1.1 什么是計算機視覺圖像精密測量
計算機視覺精密測量從定義上來講是一種新型的、非接觸性測量。它是集計算機視覺技術、圖像處理技術及測量技術于一體的高精度測量技術,且將光學測量的技術融入當中。這樣讓它具備了快速、精準、智能等方面的優勢及特性。這種測量方法在現代測量中被廣泛使用。
1.2 計算機視覺圖像精密測量的工作原理
計算機視覺圖像精密測量的工作原理類似于測量儀器中的全站儀。它們具有相同的特點及特性,主要還是通過微電腦進行快速的計算處理得到使用者需要的測量數據。其原理簡單分為以下幾步:
(1)對被測量物體進行圖像掃描,在對圖像進行掃描時需注意外借環境及光線因素,特別注意光線對于儀器掃描的影響。
(2)形成比例的原始圖,在對于物體進行掃描后得到與現實原狀相同的圖像,在個步驟與相機的拍照原理幾乎相同。
(3)提取特征,通過微電子計算機對掃描形成的原始圖進行特征的提取,在設置程序后,儀器會自動進行相應特征部分的關鍵提取。
(4)分類整理,對圖像特征進行有效的分類整理,主要對于操作人員所需求的數據進行整理分類。
(5)形成數據文件,在完成以上四個步驟后微計算機會對于整理分類出的特征進行數據分析存儲。對于計算機視覺圖像精密測量的工作原理就進行以上分析。
1.3 主要影響
從施工測量及測繪角度分析,對于計算機視覺圖像精密測量的影響在于環境的影響。其主要分為地形影響和氣候影響。地形影響對于計算機視覺圖像精密測量是有限的,基本對于計算機視覺圖像精密測量的影響不是很大,但還是存在一定的影響。主要體現在遮擋物對于掃描成像的影響,如果掃描成像質量較差,會直接影響到對于特征物的提取及數據的準確性。還存在氣候影響,氣候影響的因素主要在于大風及光線影響。大風對于掃描儀器的穩定性具有一定的考驗,如有稍微抖動就會出現誤差不能準確的進行精密測量。光線的影響在于光照的強度上,主要還是表現在基礎的成像,成像結果會直接導致數據結果的準確性。
2 計算機視覺圖像精密測量下的關鍵技術
計算機視覺圖像精密測量下的關鍵技術主要分為以下幾種:
2.1 自動進行數據存儲
在對計算機視覺圖像精密測量的原理分析,參照計算機視覺圖像精密測量的工作原理,對設備的質量要求很高,計算機視覺圖像精密測量儀器主要還是通過計算機來進行數據的計算處理,如果遇到計算機系統老舊或處理數據量較大,會導致計算機系統崩潰,導致計算結果無法進行正常的存儲。為了避免這種情況的發生,需要對于測量成果技術進行有效的存儲。將測量數據成果存儲在固定、安全的存儲媒介中,保證數據的安全性。如果遇到計算機系統崩潰等無法正常運行的情況時,應及時將數據進行備份存儲,快速還原數據。在對于前期測量數據再次進行測量或多次測量,系統會對于這些數據進行統一對比,如果出現多次測量結果有所出入,系統會進行提示。這樣就可以避免數據存在較大的誤差。
2.2 減小誤差概率
在進行計算機視覺圖像精密測量時往往會出現誤差,而導致這些誤差的原因主要存在于操作人員與機器系統故障,在進行操作前操作員應對于儀器進行系統性的檢查,再次使用儀器中的自檢系統,保證儀器的硬件與軟件的正常運行,如果硬軟件出現問題會導致測量精度的誤差,從而影響工作的進度。人員操作也會導致誤差,人員操作的誤差在某些方面來說是不可避免的。這主要是對操作人員工作的熟練程度的一種考驗,主要是對于儀器的架設及觀測的方式。減少人員操作中的誤差,就要做好人員的技術技能培訓工作。讓操作人員有過硬過強的操作技術,在這些基礎上再建立完善的體制制度。利用多方面進行全面控制誤差。
2.3 方便便攜
在科學技術發展的今天我們在生活當中運用到東西逐漸在形狀、外觀上發生巨大的變大。近年來,對于各種儀器設備的便攜性提出了很高的要求,在計算機視覺圖像精密測量中對設備的外形體積要求、系統要求更為重要,其主要在于人員方便攜帶可在大范圍及野外進行測量,不受環境等特殊情況的限制。
3 計算機視覺圖像精密測量發展趨勢
目前我國國民經濟快速發展,我們對于精密測量的要求越來越來高,特別是近年我國科技技術的快速發展及需要,很多工程及工業方面已經超出我們所能測試的范圍。在這樣的前景下,我們對于計算機視覺圖像精密測量的發展趨勢進行一個預估,其主要發展趨勢有以下幾方面:
3.1 測量精度
在我們日常生活中,我們常用的長度單位基本在毫米級別,但在現在生活中,毫米級別已經不能滿足工業方面的要求,如航天航空方面。所以提高測量精度也是計算機視覺圖像精密測量發展趨勢的重要方向,主要在于提高測量精度,在向微米級及納米級別發展,同時提高成像圖像方面的分辨率,進而達到我們預測的目的。
3.2 圖像技術
計算機的普遍對于各行各業的發展都具有時代性的意義,在計算機視覺圖像精密測量中運用圖像技術也是非常重要的,在提高圖像處理技術做以提高。同時工程方面遙感測量的技術也是對于精密測量的一種推廣。
4 結束語
在科技發展的現在,測量是生活中不可缺少的一部分,測量同時也影響著我們的衣食住行,在測量技術中加入計算機視覺圖像技術是對測量技術的一種革新。在融入這種技術后,我相信在未來的工業及航天事業中計算機視覺圖像技g能發揮出最大限度的作用,為改變人們的生活做出杰出的貢獻。
參考文獻
[1]湯劍.周芳芹.楊繼隆.計算機視覺圖像系統的技術改造[J].機電產品開發與創新周刊,2015,14(18):33-36.
[2]馬玉真.程殿彬.范文兵,計算機視覺檢測技術的發展及應用研究[J].濟南大學學報,2014,18(23):222-227.
[3]李華.基于計算機視覺圖像精密測量的關鍵技術分析[J].電腦知識與技術,2013(05):1211-1212.
一、計算機視覺檢測技術含義
計算機的視覺又叫做機器視覺,通過利用計算機或者是其他的一些機械設備來幫助人們視線事物到圖片的過程,從而進行三維世界的感知活動。計算機的快速發展,離不開神經心理學,心理學和認知科學方面的研究和發展,計算機視覺檢測技術的發展方向就是對周圍的三維空間進行感知和分析。一旦能夠擁有這種能力,計算機不僅能感知到周圍的總體環境,而且,還能夠具有對物體進行描述,識別理解和儲存的能力。
二、計算機視覺檢測的基本原理
要實現人工智能對視覺的計算機處理是很重要的方面在計算機視覺應用領域中如果要讓我們的計算機明白圖像的信息就必須經過一系列的處理過程―――數字圖像處理.數字圖像的處理包括5個步驟:圖像預處理(去除噪聲)、分割處理分割后區域、測量、圖像判讀、圖像技術.根據抽象程度和處理方法的不同圖像技術可分為三個層次:圖像處理、圖像分析和圖像理解.這三個層次的有機結合也稱為圖像工程.而計算機視覺(Computer vision)則是用計算機實現人的視覺功能對客觀世界三維場景的感知、識別和理解.視覺檢測按其所處理的數據類型又大致可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測.另外還有X射線檢測、超聲波檢測和紅外線檢測。
作為新興檢測技術計算機視覺檢測充分利用了計算機視覺研究成果采用像傳感器來實現對被測物體的尺寸及空間位置的三維測量能較好地滿足現代制造業的發展需求.與一般意義上的圖像處理相比計算機視覺檢測更強調精度、速度和無損性以及工業現場環境下的可靠性.例如基于三角法的主動視覺測量理具有抗干擾能力強、效率高、精度合適等優點非常適合制造業生產現場的在線、非接觸產品檢測及生產監控.對人類視覺感知能力的計算機模擬促進了計算機視覺技術的產生和發展制造業上獲取這些信息的目的有:(1)計算出觀察點到目標物體的距離;(2)得出觀察點到目標物體的運動參數;(3)甚至可以判斷出目標物體的內部特性;(4)推斷出目標物體的表面特征有時要求形成立體視覺。
三、亞像素檢測技術
隨著工業檢測等應用對精度要求的不斷提高,像素級精度已經不能滿足實際檢測的要求,因此需要更高精度的邊緣提取算法,即亞像素算法。亞像素級精度的算法是在經典算法的基礎上發展起來的,這些算法一般需要先用經典算法找出邊緣像素的位置,然后使用周圍像素的灰度值作為判斷的補充信息,利用插值、擬合等方法,使邊緣定位于更加精確的位置。現在的亞像素提取算法很多,如重心法、概率論法、解調測量法、多項式插值法、濾波重建法、矩法等。由于這些算法的精度、抗噪聲能力和運算量各不相同,他們的應用場合也是各不相同的。
邊緣是圖像的基本特征,所謂邊緣是指圖像中灰度存在階躍或尖頂狀變化的像素的集合,邊緣廣泛存在于物體與物體、物體與背景之間。圖像測量是通過處理被測物體圖像中的邊緣而獲得物體的幾何參數的過程,邊緣的定位精度直接影響最終的測量結果。因此,圖像邊緣提取方法是檢測的基礎和關鍵之一。在視覺測量領域中,早期使用的都是像素級邊緣檢測方法,例如常用的梯度算子、Lapacian算子和門式算子等。以上的邊緣檢測方法的精度可以達到像素級精度,即可以判斷出邊緣位于某個像素內,但不能確定邊緣在該像素內的更精確的位置。如果一個像素對應的實際長度較大,就會產生較大的誤差,傳統的整像素邊緣檢測方法就不再適用。
四、計算機視覺檢測技術在機加工零件檢測中的應用要素與過程
(一)曲陣CCD相機
面陣CCD是本項目圖像采集系統中的主要設備之一,其主要功能是采集實驗圖像。該CCD相機主要由CCD感光芯片、驅動電路、信號處理路、電子接口電路和光學機械接口等構成。
(二)工業定焦鏡頭
在圖像測量系統中,鏡頭的主要作用是將目標聚焦在圖像傳感器的光敏面上。鏡頭的質量直接影響到圖像測量系統的整體性能,合理選擇并安裝光學鏡頭是圖像測量系統設計的重要環節。
(三)數字圖像采集卡
隨著數字信號處理技術和嵌入式處理器技術在圖像采集卡中的應用,使得圖像采集卡向高速度、多功能和模塊化方向不斷發展。這類圖像采集卡不僅具有高速圖像采集功能,同時還具備部分圖像處理功能,因此又可以稱之為圖像處理卡。
(四)標定板
為提高測量精度,需要進行攝像機標定。標定過程中,采用NANO公司的CBC75mm}.0型高精度標定板,外形尺寸為75mmx75mmx3.0mm,圖形為棋盤格,其尺寸為2.0mmx2.0mm,精度為1級,即圖形尺寸精度與圖形位置精度為。
(五)背光源
背光方式只顯示不透明物體的輪廓,所以這種方式用于被測物需要的信息可以從其輪廓得到的場合。因此,為精確提取軸的圖像中的邊緣特征,需采用背光源。為使圖像邊緣更銳利,光源顏色選擇紅色。
五、結語
隨著計算機技術和光電技術的發展,已經出現了一種新的檢測技術―基于計算機視覺的檢測技術,利用CCD攝像機作為圖像傳感器,綜合運用圖像處理等技術進行非接觸測量的方法,被廣泛地應用于零件尺寸的精密測量中。本文以面陣CCD為傳感器,研究了零件在線測量的方法,實現了零件尺寸的圖像邊緣亞像素定位測量,對面陣CCD在高精度測量方面的應用作了進一步的探索和研究,為面陣CCD在復雜零件尺寸高精度測量的實現打下了基礎。
【參考文獻】
隨著計算機技術和網絡技術的飛速發展,計算機已深入到社會的各個領域,并深刻的改變人們的工作、學習和生活方式。信息的獲取、分析、處理、、應用能力已經成為社會中人們的一個必備的技能。多媒體技術也在發生著日新月異的變化,包括這多媒體技術的基本概念、圖像、音頻、視頻、動畫的常用處理工具等。其中人臉檢測與識別技術在計算機視覺方面也是尤為重要的,人臉檢測與識別技術主要是用于身份信息的識別,也可以用來對個人的隱私信息通過識別來進行保護。
誕生于20世紀40年代的電子計算機是人類最偉大的發明之一。并且一直以飛快的速度發展著。進入21世紀的現代社會,計算機已經進入各個行業,并成為各行業必不可少的工具。如今的計算機發展的更加智能化,就如今來說,人們最什么事情都非常重視信息,人類和社會的發展,時刻都離不開信息。計算機如今重視的方面就是對信息的閱讀和控制,人臉檢測與識別技術也是應運而生。
人臉識別的論述
人臉識別是人類視覺中的一大特色,因為能對身邊的人進行識別,才不會對身邊的信息進行混淆,簡單來說,根據人臉可以對人的年齡,性別進行初步判斷。隨著計算機技術的智能化,計算機業已經通過視覺能進行人臉的識別。其中在對人臉識別的同時進行有關信息的收集、識別、提取、變換、存儲、傳遞、處理、檢索、檢測、分析和利用等技術。如今人臉識別已經應用于很多的領域,但是要人臉檢測與識別是需要基于本來已經收集和整理的信息本庫才能進行。再加上現在計算機技術雖然已經接近成熟,然而在人臉識別方面的表情傳達出什么信息還是無從下手進行編程和設計。所以,基于計算機視覺的人臉檢測與識別技術還是會有很廣的發展空間,再加上人臉識別還可以維護人們的財產安全和隱私保護,必然會引起社會各界人士的廣泛關注。
從19世紀末開始就已經有人對人臉識別進行了研究,因為當時沒有先進的科學技術做后盾,所以經過了數百年的研究仍然沒有什么顯著的進展和成果。直到20世紀90年代人臉識別才成立了自己的學科,在加上當時的科技發展水平已經達到了不錯的水平,人臉識別這個學科得到了快速的發展。如今,我國的計算機技術也已經居于世界的前列,我國也已經擁有比較完善的一套東方面孔的人臉數據庫。
人臉識別在發展過程中大概經歷了三個階段:第一階段就是對人臉特征進行整理,整理出所需要的數據庫,并且應用當時的計算機技術做出一套質量不錯的人臉灰度模型,這個階段的識別工作全部由操作人員來完成;第二階段比第一階段要先進,有了基礎人機互交,將人臉的特征經過多維度的矢量在模型上表示出來,并也可以設計出一套人臉識別的系統,這個階段的識別不再是僅僅依靠操作人員,而是操作者和計算機一起完成;第三個階段是計算機智能識別的最高峰,一切操作和識別都依靠機器全自動化進行,在人臉識別過程中也不再是每臺計算機都需要完成一整套的工作,也實現了計算機與計算機之間的互聯,多臺計算機一起完成人臉識別的過程,都人力也是一種解放。
積極踐行人臉檢測識別技術
人臉檢測識別技術是計算機實現智能化特征后的又一重要發展方向之一,它已經在世界范圍內得到了廣泛的普及與應用。人們可以通過人臉識別來進行定位,來起到保護人們財產安全的作用,通過人臉識別來抵制社會中的造假率,之前曾經有一些不法分子利用假身份來做損害公共利益和侵犯人們隱私權的事情,有了人臉識別讓不法分子沒有可乘之機,也應用人臉識別來對財務密碼進行聯系,起到對人們的財產有絕對的保護作用,對社會的安定何嘗不是一項有意義的發明。
人臉識別一直是計算機智能化發展過程中的一個重要領域,因為人臉的識別與檢測是一個很難做到完善的項目,由于人類的面部表情豐富,要對人類的面部表情做出判斷和分析會存在一定的困難。再加上人臉識別的過程中,每個獨立存在的個體都有一張專屬于自己的臉。它的輪廓沒有明顯的特征界限,同時對眼、鼻子、嘴等器官在臉上的分布情況也沒有明確的界限,這就使得對人臉識別來進行算法設計有一定的困難,所以只有通過輪廓特征來進行初步的判斷,分辯出各種器官,再根據器官來完成人臉的分布情況設計灰度模型的完成工作。
隨著紅外光的可利用率提高,也應用到了人臉識別的領域,在人臉識別過程中也加入不同光的效果來識別人臉,使得如今的人臉識別的準確度有了明顯的提高。但是光的效果是不可控的,在環境不適宜和用戶不配合的情況下,利用紅外光技術來進行人臉識別又會將準確度拉到很低的成度。因此,在人臉檢測與識別方面仍然有一些尚未解決的問題,值得人們關注和探索。
科學的進步、時代的進步,必將給發展賦予新的內容。這個社會已經成為了一個信息化社會,信息化代表了一種信息技術被高度重視,信息資源被高度共享,從而使得人的智力和潛力以及社會物質資源潛力被充分發揮。在這個信息化社會中最重要的就是信息。個人信息已經成為在社會中必備的物質。如此看來信息的保護也成為了發展的頭等大事,基于計算機視覺的人臉檢測與識別技術也有了發展的獨特性,它的獨特性由這個時代所決定。
關鍵詞:計算機視覺;課程創新;教學改革
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2016)20-0118-02
計算機視覺課程是人工智能學科的分支學科,對互聯網技術的發展有著重要的推進作用。隨著時代的飛速變遷,越來越多的學生對這一領域產生了濃厚的興趣,計算機視覺課程在信息專業中也開始占據重要的地位。如何讓學生對這門課程保持長久的興趣,如何培養學生的專業能力和實踐能力,是當前高校應該考慮的問題。經過近幾年的教學實踐后,很多高校已經逐步確定了通過實際應用培養學生興趣的教學方法,在滿足學生對計算機視覺應用需求的同時,加深了學生對理論知識的理解,這已經成為了當前高校計算機視覺課程教學的重要模式。
一、計算機視覺課程的特點
近年來,隨著計算機網絡的飛速發展,計算機視覺的應用也越來越廣泛,成為了信息相關專業學生的一門必修課。計算機視覺課程涉及眾多領域,包括人工智能與模式識別、應用數學等,其覆蓋范圍廣,綜合性較強。具體來說,計算機視覺課程有以下幾個特點:一是內容廣泛,理論抽象。計算機視覺是一門新技術,隨著時代的變遷,互聯網新技術的更新日新月異,這就使得課程內容的更新過快,內容廣泛,教師很難在第一時間向學生輸送所有的課程知識。二是計算機視覺課程涉及多個學科領域,并且所涉及的領域知識內容復雜,表達抽象,這對學生的學習來說是一個較大的障礙。三是實踐性強。計算機視覺課程的知識內容來源于各種專業不同的領域,操作性極強,學生只有在具有一定的工程項目綜合能力后,才能進行計算機視覺應用和操作。
二、計算機視覺與計算機圖形學、數字圖像處理之間的聯系和區別
1.計算機視覺與計算機圖形學的聯系與區別。計算機視覺一般輸入的都是圖像或圖像序列,其輸入資料主要來自usb攝像頭或是相機。經過處理后,計算機視覺輸出的是對圖像序列和圖像對應的對真實世界的一種理解,在這一方面,計算機視覺有識別車牌、人臉的作用。而計算機圖形學則是一種對虛擬場景的描述。它一般是由多個多邊性數組組成,每個多邊性有三個頂點,輸出的是二維像素數組。在增強現實的應用中,人們不僅需要用計算機視覺來提高對物體識別和姿態獲取的效率,還需要用到計算機圖形學對虛擬三維物體的疊加方法。
2.計算機視覺與數字圖像處理的聯系和區別。首先,計算機視覺與數字圖像處理之間的聯系在于數字圖像處理是計算機視覺處理的基礎,而計算機視覺的研究成果也可以作為數字處理的素材。其次,計算機視覺與數字圖像處理之間的區別在于圖形是一種純數字化、矢量的單位,而圖像則不僅包括圖形,有時還包括來自現實世界的信號,并且圖形的處理不是一種簡單的堆積,計算機視覺的處理要從圖像中找到一些統計數據和信息,并做進一步的數據分析。
三、高校計算機視覺課程教學的創新策略
1.以工程應用為導向的課程內容。鑒于學習本課程的學生在畢業之后多數會進入相關工程企業或者研究院工作,因此,在對學生進行培養時,高校一方面要考慮到學生的知識接受度,另一方面要設置以工程應用為導向的課程內容,幫助學生更好的進入企業或研究院開展工作。高校在進行計算機視覺課程教學創新時,首先要創新課程教材,摒棄以往枯燥的理論書籍,多選取一些實踐性和應用性強的教材。考慮到國內教材的滯后性和學生基礎的薄弱性,高校應該選擇以下兩本書作為學生的專用教材:一本是我國著名教授賈云得編纂的《機器學習》,這部教材深刻體現了時展的教學要求,書中不僅詳細講述了計算機視覺中的一些基本知識,包括計算機視覺的基本概念、算法及其應用,還有一些經典的數字圖像處理方法和視覺應用分析,對學生了解基礎知識和實踐內容有著重要的意義;另外一本是國內外十分推崇的計算機視覺著作,它是美國教授Richard Szeliski教授的作品。該書在2010年出版,獲得了眾多業界人士的好評。Richard Szeliski教授是華盛頓大學的兼職教授,也是微軟研究院交互視覺與多媒體的主任,他對計算機視覺的發展和未來走向十分清楚,也深刻了解產業界和大學需要什么樣的計算機視覺課程教材。因此,這本教材面向應用,與當今最新的科技成果緊密相連,綜合論述了計算機視覺在各個領域的發展,展示了計算機視覺的最新研究成果和未來的發展趨勢。此外,本書中還有詳細的國外研究案例和更加深入的應用案例,適合學生開展探究性學習。兩本教材都是遵循以工程應用為導向的原則,對學生開放性思維的培養有著重要的意義。
2.面向科技最新成果的課程定位。計算機視覺是一門新技術,科技創新是其發展的原動力,因此,高校在進行課程安排時,應該將當今計算機視覺領域的重要的科技成果作為計算機課程的基本教學內容。要想以科技最新成果定位計算機視覺課程,高校要做到以下兩個方面:(1)選取涵蓋最新成果的教材。考慮到不同學生的數字圖像處理基礎不一的問題,學校可以在課程中補充一些有關數字圖像處理的基礎內容。在選擇教材內容時,計算機視覺課程的內容應該包括數字圖像處理、視覺學習和模式識別這三大部分。數字圖像處理是視覺課程的基礎內容,主要向學生介紹數字圖像處理和計算機視覺所涉及的一些基礎知識,包括圖像的分割和檢測、圖像濾波的處理等。數字圖像處理是整個計算機課程學習的重要基礎內容,其課時可占總課時的二分之一。其次,視覺部分是近幾年來計算機視覺的最新科技成果,內容主要包括攝像機的幾何設定和計算機攝影機的序列處理等。作為最前沿的科技領域,視覺部分將會是該課程后期的重點內容,與實踐作業緊密結合。而模式識別則更多的是新技術的一種工程應用,學生會更多的涉及到實踐操作,更好的培養學生的實踐能力。(2)強化學生自學和調研能力。課程調研和實踐是信息專業學生強化能力的重要方法之一,高校可以在課程項目中引入新技術的探究,在使課程在具有基礎性、研究性的同時,具有一定的前沿性,還能讓學生在第一時間了解到最新的科技成果和互聯網應用技術。在課程調研和實踐中,高校必須要強化學生的自學和調研能力,在調研時給每一個小組安排一位高年級研究生作為指導,每組學生獨立完成任務,高年級研究生只做引導和輔助的作用。學生在自我設置調研程序,查找資料,理解和熟悉相關程序的時候,能夠更加掌握最新科技成果的內容,同時還提高了學生的自學能力和團隊協作能力。
3.工程實踐化的教學形式。工程項目綜合能力是信息專業的學生必須具備的素質之一,因此在計算機視覺課程的教學過程中,培養學生的工程實踐能力是教學目標之一。高校可以采取以下兩種方法:(1)選取適當的工程實例。對于信息專業的學生而言,計算機視覺課程各個獨立的算法和方法較多,彼此沒有過多的聯系。這對學生來說過于抽象,不易理解,因此教師不應當僅僅限于知識的傳授,還應該選取一些適當的工程實例,將知識體系串聯在一起,加深學會對教學內容的理解,從而達到良好的教學效果。例如,在教學過程中,教師可以著重介紹手機制造的例子。手機是現在學生十分熟悉的產品,用手機舉例更加貼近學生的生活,教師可以詳細介紹手機鍵盤和主板的制造過程,并在這一過程中將所學的算法和理論融合進去,加深學生對知識的理解。其次,教師在手機講解時,還可以引導學生思考類似的產品制造,從而引出數碼相機的制造原理,和學生一起探討其制造算法。這種做法不僅可以幫助學生學習,還可以讓學生拓寬思路,發散思維,不斷創新計算機視覺領域。(2)選擇合適的實際應用。計算機視覺課程是一門實踐性和操作性極強的學科,因此,為了學生更好的學習,教師要將理論工程實踐化,選擇合適的實際應用來提高學生的實踐能力。教師可以安排學生進入手機制造廠房,給學生上一堂別開生面的實踐課,詳細介紹每個制造流程,并向學生不斷拋出與課程有關的問題,引發學生的思考,比如選擇什么樣的模板匹配法可以更為簡單。學生在不斷的解答和提問中,對學科知識的了解也會逐步加深。其次,高校可以建立專門的實訓基地,學生可以在基地里實踐操作,將理論轉化為實物,親自嘗試做出模型,這種做法可以極大地提高學生的實踐能力,使學生更快的將理論轉化為實際。
四、結語
在新形勢下,高校應不斷創新計算機視覺課程的教學模式,并以此展開教學活動,培養學生的實踐能力和創新精神。將工程應用和科技最新成果結合的教學模式,有利于解決理論和實踐相脫節的問題,在增強學生學習興趣、提高學生獨立分析能力的同時,還使學生接觸了國際最新的研究成果,拓寬了學生的思路,這對學生未來的發展有著重要的意義。
參考文獻:
[1]郭小勤,曹廣忠.計算機視覺課程的CDIO教學改革實踐[J].理工高教研究,2010,(05).
[2]倫向敏,侯一民.高校《計算機視覺》課程輔助教學系統的研究[J].教育教學論壇,2012,(18).
[3]陳芳林,劉亞東,沈輝.在《計算機視覺》課程中引入研討式教學模式[J].當地教育理論和實踐,2013,(07).
[4]楊晨.視覺傳達設計專業插畫設計課程創新與實踐人才培養機制探究[J].藝術科技,2015,(05).
[5]蔣辰.基于數字媒體環境的視覺傳達設計專業綜合實驗課程改革探證[J].文藝生活:中旬刊,2015,(07).
[6]張勝利.視覺傳達設計專業中色彩風景寫生課程多元立體化教學模式的構建[J].美術教育研究,2015,(08).
關鍵詞: 危險氣體罐車; 液位檢測; 計算機視覺; 報警系統
中圖分類號: TN948.64?34; TP216 文獻標識碼: A 文章編號: 1004?373X(2016)22?0067?0
0 引 言
隨著自動化測試技術的發展,采用智能測試和計算機視覺方法進行液位檢測和監控,借助的物理場有超聲波、微波雷達、射線及激光等,能實現高低位報警功能,在工業控制場合中,固定位置處的液位監控是保障工業控制安全的重要技術,特別是在危險光車的運輸過程中,需要對危險氣體罐車的液位進行實時監控和識別,通過感應元件實現對液位的準確檢測,通過檢測發射和接收的時延來確定液位的高度。隨著計算機視覺處理技術的發展,以及圖像處理技術的應用,采用計算機視覺部監控方法進行危險氣體罐車的液位監控識別成為未來實現液位準確監測和定位的重要發展方向,研究基于計算機視覺的危險罐車的液位檢測監控報警系統,在保障危險罐車運輸安全方面具有重要意義,相關的系統設計方法受到人們的重視[1?3]。
目前,對液位的檢測方法按照測量液位的感應元件與被測液體是否接觸,其可分為接觸型和非接觸型兩大類。通過人工檢尺法[4?6],加裝浮子測量裝置進行液位檢測,微波雷達、射線及激光主要是應用在檢測罐體為危險物質,將微波發射器和接收器安裝在罐頂,利用超聲技術并結合數字信號處理算法進行液位檢測[7?9]。但是,上述設計方案因無法找到超聲信號為零的位置,所以考慮使用靈敏度相同的另一液位檢測傳感器作為參考通道進行自適應噪聲抵消,參考液位檢測傳感器應放置在對目標反射信號較小,更多的反映液位反射的超聲信號的位置,但是對電磁波、光波等超聲無法穿過的介質,液位檢測的精度不高[10],難以實現有效的監控識別和報警。針對上述問題,本文進行危險氣體罐車液位監控識別報警系統的改進設計,首先進行了液位檢測原理分析,構建系統裝置的總體結構模型,然后進行了危險氣體罐車液位計算機視覺監控識別報警系統的硬件模塊化設計和軟件設計,最后通過實驗分析驗證了本文設計的液位監控識別報警系統的優越性能,得出有效性結論。
1 液位計算機視覺監控識別報警系統的總體設計
根據上述液位檢測弊端分析,進行危險氣體罐車液位計算機視覺監控識別報警系統設計,首先分析系統設計的總體架構模型,系統設計包括了系統的硬件設計和軟件設計部分。硬件設計中,主要是在計算機視覺環境下完成液位視覺特征的獲取,并對接收到的視覺特征進行相應的處理。本系統的硬件部分主要是數據采集和數字信號處理。接收探頭采集的視覺特征通過信號采集電路進行高分辨率的A/D采樣,液位視覺的差異性可以通過對分辨率和采樣率的大小來判斷。在對液位檢測的超聲信號檢測的基礎上,設計自適應濾波器進行信號濾波,通過自適應均衡方法得到基于視覺傳感器的液位檢測特征,為系統設計提供了準確的數據基礎。因此,采集電路的設計必須采用高分辨率,硬件電路設計中,包括確定DSP處理器型號、Visual DSP++集成開發環境、器件以及連接關系。根據I/O設備的數據采集量確定液位監控識別系統的分辨率和基線恢復性能,采用ADI公司的ADSP21160處理器系統作為計算機視覺監控識別的主控芯片,數字信號處理器主要完成對整個硬件系統的電路控制,根據設計的功能指標得到本文設計的監控系統的計算機視覺的像素值的系統最低采樣率為1 024 MHz, 則DSP的最低速度應大于[25×20=500 MHz]。
在進行罐體液位監控中,研究的罐體的厚度分別為5 mm平面罐體,20 mm平面罐體。由于本文構建的系統是一個高采樣率的數據采集系統,在進行液位監控識別報警中,需要利用C8051F處理器發射頻率為120 kHz左右的脈沖序列,作為原始聲信號數據存入計算機系統,以此進行監控識別,根據上述描述,得到系統設計的模塊構架如圖1所示。
2 系統的設計與實現
2.1 硬件電路設計的指標分析
在上述進行了危險氣體罐車液位計算機視覺監控識別報警系統的液位檢測原理分析和系統設計總體構建描述的基礎上,進行系統的硬件設計,系統的硬件模塊主要包括了超聲信號A/D采樣電路、時鐘電路、濾波電路、程序加載電路和電源電路等。系統的設計指標描述如下:
(1) 危險氣體罐車液位計算機視覺監控識別報警系統的輸出信號幅度
(2) 監控系統的整體功耗
(3) 計算機視覺監控接收機采樣率不低于12 MHz;
(4) CAN總線對無液狀態采集數據采樣分辨率不低于8位;
(5) 有液狀態采集數據中具有高壓控制功能;
(6) 具有基線恢復功能。
根據上述設計的指標,進行硬件模塊化設計。
2.2 系統硬件模塊化設計與電路實現
首先設計圖像信號A/D采樣電路,A/D采樣電路是實現罐車液位計算機視覺監控識別報警系統設計的基礎,通過A/D采樣電路上傳圖譜數據,使用AD公司一款高性能A/D芯片AD9225對上一個緩沖區數據進行峰值檢測,利用A/D芯片內的采樣保持器和參考電壓進行計算機視覺特征監測和液位脈沖數據采樣,結合視覺特征在危險氣體罐車中傳播可以進行信號轉換,通過A/D采樣電路轉化為計算機視覺監控系統能識別的數字信號,A/D芯片通過時鐘把脈沖信息輸入到罐體液位監測系統的中央處理單元,數字輸出包括12位數字輸出和一個溢出指示位,采用多樣化的數據捕捉和傳送模式,罐車液位計算機視覺監控識別報警系統的PPI的所有操作與A/D、D/A轉換器、視頻編碼/解碼器進行并行串口通信,由此實現控制信號的無幀同步、內部觸發。根據上述設計,得到罐車液位計算機視覺監控識別報警系統A/D采樣的時序邏輯如圖2所示。
罐車液位計算機視覺監控識別報警系統的輸入超聲信號采用的是單端輸入,耦合方式可以是交流耦合,通過上述邏輯結構,構建A/D采樣電路如圖3所示。
圖4中,WDO引腳產生的超聲波將發生反射縱波(或橫波),利用多層介質中超聲波的傳播規律進行計算機視覺監控識別,實現對罐體液位狀態的檢測。
2.3 軟件算法的設計
由于是單峰液位突變特征,因此,可結合角點檢測的特點,利用Harris角點檢測方法能夠實現丙烯聚合過程中非正常液位的檢測和識別。角點能夠描述液位圖像中兩個邊緣的相交點,Harris角點檢測方法主要通過液位圖像中的特征點形狀進行非正常液位的檢測和識別,即使液位的顏色發生變化仍能進行有效的檢測。
設置液位圖像[I(x,y)],對其進行平移[(Δx,Δy)]后圖像具有自相似性,這種自相似性能夠用自相關函數進行評價,其公式如下:
[c(x,y;Δx,Δy)=(u,v)∈W(x,y)ω(u,v)[I(u,v)-I(u+Δx,v+Δy)]2] (1)
式中:[W(x,y)]為以[(x,y)]為中心模板的窗口;[ω(u,v)]為加權函數,可以將其設置為常數或者高斯函數。對泰勒公式進行展開,能夠得到:
[I(u+Δx,v+Δy)≈I(u,v)+Ix(u,v)Δx+Iy(u,v)Δy =I(u,v)+[Ix(u,v)Iy(u,v)]ΔxΔy] (2)
則:
[c(x,y;Δx,Δy)=ω(u,v)[I(u,v)-I(u+Δx,v+Δy)]2 ≈[Ix(u,v)Iy(u,v)]ΔxΔy2ω(u,v) =[Δx,Δy]M(x,y)ΔxΔyω(u,v)](3)式中:
[M(x,y)=Ix(u,v)2Ix(u,v)Iy(u,v)Ix(u,v)Iy(u,v)Iy(u,v)2=ACCB] (4)
因此,對液位圖像進行平移后得到的自相關函數能夠近似于下述二次項函數:
[c(x,y;Δx,Δy)≈[Δx,Δy]M(x,y)ΔxΔy] (5)
進而能夠得到丙烯聚合過程中液位的視覺方程:
[Δx,ΔyM(x,y)ΔxΔy=1] (6)
圖像中液位圖像的尺寸是由[M]矩陣的特征值決定的,特征值能描述液位圖像中灰度變化的速度和方向。Harris角點法無需對[M]的特征值進行計算,只要計算出一個角點的響應即可,其計算公式如下:
[R=detM-α(traceM)2] (7)
式中,[α]為經驗參數,通常取值為0.04~0.06。利用上述方法取得的全部Harris角點,計算全部的角點縱坐標的均值進行計算即可得到實際的液位高度,從而實現丙烯聚合過程中非正常液位的準確檢測與識別。
3 系統軟件開發仿真環境描述和系統調試結果分析
危險氣體罐車液位計算機視覺監控識別報警系統的軟件開發建立在嵌入式Linux開發系統基礎上,系統軟件需要實現的功能包括危險氣體罐車液位超聲采集、能譜測量、計算機視覺圖像控制、CAN通信以及A/D采樣E2PROM燒寫。SPI E2PROM AT25HP512用于DSP的程序加載,正確配置DSP的SPI寄存器,采用DIP封裝實現程序加載,根據上述軟件開發環境,發送WREN指令直接通過燒寫器燒寫,進行危險氣體罐車液位計算機視覺監控識別報警系統的仿真測試。首先采用層次聚類方法在計算機視覺環境下進行液位狀態數據采集,然后進行信號轉換,得到有液狀態和無液狀態下的采集結果如圖5所示。
對上述原始數據進行信號處理,采用自適應濾波電路進行有用信息提取,得到提取結果如圖6所示。
監控識別,由圖6可見,采用本文設計的系統進行危險氣體罐車的液位檢測,在計算機視覺下能實時準確檢測液位值,實現準確的監控識別和報警,性能可靠穩定。
4 結 語
本文進行了危險氣體罐車液位計算機視覺監控識別報警系統優化設計,利用不同液位狀態下聲波在不同罐體環境中的傳播特征的差異性,進行聲波在不同罐體環境中的傳播的差異性特征提取,判定液位狀態。進行系統的硬件設計和軟件設計,包括A/D采樣電路、時鐘電路、濾波電路、程序加載電路和電源電路等。通過危險氣體罐車液位檢測系統輸入的參考信號對有液和無液的狀態進行區別檢測,采用計算機視覺監測方法,進行危險氣體罐車液位內部狀態特征的視覺監測。研究表明,該系統具有較好的液位檢測性能,實現危險氣體罐車液位的有效監控識別報警,具有較好的應用價值。
參考文獻
[1] 劉茂旭,何怡剛,鄧芳明,等.融合RFID的無線濕度傳感器節點設計研究[J].電子測量與儀器學報,2015,29(8):1171?1178.
[2] 呂富勇,周瑞卿,阮世陽,等.高頻磁場檢測中采樣保持器的設計及其性能分析[J].電子測量技術,2015,38(8):13?16.
[3] 郭靜波,譚博,蔡雄.基于反相雙峰指數模型的微弱瞬態極低頻信號的估計與檢測[J].儀器儀表學報,2015,36(8):1682?1691.
[4] JAFAR S A. Interference alignment: A new look at signal dimensions in a communication network [J]. Foundations and trends in communications and information theory, 2011, 7(1): 129?134.
[5] GOMA/DAM K, CA/DAMBE V R, JAFAR S A. A distributed numerical approach to interference alignment and applications to wireless interference networks [J]. IEEE transactions on information theory, 2011, 57(6): 3309?3322.
[6] PATCHARAMANEEPAKRON P, ARMOUR S, DOUFEXI A. Coordinated beamforming schemes based on modified signal?to? leakage?plus?noise ratio precoding designs [J]. IET communications, 2015, 9(4): 558?567.
[7] KALEVA J, TOLLI A, JUNTTI M. Weighted sum rate maximization for interfering broadcast channel via successive convex approximation [C]// Proceedings of IEEE Global Communications Conference. Anaheim, USA: IEEE, 2012: 3838?3843.
[8] LIU H, DING Z G, FAN P Z, et al. Precoding design for interference suppression in multi?cell multi?user networks [J]. IET communications, 2014, 8(9): 1534?1540.
[9] RATHEESH M, DAVID M J. System?level performance of interference alignment [J]. IEEE transactions on wireless communications, 2015, 14(2): 1060?1070.
【關鍵詞】計算機視覺;構件;表面特征;檢測
表面缺陷檢測以及特征提取,所涉及的范圍是非常廣泛的,包括了鐵軌表面缺陷、帶鋼表面缺陷以及織物表面缺陷等。因此加強對產品的表面缺陷提取以及質量檢測顯得尤為重要,目前基于計算機視覺的構件缺陷檢測系統已經受到國內外研究人員的重視,如何更好地將計算機視覺技術引入到產品表面質量缺陷檢測中去是未來發展的重點。筆者將在下文中就此展開詳細的闡述。
1.計算機視覺的基本工作原理
1.1系統結構
計算機視覺是一項涉及范圍廣泛的技術,他通過圖像采集裝置將檢測目標轉化為圖像信號,再經過專門性的額圖像處理系統最終生成具體的表面特征。具體來講在圖像處理環節米旭濤根據圖像的具體像素以及圖像分布和顏色、亮度、飽和度等進行目標提取,再比照系統預設的參照值得出最終的檢測結果,例如尺寸大小、顏色等師傅偶合格。計算機視覺處理系統包括了光源、鏡頭、計算機以及圖像采集裝置和處理系統等,這些系統綜合組成共同推動了計算機視覺系統的正常穩定運行。
1.2計算機視覺硬件設計
計算機視覺系統的硬件平臺包括了照明系統、鏡頭相機以及圖像采集裝置和工控機四個部分,這四個部分缺一不可,共同組成了整個計算機視覺系統。
1.2.1照明系統
照明系統是整個計算機視覺系統的關鍵,尤其是在光源和照明方案的配合上更是直接影響了整個系統運行的成敗。因此在照明方案的制定以及光源的選擇上應該盡可能的突出物體特征參量,綜合考慮對比度以及亮度等因素,將計算機視覺系統的光源與照明方案相匹配,選擇需要的幾何形狀以及均勻度等,同時還需要結合被檢測物體的表面特征幾何形狀。針對構件表面缺陷的照明方案,筆者認為應該選擇功率相對較大的LED光源,用低角度的方式進行照明。
1.2.2相機鏡頭
相機系統是成像的關鍵,因此在相機鏡頭的選擇上應該適用于具體的構件。一般來說相機鏡頭包括了兩方面內容,一是線掃,二是面掃。通過二者的綜合運用實現更好地成像效果。
1.2.3圖像采集卡
圖像采集卡主要是指在計算機視覺系統中位于圖像裁剪機設備和圖像處理設備之間的重要接口。是成像的中間環節,發揮著不可或缺的作用。
2.基于計算機視覺的構件表面缺陷特征提取
基于計算機視覺的構件表面缺陷特征提取可以分為為三個重要部分,分別是圖像預處理部分:主要是指針對構件進行區域的定位,將非構件的部分移出計算機視覺的缺陷提取技術中去,從而降低了后續工作的工作難度;其次是進行缺陷定位,主要是指通過特定的技術和算法將缺陷從結果當中直接分離出來。第三部分是缺陷特征的提取,也是系統處理的結果部分,是通過計算缺陷的程度以及缺陷大小,從而為后期的構件維護提供參考依據。具體來說,這三個部分的操作主要體現在以下幾個方面:
2.1區域定位
區域定位是減少構件處理和選擇時間的關鍵,能夠大大提高構件缺陷提取的效率。構件的表面的基本特征和大致集合框架提取是區域定位和的第一步,要將計算機區域定位和缺陷提取結合起來,更好地實現缺陷分析。要做好構件的區域定位首先需要明確構件的基本種類和特征:一是根據構件的重用方式來說,可以分為白匣子、灰匣子、黑匣子從構件的使用范圍來看又可以分為通用構件和專用構件;根據構件的粒度的大小可以分為小。中大三種不同粒度的構件;再次是從構件的功能上來看可以分為系統構件、支撐構件以及領域構件三個部分。四是從構件的基本結構特征來看可以分為原子構件以及組合構件。最后從構件的狀態來說,又可以分為動態和靜態構件。因此從不同種類的構件進行區域定位為視覺系統正常運行創造了優良的條件。
2.2缺陷提取
在進行缺陷提取的過程中,難免會受到客觀的環境影響,比如噪聲、溫度以及濕度等對圖像處理的結果產生影響,因此需要對區域定位中產生的區域進行濾波處理,然后再采用閾值分割的辦法進行缺陷提取。具體操作步驟如下所示:
(1)計算出成像中的最小最大灰度值,并且設置初始閾值。
(2)根據閾值,結合圖像的分割目標,將圖像分割成為目標和背景兩個部分,求導出平均灰度值。
(3)再根據新的平均灰度值計算出新的閾值。
(4)觀察閾值的初始值與新閾值之間的關系,如歌二者相等則整個計算過程就結束,如果不相等,則就需要進一步計算。
通過閾值計算得出啊的最佳閾值分割效果圖,能夠進行初步的缺陷預判,但是初步預判當中還存在較多的不確定因素,主要包括兩類,一是在邊緣部分出現的細小毛刺,由于與缺陷的距離較近,因此在初步缺陷提取中容易形成誤判、再次是在構件表面有一些非常細小的缺陷,這些缺陷的影響較小,不會對構件的性能造成影響,因此在進行缺陷提取的過程中需要將這兩個因素排除在外,具體主要是指采用圖像形態學中開運算和閉運算,從而達到對構件中的明了細節和暗色細節的過濾。具體來說缺陷的分割提取采用的是Sobel算子。主要是利用了圖像像素點的上下左右灰度加權算法,對構件表面的缺陷進行檢測。再采用二值圖像邊界跟蹤法,將缺陷從構件圖像中分離出來。
2.3缺陷特征提取
缺陷特征提取,又可以稱之為缺陷的定量計算和定性過程,是將前期所得的數據結果以更加直觀的形式展現出來,通過對比指標參數判斷構件的表面質量是否合格,符合基本的生產標準。一般來說常用的表示缺陷特征的標準有以下幾種:
(1)周長:周長是對缺陷的邊界長度的描述,在圖像特征上顯示則是指構件成像上的缺陷區域的邊界像素數量。
(2)面積:面積相對于周長能夠更加直觀地反映整體缺陷的大小,它是缺陷區域中的像素的總數,因此更高體現缺陷的影響規模。
(3)致密性:這是一個相對專業的缺陷指標概念主要是指每平方面積上的平方周倉,是一個雙單位描述指標。
(4)區域的質心:區域質心是描述缺陷的影響關鍵也就是缺陷區域內的核心區域,是對整個區域的核心描述。
(5)最小外接矩形。
3.結語
綜上所述,構件表面缺陷直接影響構件的最終使用效果,構件表面缺陷的檢測應用領域也逐漸廣泛,而計算機視覺技術在檢測缺陷中的優越性更體現了基于計算機視覺的構件表面缺陷特征提取的研究價值。本文主要針對構件表面缺陷的檢測,綜合計算機視覺技術提出了具體的檢測方法和檢測工作原理,通過對表面缺陷的檢測,力圖提高構件的整體質量。
【參考文獻】
[1]陳黎,黃心漢,王敏,何永輝,龔世強.帶鋼缺陷圖像的自動閾值分割研究[J].計算機工程與應用,2002,(07).
[2]許豪,孔建益,湯勃,王興東,劉源泂.基于數學形態學的帶鋼表面缺陷邊緣提取[J].機械設計與制造,2012,(06).
關鍵詞:計算機視覺;地圖匹配;SLAM;機器人導航;路徑規劃
1概述
計算機視覺在人工智能學科占據重要地位,為自主移動機器人視覺導航做了深厚的理論鋪墊。目前,機器人導航技術有很多種,傳感器導航技術如里程計、激光雷達、超聲波、紅外線、微波雷達、陀螺儀、指南針、速度、加速度計或觸覺等得到了普遍應用,與上述非計算機視覺導航技術相比較,計算機視覺導航技術如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優點。由于室內相對室外空間比較狹小且內部環境復雜,所以普通移動機器人在作業過程中,完成躲避眼前障礙物、自主導航以及為自身找出一條可行路徑等一系列操作會相對比較困難。計算機視覺導航技術可利用本身的攝像頭獲得室內周圍的環境信息,實時對其周身的場景進行快速反饋,對視野前方障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文對計算機視覺導航技術進行分類研究,主要分為3類:第一類是環境地圖事先已知,提前對外界環境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內存數據庫中,在導航的時候實時進行地圖匹配;第二類是同時定位與地圖構建,移動機器人在自身位置不確定的情況下根據自身的攝像頭獲取周圍未知環境信息,在作業時逐步構建周圍的環境地圖,根據構建的增量式地圖自主實時定位和導航;第三類是不依賴環境地圖,自主移動機器人不需要依賴任何的環境地圖,其在作業活動時的可行區域主要取決于攝像頭實時識別和檢測的環境相對信息。
2環境地圖的表示方法
目前,計算機視覺導航技術多采用柵格地圖、幾何地圖、拓撲地圖和混合地圖構建環境地圖信息。
2.1柵格地圖
柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個柵格單元賦予一個平均概率值,并利用傳感信息估計每個單元內部內存障礙物的概率。構建柵格地圖的優點是其地圖表達形式直觀,創建和維護比較容易;但當劃分的柵格單元數量不斷增多時,實時性就會慢慢變差;當劃分的柵格單元越大時,環境地圖的分辨率越低。
2.2幾何地圖
幾何地圖利用幾何特征如點、直線、平面等來構成環境主要框架,需要知道這些特征在環境中信息的具置,所以幾何地圖通常使用其對應的三維空間坐標來表示。幾何地圖構建過程相對簡單,保留了室內環境的各種重要信息,是基于計算機視覺的定位與地圖構建算法中最常用的一種表示方式。但是為了完成環境的建模需要標記大量的特征,從而計算量也非常的大,降低了實時性,其重建的地圖也容易出現與全局不一致的情況。
2.3拓撲地圖
拓撲地圖用許多節點和連接這些節點的曲線來表示環境信息。其中,每個節點相對應真實環境中的特征點(如門角、窗戶、椅子、桌子角及拐角等),而節點之間的曲線表示兩個節點對應的地點是相聯通的。拓撲地圖把環境信息表上在一線圖上,不需要精確表示不同節點間的地理位置關系,圖像較為抽象,表示起來方便且簡單。機器人首先識別這些節點進而根據識別的節點選擇節點與節點間的曲線作為可作業的路徑。
2.4混合地圖
混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓撲地圖以及柵格一拓撲地圖。混合地圖采用多種地圖表示,可結合多種地圖的優勢,與單一的地圖表示相比更具有靈活性、準確性和魯棒性,但其不同類別的地圖結合起來管理會比較復雜,難以協調,增加了地圖構建的難度。文獻針對室內環境所建立的模型分為全局拓撲和局部幾何表述部分,整體環境通過拓撲節點串連起來,維護了整體環境表述的全局一致性;而以每個拓撲節點為核心所采用的幾何表述則可確保局部精確定位的實現,這樣建立的幾何一拓撲混合環境模型可將二者的優勢都表現出來,使得移動機器人定位和地圖構建同時進行,實現容易。
3基于計算機視覺的室內導航
基于計算機視覺的室內導航技術可利用攝像頭捕獲機器人周圍環境的全部信息,對其周身的場景進行反饋,對障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文將計算機視覺室內導航技術主要分為3類:第一類是環境地圖事先已知;第二類是定位與地圖構建同時進行;第三類是不依賴環境地圖。
3.1環境地圖事先已知
提前對外界環境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內存數據庫中,在導航的時候實時進行地圖匹配,即預存環境地圖。在環境地圖事先已知的導航中,路標信息保存在計算機內存的數據庫中,視覺系統中心利用圖像特征直接或間接向移動機器人提供一系列路標信息,一旦路標被確定后,通過匹配觀察到的圖像和所期望圖像,機器人借助地圖實現自身精確定位和導航。該導航技術過程可分為以下步驟:
a)圖像獲取:攝像頭獲取其周圍的視頻圖像;
b)路標識別及檢測:利用相關圖像處理算法對圖像進行一系列預處理如進行邊緣檢測和提取、平滑、濾波、區域分割;
c)路標匹配標志:在觀察到的圖像和所期望圖像之間進行匹配,搜索現有的路標數據庫進行標志路標;
d)位置計算:當有特征點進行匹配時,視覺系統會根據數據庫中的路標位置進行自身精確定位和導航。
在基于計算機視覺的地圖匹配定位過程中,主要有2種地圖匹配較為典型。
①已知起點,已知地圖。這種條件下的定位稱為局部定位,采用的是一種相對定位的方法,如圖1所示為其位姿估計過程,這種情況目前導航技術研究得最多。
②不知起點,已知地圖。這種條件下的定位稱為全局定位。當機器人需要重置時,通常使用這種定位方法來檢索機器人的當前位置(即姿態初始化)。常用的輔助方法是在環境中添加一些人造信標,如無線收發器,幾何信標,條碼技術,紅外或超聲波接收系統進行位置識別,利用視覺系統識別自然標志,自主定位。
3.2定位與地圖構建同時進行
不知起點,不知地圖。SLAM技術最早由Smith等人于1986年提出,移動機器人在自身位置不確定的情況下根據自身的攝像頭獲取周圍未知環境信息,在作業時逐步構建周圍的環境地圖,根據構建的增量式地圖自主實時定位和導航。在日后的導航研究中,混合地圖中的幾何一拓撲混合環境模型被得到廣泛應用,主要用來解決SLAM問題。
2003年,在解決SLAM技術難題上,Arras等人采用基于Kalman濾波器和最鄰近(nearest neighbor)匹配策略的隨機地圖創建方法。下面是該算法步驟:
a)數據采集:首先初始化系統,從攝像頭傳感器采集距離數據;
b)狀態預測:視覺系統預測機器人運動狀態,實時返回新位姿信息和協方差矩陣,預測地圖;
c)觀測:從原始捕獲的信息中提取主要特征信息并將此信息返回給局部地圖;
d)測量預測:預測機器人當前位姿的全局地圖;
e)位置匹配:應用最鄰近濾波器匹配局部地圖中的觀測點和預測點;
f)估計:使用擴展Kalman濾波器更新地圖;
g)創建:將非相關的觀測點加入地圖,對機器人返回增量式地圖;
h)輸出地圖。
制約機器人視覺系統性能的重要因素是信息實時處理的計算復雜度和處理效率,SLAM算法需要在地圖密度與計算效率之間取得權衡。
3.3無環境地圖
在這類系統中,機器人不需要依賴任何的環境地圖信息,機器人的活動取決于其當時識別和提取出來的環境信息,這些環境信息可能是桌子、椅子和門等,不需要知道這些環境元素的絕對位置。無環境地圖的導航技術典型的技術有3大類:基于光流的導航技術、基于外觀信息的導航技術、基于目標識別的導航技術和基于目標跟蹤的導航技術。
3.3.1基于光流的導航技術
光流是三維空間運動物體在觀測成像面上的像素運動的瞬時速度,也是圖像亮度的運動信息描述。光流法計算最初是由Horn和Schunck于1981年提出的,其利用二維速度場與灰度,引入光流約束方程,得到光流計算的基本算法。光流計算基于物體移動的光學特性提出了2個假設:①運動物體的灰度在很短的間隔時間內保持不變;②給定鄰域內的速度向量場變化是緩慢的。如Santos-Victor等人研發了一種基于光流的robee視覺系統,該系統模擬了蜜蜂的視覺行為。在robee視覺系統中,使用單獨的雙目視覺方法來模擬蜜蜂的中心反射(Centering Reflex):當機器人移動到走廊兩側的墻壁中心時,左眼捕獲場景的瞬時速度與右眼捕獲場景的瞬時速度是相同的,幾乎沒有差別,那么機器人就可以知道他們在走廊的中心。如果眼睛兩側的眼睛的瞬時變化速度不同,則機器人移動到較慢的速度。在自動機器人導航的實現中,基于這個想法是測量攝像機捕獲圖像場景瞬時速度差異。這種導航技術只能用于室內單通道直走道導航,不能引導機器人改變方向,具有一定的局限性。
3.3.2基于外觀信息的導航技術
基于外觀的機器人導航方法,不需要構建真實的地圖導航,機器人通過自身所攜帶的攝像頭和傳感器感知周圍目標的外觀信息進行自主定位和導航。其中,所述的外觀信息多為目標信息的顏色、亮度、形狀、空間大小和物理紋路等。機器人在導航時存儲連續視頻幀的環境圖像信息,并將連續視頻幀與控制指令相關聯,從而再執行指令規劃有效路徑到達目的地。
3.3.3基于目標識別導航技術
為了達到目標點或是識別目標,機器人很多時候只能獲取少量的圖像信息。Kim等人提出了一種用符號代替導航各個位置的賦值方法。該賦值方法中,機器人執行命令如“去窗邊”“去你后面的椅子旁”等。這樣,通過相關的符號命令,機器人自動識別并建立路標,通過符號指令到達目標點。例如“去你后面的椅子旁”,這樣的命令就是告訴機器人路標是椅子、路徑向后。該導航技術的難點在于目標是否可以準確實時識別路標。第一,識別大量不同類別的物體,室內環境有許多不同類別的物體,需要將它們組織到一個在給定的容易搜索圖像數據結構中去,起到容易識別是用什么度量來區分物體;第二,識別大量不同背景下的物體,一個合適的物體表達式有助于將圖像組織成片斷,而這些片斷來自于物體的種類且與物體無關的;第三,在抽象層次上識別物體,機器人可以不需要在看到一個具體的杯子之前便能知道它是一個杯子,相關程序能夠類似的物體進行識別和區分。
3.3.4基于目標跟蹤的導航技術
基于目標跟蹤的導航技術,為機器人構造一個虛擬地圖,機器人通過攝像頭獲取連續的視頻序定一個跟蹤的目標,為了達到對目標的精確定位和實時跟蹤,可以利用粒子濾波算法對需要跟蹤的目標進行建模。基于粒子濾波的目標跟蹤主要包含四個階段,分別是初始化目標區域,概率轉移,目標區域權重計算,目標區域重采樣。在機器人導航之前,通過視頻序列的當前幾幀標注機器人所需要跟蹤的目標,在導航時,機器人通過連續的視頻幀感知周圍的待跟蹤目標,同時對所需要跟蹤的目標散播粒子,當獲取的視頻幀對目標區域重采樣后足以讓機器人確定所需要跟蹤的目標時,機器人通過確定的目標為自己規劃最有效的路徑到達目的地。獲取視頻序列目標跟蹤是算機視覺領域中的重要分支,它在工業生產、交通導航、國防建設、航空導航等各個領域有著廣泛的應用。
關鍵詞:計算機視覺;課堂考勤;深度學習;MCV架構
前言
隨著國家標準《智慧校園總體框架》(Smartcampusoverallframework)的,智慧校園的規劃與設計成為了校園建設的重點項目[1]。而課堂考勤作為學校教學管理、學生評價的重要組成部分,隨著物聯網技術、人工智能和移動通信技術的水平的提高與發展,更應該向著智能化、準確化的方向發展[2]。本文研究了的當前應用的課堂考勤方式,并做了進一步的分析,最終根據社會技術的革新與發展[3],提出了一種基于計算機視覺的實時課堂考勤系統的設計。我們的主要工作是搭建了整個系統框架,包括數據庫系統、服務器、計算機視覺模型、網絡通信、圖像采集系統、客戶端和網絡通信系統。
1課堂考勤方式現狀
目前校園中主要的課堂考勤方式存在為兩種,分別是傳統的考勤方式和生物識別的考勤方式。如圖1所示,其中傳統的考勤方式包括點名考勤和通過校園卡進行考勤,點名考勤的方式仍然是高校中最常用的考勤手段,因它不受場地的限制,可以根據點名冊直接核對現場的學生信息,但這種方式存在的缺點就是花費時間,影響上課效率,為此有些教師不進行點名,因此影響了考勤的效果。校園卡考勤解決了點名占用課堂時間的問題,但這種方式具有學生代考勤的漏洞,因為學生可以拿著別人的校園卡進行考勤。生物識別的考勤方式包括指紋考勤和人臉識別考勤,這些方式有效解決了傳統考勤方式代考勤的弊端,但這種方式受設備硬件的影響,識別能力太慢,尤其是在下課后學生較多,考勤簽退時容易發生擁擠等現象,具有安全隱患[4]。因此,為解決當前考勤方式存在的一些弊端,本文設計了一種基于計算機視覺的實時課堂考勤系統。
2系統設計基礎
2.1系統開發環境
本文設計的實時課堂考勤系統主要是使用Python開發語言,Python是目前最流行開發語言之一,主要應用于Web服務設計、大數據、人工智能等領域,它的主要優點是開發效率高、可擴展性強、跨平臺和具有可移植性等,滿足了本文系統的設計要求。另外,在開發過程還用到了基于Python的第三方軟件開發包,包括Flask用于搭建系統的Web服務器;PyQt5用于搭建系統的客戶端;OpenCV用于系統中對圖像視頻的處理;Tensoflow用于開發計算機視覺模型,搭建深度學習模型,完成人臉檢測和識別任務;Mysqlclient用于管理、訪問、查詢和更新Mysql數據庫。
2.2系統開發框架
本文設計的實時課堂考勤系統通信基于Web應用,因此選擇一個合適的服務架構有利于提高系統的開發和部署效率。目前較流行的Web應用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)兩種架構。本文使用了基于Python和Flask搭建的MVC架構[5],該架構如圖2所示,主要包括模型層、視圖層和控制器。使用該框架的優點是可將視圖層和業務邏輯層進行分離開發,提高開發效率,方便系統的部署、維護和管理。
3系統設計方式
3.1系統總結構設計
本文設計的實時課堂考勤系統的總體結構如圖3所示。根據MVC構架的設計,我們將該系統分為了模型層、控制器層和視圖層,另外還包括網絡通信設備。
3.2模型層設計
模型層主要是關系型數據庫模,MySQL是目前使用最多的關系型數據庫系統,也是學校管理系統使用最多的數據系統,為了更好地與學校管理系統兼容,我們選擇了MySQL數據庫,數據表之間的關系如圖4所示。
3.3控制器層設計
控制器層主要包括服務器應用軟件和計算機視覺模型,服務器應用軟件的功能包括系統通信配置、數據業務處理和系統各模塊間的調度。計算機視覺模型是實時課堂考勤系統的核心模塊,基于深度學習卷積神經網絡實現[6],主要作用是進行人臉檢測和識別兩個部分,計算機視覺模型的工作流程如圖5所示。在人臉檢測階段使用VGG16檢測器作為主干網絡,為提高模型的檢測準確率,通過引入注意力模型和多尺度特征融合對網絡進行了優化,有效地從輸入圖片中提取人臉位置信息,得到人臉圖像。在人臉識別階段首先使用FaceNe人臉識別網絡提取人臉圖像的特征圖,然后通過決策樹算法與待檢測的人臉特征進行匹配,從而識別圖片中的學生信息。
3.4視圖層設計
本文設計的實時考勤系統的模型層主要包括圖像采集系統和客戶端。目前各學校教室內都安裝有監控設備,因此為節約成本和安裝消耗,圖像采集系統使用教室內的監控設備作為圖像采集系統,負責采集教室現場圖片。客戶端設計首先在本系統中采用應用程序接口,然后在教學管理系統中設計圖形化用戶界面,通過應用程序接口調用本系統的功能,從而減少資源浪費,方便維護和管理。
4實時考勤功能的實現
實時考勤功能的實現方式如圖6所示,首先系統啟動后,用戶可以隨時更新考勤信息,比如在數據庫中創建新的考勤表等。接著系統會自動讀取考勤表的信息,比如課程所在教室、上課時間。然后啟動考勤程序,進行簽到、簽退操作,并將考勤數據保存到考勤數據表中。整個系統啟動完成后可以自動運行,直到關閉系統,而且可以實時進行課堂考勤。
關鍵詞:計算機視覺;手勢交互;膚色模型;靜態識別
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)35-0193-02
1 研究背景
隨著信息化的高速發展,人們的生活也進入了網絡時代。大數據,云計算也進入了人們的生活,其標志性的現象就是各類智能終端設備的不斷涌現,它使人機交互的方式正發生著深層次改變。人機交互的方式正在從傳統的鼠標搭配鍵盤的方式往觸控、語音交互、動作識別等技術為主導的更自然的方式轉變。其中語音與計算機視覺尤為突出,它使計算機變得更加的靈性化。而這兩者中計算機視覺又更能夠傳情表意,它能夠“看”明白用戶的肢體語言或者表情。國內外的自然交互研究涉及了人臉識別、眼神識別、表情識別、手勢識別、肢體語言識別等。手勢識別作為一種人類普遍使用的交流方式,應用在計算機交互上能給人一種直觀和自然的感覺。這種自然的輸入方式把人們從傳統的與輸入設備接觸交互方式中解放出來,使人們與計算機交互更加的輕松愉悅。
計算機視覺是讓計算機可以替代人眼的技術。更進一步說,就是利用視頻采集設備和電腦代替人眼對指定的目標進行識別,并進一步做出計算。其中,手勢識別技術是計算機視覺的一個的重要的研究方向,它是一種常用并且合理的人機交互方式。隨著計算機視覺,包括圖像處理技術以及人工智能等技術,特別是虛擬現實技術的迅速發展,手勢識別的實現更加成為可能。由于客觀環境的多變及人手和手勢的多樣性,如何在限制較少的條件準確識別手勢并能保證其精度、效率以及穩定性是研究的關鍵。
手勢識別按照手勢輸入設備分類,可以分為基于數據手套的手勢識別和基于視X的手勢識別。基于視覺的手勢識別中,最常見的手勢分類是將手勢分為靜態手勢和動態手勢。靜態手勢是一種較簡單的手勢,當用戶做出一個固定和靜止的動作時計算機將其處理后識別出來。動態手勢相對要復雜一些,它可以看做是由一系列的靜態手勢組成的序列。如果將靜態手勢和動態手勢組合,將可以形成語義很豐富的手勢系統。
1目前人機交互的不足
人與計算機之間的交互方式是人機交互研究的核心。從現在的姿勢交互和語音交互往前追溯,有觸摸交互、手寫交互、鼠標和鍵盤交互。姿勢交互又細分為手勢交互、表情交互、身體姿勢交互。
傳統的輸入設備有很多的不足之處。鼠標和鍵盤,由于它們的使用需要接觸,在某些環境下使用不方便。用戶在車站、餐廳、購物商場等場景下要與計算機交互時,使用傳統交互方式十分的不便。而且在公共場合下,接觸性的使用會有很大的衛生問題。不僅需要占用很大的空間,同時也會有設備損耗的問題。
手寫交互和觸摸交互改善了傳統的機械性輸入,它們是更符合人類的使用習慣的。但是它們任然要求用戶要與設備接觸,這不免會在接觸設備的過程中損壞到設備。所以同樣有著易損耗等問題。
基于視覺的手勢交互很好克服了上述交互方式的不足之處。手勢交互是不需要接觸的,沒有損耗問題,也不會有接觸帶來的衛生問題。手勢交互有符合人類動作習慣和直觀自然的優點,使其成為了下一代自然交互方式研究的焦點。
2目前國內外手勢識別狀況
基于視覺的手勢識別不需要昂貴的設備,僅僅需要攝像頭和PC機器就夠了。其廉價的輸入設備會使其將來應用范圍十分廣泛。手勢識別在計算機視覺的研究中是熱點。國內外都有很多的學者在不斷研究。這些研究在手勢的分割、跟蹤、識別和應用中有很多的進展。
國外對基于視覺的手勢識別的研究工作起步很早。L.H.Howe等人使用膚色閾值和幀相減的技術實現了手的檢測和分割。J.Zaletel等人提出了靜態手勢特征的方法,這種方法是用于提取手指的位置的。它先計算出掌心的位置,然后將掌心的位置作為極坐標的原點,將手掌的輪廓映射到這個極坐標,然后利用極坐標上的局部最大值來提取手指的位置。Huang使用3D神經網絡創建的手勢識別系統實現了15個不同手勢的識別[1]。
在技術的應用上面,從上世紀九十年代開始,國外的科學家就開始不斷研究手勢識別技術,并且研制出一些實體來進行試驗,例如:可以模仿人進行手勢操作的機器人;電視控制的傳感系統,無需遙控,利用手勢識別左右上下進行對電視的遙控;體感游戲,更是完美的利用手勢識別,在信息交互中完全釋放出手勢識別的優勢。
我國相對于國外的研究起步要晚,但是目前也取得了很大的研究成果。朱建偉[1]使用兩個攝像頭正交放置,實現了三維手勢的識別,并實現了使用手勢實現對照片的瀏覽。孫玉[3]使用Hu矩特征手勢識別和CamShift算法對手勢跟蹤,實現了手勢對Word的輸入和操作。
3意義
本文主要研究基于視覺的手勢識別技術和對這種技術的應用。目標跟蹤識別是計算機視覺領域中的關鍵技術,多應用于人機交互。手勢識別必將使人與機器之間的溝通變得智能化、信息化,與傳統的輸入設備相比,手勢操作則顯得直觀和自然,更符合人類習慣。
手勢識別作為新型的人機交互技術,手勢識別技術越來越廣泛應用到各個行業。體感游戲首先成熟使用的,改變了傳統的手持物體操作。更加互動,真實。使得人與游戲美妙結合,身臨其境。
手勢識別還可以用于手語識別。手語是聾啞人使用的語言,是聾啞人與正常人交流的平臺。在醫療領域中,具有語言交流障礙的患者,可以通過手勢識別,在預設好系統中,自助掛號,表達病情。更加體現人性化。綜上所述,手勢識別技術越來越被研發人員重視,在日常生活中涉及的領域也越來越多,研究價值也越來越突出。這項技術也將被廣泛的普及推廣到人們生活中的方方面面。
4結束語
基于計算機視覺的識別的功能還可以不斷拓展,可以實現攝像頭檢測人與電腦的距離(當計算機識別出人坐在計算機前時顯示器顯示,當人離開的時候關閉顯示器,達到節約電能的作用)等等。手勢識別還可以應用于虛擬鍵盤,使用一個投影的鍵盤,然后通過攝像頭識別手在虛擬鍵盤上的相關操作。可以用在智慧醫療中,解決傳統的診療掛號方式。從根本上尋找解決病人就醫難的狀況的合理方案將健康的養生知識傳播到更遠更廣。
參考文獻:
[1] Guan Ran and Xu Xiangmin, A Computer Vision-Based Gesture Detectio And Recognition Technique[J]. Computer Applications and Software.2013,30(1):155-164.
關鍵詞 陶瓷設計,計算機視覺、觸覺設計
1前 言
歷經數十年發展,CAD/CAM技術已取得了巨大成功,并迎來了數字化設計、數字化制造的時代。NURBS曲線曲面(非均勻有理B樣條)以其強大的形狀表示能力和配套的計算、編輯算法,已成為事實上的產品表示標準。細分曲面、隱式曲面是近年曲面造型研究的熱點,它們突破了NURBS在拓撲結構上的局限性,更容易表達某些復雜的形狀。
在陶瓷設計領域,經常需要設計人體、動物等自然雕塑形體,現有的CAD系統可采用NURBS曲面、細分曲面、隱式曲面等來描述這些復雜對象[1],但如何能快速、精確地設計出來,目前尚無有效的數字化工具。人們認識、改變外在事物時,主要利用視覺與觸覺的感官功能,通過手眼協調來設計出新的事物,設計師在設計新的對象時,也可如此操作。
近些年出現了一些價格較為便宜的觸覺式設計系統,如FreeForm系統,它抽取了大型虛擬現實系統的單一觸覺功能,可提供真實感的數字雕塑工具。但一般設計人員使用后的效果并不理想,雖可以在局部修修補補,但缺乏對整體形態的把握[2]。
本文提出了一套視覺與觸覺相結合的數字設計系統,以數碼相機和力感觸覺系統為工具,快速實現復雜形體的數字建模。首先利用數碼相機拍照,攝取參考對象的圖像,通過一個專門設計的攝影測量與計算機視覺集成系統重構出參考對象的三維數字模型;然后將此模型輸入到觸覺設計系統,經局部的修正,得到新的設計模型。以下詳述系統組成及原理,并給出設計實例予以驗證。
2造型設計系統的組成
本文所提出的系統主要分為兩個模塊:視覺子系統與觸覺子系統。其中觸覺子系統是購置的,視覺子系統是獨立開發的[3]。相機采用奧林巴斯CL5050,拍攝的照片經視覺反求系統處理后,得到VRML格式的三維模型,然后輸入FreeForm觸覺設計系統,進行再設計,最終輸出改型設計后的數字模型。圖1所示是視覺系統實物,圖2是觸覺系統的實物照片。
2.1 視覺系統[4]
本文提出的系統中,視覺系統為自主開發的,先講述相關的主要原理。
本文采用的視覺系統結合了攝影測量法的高精度與計算機視覺法的靈活性。近年來由圖片生成3D模型是一個熱門的計算機視覺研究領域,并相應提出了諸多的研究方法,其核心問題包括:相機標定、對應點匹配及3D重構等;針對每個問題均有大量的研究算法,特別是相機標定技術幾乎成為一個關鍵環節。
類似于測量系統控制網的概念,我們設計了一套控制特征點,相機直接根據控制特征點進行標定,可得到精度較高的相機內外參數。圖3所示是控制點分布的實物圖。
我們對控制點分布采取了特殊設計,使任意角度下拍照,均有10個(通常要求至少6個)以上特征點被攝取。對特征點,采用了高精度的專業攝影測量系統Aicon加以標定,其空間坐標保存于一個數據文件中,以備相機標定時采用。
有了高精度的相機參數,就可以利用成熟的計算機視覺方法重構3D模型。我們采用了遮擋輪廓法[1]及空間剝離法[2]這兩種對環境要求較低、算法較為穩定的方法,處理標定過的圖像,得到三維模型主要形態,可作為觸覺設計的基礎。
2.2 觸覺系統
觸覺子系統采用FreeForm觸覺式虛擬設計系統,通常也亦稱為3D Touch系統,采用了力回饋技術,手握觸覺筆在空間旋轉移動,屏幕里相應的雕刻刀便隨之移動;當雕刻刀接觸到模型時,會有力回饋到握筆的手上,讓使用者感受到接觸時的力量。在雕刻時可設定模型的軟硬度,進而調整雕刻所需的力。常規的實物雕刻操作,在系統內均有對應的虛擬工具,無論是雕刻效果,還是虛擬雕刻過程中的感受,與實際雕刻幾乎一樣,提供了十分逼真的雕刻環境。
3陶瓷狗的造型設計
在陶瓷設計中,經常需要參考某種實物樣品。本實驗以圖1中的玩具狗作為參考對象,借助視覺、觸覺集成系統進行了兩次造型、建模試驗。視覺系統從不同角度攝取了10幅圖片,由這10幅圖片生成一個三維模型(見圖4)。整個建模過程僅需十幾分鐘,方便快捷。輸出的模型包含了參考對象的主要形態,稍加修整,即可得到新的改型設計。
以視覺系統的輸出為骨架,在FreeForm系統中進行細部的修整與再設計,并可添加修飾色彩,得到新的設計結果,見圖5。
在試驗中,如果僅依靠觸覺設計系統,即使熟練的操作人員,要設計出比例協調、結構合理的模型,也需要花費一天或數天時間。視覺系統的輸入極大地簡化了主體形態的構造,使不太熟練的設計人員也能利用觸覺系統,很快設計出新的作品。
4總 結
本文提出了視覺、觸覺相結合的方法,利用計算機視覺系統幫助設計人員觀察、感知設計對象,并把結果以數字形式保存起來;觸覺系統直接利用已有的觀察結果,通過手眼協調完成最終設計。這種混合系統彌補了非專業人員所缺乏的空間形體洞察力及操縱力,使他們不用經過長期的專業訓練,也可快速地設計出新的作品。本文給出的實例已驗證了這一觀點。
本文揭示了虛擬雕刻過程所忽略的視覺思維環節,并設計出計算機視覺系統來加以彌補,取得了良好的結果,這套視、觸覺結合的設計系統可用于陶瓷產品的設計制造,可大幅度提高設計效率和設計質量。
參考文獻
1 Potemesil M.Generating octree model of 3D objects from their silhouetttes in a sequence of
images[J].Computer Vision&Graphics Image Processing,1987,40(1):1~29
2 K.Kutulakos and S.Seitz. A theory of shape by space carving[J]. International Journal of Computer
Vision,2000, 38(3):199~218
關鍵詞:機器視覺技術;大米;品質檢測
中圖分類號:TP391.4 文獻標識碼:A 文章編號:0439-8114(2012)05-0873-04
Application Progress of Machine Vision Technology in the Quality Inspection of Rice
WAN Peng,LONG Chang-jiang,REN Yi-lin
(College of Engineering, Huazhong Agricultural University, Wuhan 430070, China)
Abstract: The research dynamic of machine vision technology was reviewed from the aspects of rice varieties, germ, crack, yellow grain rice, and so on; and the shortcomings of the machine vision technology in rice quality inspection were proposed for its further application.
Key words: machine vision technology; rice; quality inspection
我國是世界上最大的稻米生產國,稻米年產量常年保持在1.8億t左右,占世界稻米總產量的1/3,居世界第一位[1]。我國也是大米消費大國,有近2/3的人口以大米為主食,全國大米年消費總量保持在1.35億t左右[2]。我國的水稻研究在世界上處于領先地位,但是在國內外貿易、加工和消費等領域中仍然存在諸多問題[3,4]。
我國曾經是世界三大稻米輸出國之一,但是由于我國大米的品質不高,再加上大米的生產標準、質量技術標準、檢驗檢疫技術等與發達國家存在較大差距,在相當程度上影響了我國大米在國際市場上的競爭優勢,大米的年出口量已退居六七位。2008年以來,隨著世界稻米產量的下降,各國對大米出口配額進行調整,導致國際大米的價格出現了瘋漲,而我國出口的大米因品種不穩定、品質較差,在國際市場上競爭力較低,市場份額逐漸減小。
為了提高大米的品質,不但需要選育優質的稻米品種,還需要加強大米品質的檢測。但是,由于我國對大米品質的檢測研究起步較晚,同時也缺乏方便簡單的檢測方法和快捷準確的檢測儀器,在對大米品質進行檢測的過程中,主要依靠人工識別、感官評定等方法進行檢測,這些方法主觀性較強,準確度較低,可重復性較差,工作效率也較低,因此在實施過程中的有效性受到了質疑[5]。
機器視覺(Machine vision)又稱計算機視覺,是指利用計算機實現人的視覺功能,是研究采用計算機模擬生物外顯或宏觀視覺功能的科學和技術,是一門涉及數學、光學、人工智能、神經生物學、心理物理學、計算機科學、圖像處理、圖像理解、模式識別等多個領域的交叉學科[6]。機器視覺技術在農業上的應用研究始于20世紀70年代末期,主要進行的是植物種類的鑒別、農產品品質檢測和分級等。隨著計算機軟硬件技術、圖像處理技術的迅速發展,它在農業上的應用研究有了較大的進展[7,8]。
目前,大部分的大米品質檢測指標根據國家標準采用人工進行檢測,容易產生許多問題。隨著機器視覺技術的發展和在農產品無損檢測領域的廣泛應用,采用機器視覺技術對大米的品質進行檢測,不僅能夠提高大米品質的檢測效率,而且能夠克服主觀因素的影響,降低檢測誤差,使得大米品質的檢測變得更加快速和準確[9]。
1 基于機器視覺技術的大米品質檢測裝置
基于機器視覺技術的大米品質檢測系統由檢測箱、檢測臺、光源、CCD圖像傳感器、鏡頭、圖像采集卡和計算機系統等幾個部分組成[10,11](圖1)。
大米品質檢測系統是一個內空的箱體,箱子的底部是檢測臺,頂部為光源和攝像頭;檢測箱內表面粘貼有背景紙,使光在箱體內形成均勻的漫反射,避免樣品在檢測時形成鏡面反射。光源提供樣品檢測照相時所需的亮度,為了提供充足的光線,同時盡量消除光源照射樣品時在背景上產生的陰影,通常選用環形熒光燈管作為光源[12]。CCD圖像傳感器是獲取數字米粒樣品圖像的關鍵部件之一,它將大米圖像由光信號轉換為表示R、G、B顏色值的模擬電信號,并輸入圖像處理設備進行后續處理[13]。計算機軟件系統用于對采集到的數字圖像進行分析、處理和識別,實現對特定目標的檢測、評價等[14]。
2 基于機器視覺技術的大米粒形檢測
大米的粒形是實現大米分級和質量檢測的最基本參數。根據《GB1345-1986大米》中的規定,評價大米質量的檢測指標主要有加工精度、不完善粒、雜質、碎米等,這些檢測指標與大米的粒形直接或間接相關。由于人工評價是通過肉眼觀察對大米粒形進行評價,因此受檢測環境、視覺生理、視覺心理等諸多因素以及評價人員對大米標準理解程度不同的影響,即便是同一份大米樣品,很難保證大米粒形檢測結果的穩定,而采用計算機視覺技術進行檢測則可以有效避免主觀因素的影響,保證大米粒形檢測結果的準確性[9,15]。
中國農業大學孫明等[16]借助于MATLAB圖像處理工具箱對大米粒形進行測定。首先定義單粒大米子粒的粒長(A)與粒寬(B)的比值為粒形,檢測時先求出大米粒的橢圓離心率R,通過公式:
■=sqrt■
將大米子粒的橢圓離心率轉變為長寬比A/B,即求出大米子粒的粒形。試驗結果表明,該方法具有操作簡單、檢測速度快、重復性好的優點。
武漢工業學院張聰等[17]提出了一種基于計算機圖像分析識別大米破碎粒的方法,即先采用數碼相機獲取大米圖片,再對大米圖片進行分析處理。識別時先將大米圖像的邊緣曲線變換為極坐標形式,再結合大米粒形的一般形狀,用橢圓模板定位米粒,獲得一組與米粒平移、旋轉和尺度無關的形狀描述數據,再運用小波變換提取奇異點及特征參數。試驗結果表明,該方法簡單有效,用于米粒定位與識別時的可信度高。同時,劉光蓉等[18]也研究了通過掃描儀獲取大米的圖像,再采用計算機圖像處理技術將彩色圖像轉化成灰度圖像并進行進一步的處理,最后獲得大米子粒的二值圖像,然后利用八鄰域分析法提取大米圖像的輪廓。試驗結果表明,這種方法的檢測效果良好。
此外,袁佐云等[19]還提出了采用最小外接矩形計算大米粒形的方法。包曉敏等[20]分析了采用Roberts算子、Sobel算子、Prewitt算子、模板匹配法和快速模糊邊緣檢測法對大米粒形進行邊緣檢測,并通過對大米圖像的分割試驗驗證了快速模糊邊緣檢測法最為有效。
3 基于機器視覺技術的大米加工精度檢測
大米加工精度是指大米背溝和粒面留皮程度,即糙米皮層被碾去的程度。大米的加工精度是決定大米外觀質量的主要因素,加工精度越高,米粒表面殘留糠皮量就越少,胚乳表面光潔度、口感、外觀品質也就越好。我國國家標準規定各類大米按加工精度分等級[9]。因此,大米加工精度的檢測具有十分重要的意義。傳統大米加工精度的測定有多種方法,國標中規定大米加工精度的判定采用試劑染色法[21],通過染色劑使米粒胚乳和胚乳表面殘留糠皮呈現不同的顏色差異便于肉眼觀測,該方法受到光照條件、視力、情緒等諸多因素以及各種染色參數的影響,操作繁瑣、效率低、誤差大,不能滿足快速、客觀檢測的需要。
河南工業大學張浩等[22]研究了機器視覺技術結合數字圖像處理技術檢測大米加工精度的方法,首先獲取大米的圖像,利用米粒區域和背景區域的亮度差異將大米圖像轉化為灰度圖像,再利用邊緣檢測函數求出分割閾值,將米粒從背景中分割出來,并計算米粒區域的面積;然后利用米粒區域中糠皮部分和胚乳部分R-B特征值差異,將大米圖像分解為R、G、B分量圖,以R-B矩陣代替大米圖像,再將R-B矩陣轉化為灰度圖,用邊緣檢測函數求出分割閾值把糠皮部分分割出來,計算糠皮部分面積。最后測得大米留皮率為米粒糠皮部分面積與米粒區域面積之比。
江蘇理工大學許俐等[23]將計算機圖像處理技術與色度學理論相結合研究了大米加工精度的自動檢測方法。檢測時先將大米染色,然后采用機器視覺系統獲取大米圖像,再根據染色后大米的胚乳、皮層以及胚芽所呈現的不同顏色特征,采用不同的區分方法獲取米粒不同部位的面積即像素的個數,然后根據胚乳面積與大米圖像總面積的百分比計算大米的加工精度。
此外,無錫輕工大學田慶國[24]根據色度學原理,采用圖像處理技術對染色后的大米進行檢測,識別大米的加工精度,并建立了大米染色后的顏色值與加工精度之間的數據庫。西華大學的劉建偉與日本岐阜大學的三輪精博[25]合作研究大米加工精度與碾白程度之間的關系時,采用改良后的大米精度鑒定NMG溶液,按照品紅石碳酸溶液染色法(GB 5502-85)對大米進行染色獲得米粒表皮呈綠色、糊粉層呈藍色、胚乳呈藍紅色的大米樣品,米粒干燥后采用測差計檢測樣品的顏色計算大米的加工精度。
4 基于機器視覺技術的大米堊白檢測
堊白是指稻米粒胚乳中不透明的部分。堊白之所以不透明是因為稻米子粒中淀粉粒排列疏松,顆粒間充氣引起光線折射所致。按其發生部位可將堊白區分為腹白、心白和背白等類型。通常用堊白粒率、堊白大小和堊白度等概念描述稻米的堊白狀況。堊白是衡量稻米品質的重要性狀之一,不僅直接影響稻米的外觀品質和商品品質,而且還影響稻米的加工品質和蒸煮食味品質[9,26]。
黑龍江農業工程職業學院于潤偉等[27]研究了采用機器視覺技術和圖像處理技術檢測稻米堊白的方法。先用機器視覺裝置獲取大米的原始圖像,再采用圖像處理方法對大米圖像進行預處理,然后應用大津算法自動選取分割閾值對稻米圖像進行兩次分割,分別得到大米子粒的二值圖像和堊白區域的二值圖像,再根據區域內部像素點的聯通性,將不同區域分別進行標記,計算出子粒數和堊白粒數,同時計算出二者對應的面積(像素點個數)。研究結果表明,該算法的自動檢測結果與人工檢測相關性大于90%。
中國農業大學侯彩云、日本東京大學Seiichi等[28]采用微切片三維圖像處理系統對大米的品質特性進行探索性研究,結果表明借助于三維可視化技術分析大米的微切片,不僅可以觀察大米堊白部分內部的組織結構以及在蒸煮過程中的變化,還可以利用灰度直方圖定量計算出堊白米粒中各部分堊白的面積和體積。同時,侯彩云等[29]還利用自行研制開發的機器視覺圖像處理系統對大米的堊白度及堊白粒率進行檢測,試驗結果表明所研制的裝置具有客觀、準確、快速和重現性好等特點,在大米的快速分等定級中具有良好的應用前景。
江蘇大學黃星奕等[30]研究了采用遺傳神經網絡計算大米堊白度的方法。先采用機器視覺系統提取堊白米的圖片,然后采用數字圖像處理技術提取米粒的堊白區域與胚乳非堊白區域的交界區域內的像素,再采用遺傳算法建立一個人工神經網絡識別系統對這部分交界區域內的像素進行識別。試驗結果表明,采用機器視覺系統的檢測結果與人工檢測結果的誤差小于0.05。
此外,凌云等[31]提出了一種基于分形維數的堊白米檢測算法。孫明等[32]采用了MATLAB軟件開發平臺構造了基于計算機視覺的大米堊白檢測算法,完成了對大米堊白參數、堊白度以及堊白粒率的測定。吳建國等[33]從實際應用出發,采用計算機和掃描儀結合開發了機器視覺系統的堊白測定軟件。而曾大力等[34]利用視頻顯微鏡對大米粒進行掃描,結合計算機圖形分析,直接計算大米的堊白大小和透明度,初步探討了視頻顯微掃描技術在大米堊白分析中的應用。湖南農業大學蕭浪濤等[35]開發了基于微軟Windows 98平臺的大米堊白度測定軟件Chalkiness 1.0,該軟件與計算機和圖像掃描儀相結合能夠組成一套高效的大米堊白度測定系統。
5 基于機器視覺技術的整精米率檢測
整精米是指糙米碾磨成國家標準一級大米時米粒產生破碎,其中的完整米粒以及長度達到完整精米粒平均長度4/5以上(含4/5)的米粒。整精米率是指整精米占凈稻谷試樣質量的百分率,它是稻米加工品質優劣的指標,是稻米貿易中商家最關注的內容,與碾米廠的經濟效益密切相關。正確識別整精米是檢測整精米率的關鍵。目前整精米率主要采用人工方法進行檢測,該方法難以滿足對稻米品質快速、準確的檢測要求[9,36]。
中國農業大學尚艷芬等[37]開發了一套基于機器視覺技術的整精米檢測系統用于識別整精米和碎米。該方法通過提取并分析稻米的粒長、粒形等特征參數,提出了同一品種并在同一生長條件下生長的大米粒形具有相似性的前提假設,據此求得標準米,再通過偏差計算、粒長、粒形分析等對整精米和碎米進行識別。采用該方法開發的整精米識別系統對整精米和碎米識別的準確率與人工檢測結果的相關系數可到達0.99。
于潤偉等[38]首先通過圖像識別系統采集大米的原始圖像,再采取動態閾值分割等圖像處理方法把米粒圖像變成二值圖像,然后根據區域內部像素的連通性計算出單個米粒的像素個數;再根據先期計算的整精米長度/面積比換算出米粒長度,最后根據米粒長度判斷整精米和碎米。研究結果表明,該算法的自動檢測與人工檢測的相關性大于99%,可用于整精米的自動檢測。
6 問題和展望
機器視覺技術在農產品的品質檢測方面具有廣泛的應用,國內外的學者在此領域進行過廣泛研究。但機器視覺技術在大米品質檢測領域的應用尚處于起步階段,仍有許多等待解決的技術問題,需要進一步深入研究。
1)目前的大米品質檢測裝置多為靜態檢測裝置,即將大米放于檢測箱中通過機器視覺系統獲取圖片或通過掃描儀獲取圖片,大米相對于攝像頭靜止不動;獲取圖像之后再采用計算機軟件系統對圖像進行分析處理。這種檢測方法效率低下,因此,動態地獲取大米圖像并進行分析檢測是下一個要解決的難題。
2)采用機器視覺系統檢測大米品質時,多采用的是串行化算法,即先獲取大米圖像,然后采用某種算法對大米圖像進行處理,再檢測大米的某項品質指標;之后再采用某種算法對大米圖像處理大米的另一項品質指標,這種檢測方法在處理群體米粒圖像時極大地影響了檢測速度,因此開發并行處理算法對大米圖像進行分析檢測可以有效提高機器視覺系統的工作效率。
3)目前對大米品質指標進行檢測分析時缺少統一的檢測裝置,有的研究者采用CCD攝像頭獲取大米的圖像進行分析檢測,而有的研究者采用掃描儀獲取圖像進行分析檢測,檢測裝置不同、檢測條件不一致難以達到相同的檢測結果,因此有必要研制具有實用價值的大米品質檢測裝置,使基于機器視覺技術的大米品質檢測能夠具有統一的標準。
總之,伴隨著計算機科學技術的迅速發展,機器視覺技術在大米品質檢測中的應用將越來越廣泛。
參考文獻:
[1] 龐乾林.稻米知識縱覽[J].中國稻米,2004(3):44-47.
[2] 劉月好.陳米產生的原因與處理方法[J].糧食加工,2004(1):30-31.
[3] 莊麗娟,刁慕容.中國谷物外貿格局與發展趨向分析[J].中國農墾經濟,2004(8):25-26.
[4] 山世英,彭玉珊.我國農產品出口遭遇技術性貿易壁壘的原因及對策[J].山東農業大學學報,2004,6(2):41-43.
[5] 李里特.糧油產品規格化、標準化是農業現代化的迫切任務[J].中國糧油學報,2001,16(5):1-5.
[6] 劉傳才.圖像處理與計算機視覺[M].廈門:廈門大學出版社,2002.
[7] 趙曉霞.計算機視覺技術在農業中的應用[J].科技情報開發與經濟,2004,14(4):124-126.
[8] 熊利榮,陳 紅,丁幼春.機器視覺技術在農產品破損檢測上的應用[J].農機化研究,2005(5):204-205.
[9] 李天真,周柏清.基于計算機視覺技術的稻米檢測研究[J].糧食與食品工業,2005,12(4):50-53,55.
[10] 凌 云,王一鳴,孫 明,等.基于機器視覺的大米外觀品質檢測裝置[J].農業機械學報,2005,36(9):89-92.
[11] 張巧杰,王一鳴,凌 云,等.稻谷品質檢測技術與裝置研制[J].現代科學儀器,2006(1):128-130.
[12] 趙志強,熊元姣.計算機視覺檢測系統的設計方案[J].工業控制計算機,2005,18(10):1-2.
[13] 唐向陽,張 勇,李江有,等.機器視覺關鍵技術的現狀及應用展望[J].昆明理工大學學報(理工版),2004,29(2):36-39.
[14] 張紀明.基于PC的機器視覺系統研究[J].可編程控制器與工廠自動化,2006(11):107-110.
[15] 任憲忠,馬小愚.農產品粒形識別研究進展及其在工程中應用現狀[J].農業工程學報,2004,20(3):276-280.
[16] 孫 明,石慶蘭,孫 紅,等.基于計算機視覺的大米外觀品質檢測[J].沈陽農業大學學報,2005,36(6):659-662.
[17] 張 聰,管庶安.基于圖像分析的大米形狀識別[J].糧食與飼料工業,2006(6):5-7.
[18] 劉光蓉,周 紅,管庶安.基于圖像處理技術的大米輪廓檢測[J].糧食與飼料工業,2004(6):14-15.
[19] 袁佐云,牛興和,劉傳云.基于最小外接矩形的稻米粒型檢測方法[J].糧食與飼料工業,2006(9):7-8.
[20] 包曉敏,汪亞明,黃振.計算機視覺技術在大米輪廓檢測上的應用[J].浙江工程學院學報,2003,20(2):104-107.
[21] 呂季璋,陳效貴,范慕蕙,等.GB/T 18105-2000米類加工精度異色相差分染色檢驗法[S].北京:國家質量技術監督局,2000.
[22] 張 浩,孟永成,周展明,等.基于圖像處理技術大米加工精度的檢測研究[J].中國糧油學報,2006,21(4):135-137.
[23] 許 俐,錢敏娟,方如明,等.大米加工精度的圖象識別方法[J].農業工程學報,1996,12(3):172-175.
[24] 田慶國.圖像處理技術在大米碾白精度測定中的應用[J].糧食與飼料工業,1997(10):10-11.
[25] 劉建偉,徐潤琪,三輪精博,等.大米加工精度與碾白程度檢測的研究[J].中國糧油學報,2004,19(3):5-8,61.
[26] 周新橋,鄒冬生.稻米堊白研究綜述[J].作物研究,2001(3):52-58.
[27] 于潤偉,朱曉慧.基于圖像處理的稻米堊白自動檢測研究[J].中國糧油學報,2007,22(1):122-125.
[28] 侯彩云,SEIICHI O,YASUHISA S,等.三維圖像處理系統在稻米品質檢測中的應用研究[J].農業工程學報,2001,17(3):92-95.
[29] 侯彩云,王一鳴,凌 云,等.堊白米粒的計算機圖像識別[J].農業工程學報,2002,18(5):165-168.
[30] 黃星奕,吳守一,方如明,等.遺傳神經網絡在稻米堊白度檢測中的應用研究[J].農業工程學報,2003,19(3):137-139.
[31] 凌 云,王一鳴,孫 明,等.基于分形維數的堊白米圖像檢測方法[J].農業機械學報,2005,36(7):92-95,91.
[32] 孫 明,凌 云,王一鳴.在MATLAB環境中基于計算機視覺技術的大米堊白檢測[J].農業工程學報,2002,18(4):146-149.
[33] 吳建國,劉長東,楊國花,等.基于計算機視覺的稻米堊白指標快速測定方法研究[J].作物學報,2005,31(5):670-672.
[34] 曾大力,藤 勝,錢 前,等.視頻顯微掃描技術在稻米堊白研究中的應用[J].中國農業科學,2001,34(4):451-453.
[35] 蕭浪濤,李東暉,藺萬煌,等.一種測定稻米堊白性狀的客觀方法[J].中國水稻科學,2001,15(3):206-208.
[36] 郭英群.對國家標準中整精米率定義及檢測方法的探討[J].糧油倉儲科技通訊,2005(6):52-53.