時間:2023-09-14 17:43:41
開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇計算機視覺感知技術,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。
關鍵詞:雙目視覺;匹配算法;計算機視覺;立體匹配;相位一致性
1.計算機視覺系統分析研究
1.1計算機視覺技術及雙目立體視覺
計算機視覺是通過計算機技術實現對視覺信息處理的整個過程,是一門新的學科。視覺是人們認知事物的重要途徑,視覺是人們對視覺信息獲取、處理和存儲的過程。隨著計算機技術的發展,信號處理技術的應用,人們通過照相機來把實際的事物拍攝下來轉變為數字信息,并通過計算機信號處理技術隊獲取的視覺信號進行處理。計算機視覺技術對圖像的處理分為獲取圖像、特征抽象選取、事物識別及分類和對三維信息的理解。獲取圖像主要是通過攝像機和紅外線等技術對周圍視覺事物進行獲取,并通過計算得到和真實事物相應的二維圖像,二維圖像主要是數字圖像。計算機視覺系統的最基本的功能是數字圖像的獲取。可以看出計算機視覺研究最基本內容是三維場景距離信息的獲取。在計算機被動測量距離方法中,有一種重要的距離感知技術叫作雙目立體視覺。雙目立體視覺技術是其他計算機視覺技術無法取代的一種技術,對雙目立體視覺技術的研究在計算機視覺技術和工程應用方面都是非常重要的。
1.2計算機視覺理論框架
第一個視覺系統理論框架的提出是以信息處理為基礎,綜合了圖像處理和神經生理學等研究內容而建立的。這個視覺系統理論框架是計算機視覺系統的基本框架,與計算機視覺技術有著密切的關系。視覺系統的研究是以信息處理為基礎的,從理論層次、算法層次和硬件層次3個層次進行研究。計算機理論層次主要是表達系統各個部分計算的目的和方法,對視覺系統的輸入和輸出進行規定,輸入作為二維圖像,輸出是以二維圖像為基礎建立起來的三維物體,視覺系統的目的就是對三維物體進行分析和識別,通過計算對二維物置和形狀進行重新建立。算法層次對計算機規定的目標進行計算,算法和計算機表達有關,不同的表達可以通過不同的算法進行實現,在計算機理論的層次上,算法和表達比計算機理論的層次要低。硬件層次是通過硬件來實現算法的一種表達方法。計算機理論層次在計算機信息處理中時最高的層次,取決于計算機的本質是解決計算機的自身問題,不是取決于計算問題的計算機硬件。要更好地對計算機系統和框架進行理解最好的方法就是要區分3個不同的層次,計算機理論的含義和主要解決的問題是計算機的目的,表達算法含義和主要解決的問題是實現計算理論的方法和輸入輸出的表達,硬件的實現的含義和主要解決的問題是如何在物理上對表達和算法進行實現。計算機視覺處理的可以分為3個階段,對視覺信息的處理過程從最初的二維圖像的原始數據,到三維環境的表達。第一階段基元圖的構成,基元圖是用來表示二維圖像中的重要信息,主要是圖像中亮度變化位置及其幾何分布和組織結構,圖像中每點的亮度值包括零交叉、斑點、端點和不連續點、邊緣等。第二階段2.5維圖描述,在以觀測者為中心的坐標中,表示可見表面的方向、深度值和不連續的輪廓,基元是局部表面朝向離觀測者的距離深度上的不連續點表面朝向的不連續點。第三階段三維模型表示,在以物體為中心的坐標系中,有由體積單元和面積單元構成的模塊化多層次表示,描述形狀及其空間組織形式,分層次組成若干三維模型,每個三維模型都是在幾個軸線空間的基礎上構成的,所有體積單元或面積形狀基元都附著在軸線上。視覺理論框架圖如圖1所示。
2.基于計算機的視覺立體匹配算法研究
視覺立體匹配算法是基于人類視覺系統的一種計算機算法。立體匹配算法作為計算機立體視覺問題研究的重點,快速地實現圖像對應點的匹配來獲得視差圖是當今研究的熱點問題。立體視覺匹配算法根據基元匹配的不同可以分為相位匹配、區域匹配和特征匹配3種,其中區域匹配算法可以減少計算負擔,區域匹配算法實時性高,應用前景廣闊。計算機立體視覺通過對人的雙眼進行模仿,在雙眼的立體感知中獲得信息,從攝像機拍攝的圖像中獲取物體的三維深度信息,這就是深度圖的獲取,把深度圖經過處理得到三維空間信息數據,二維圖像到三維空間實現轉換。深度的獲取在雙目立體成像視覺系統中分為兩步,首先在雙目立體圖像與圖像之間建立點對點的對象關系,雙目立體視覺算法研究的重點問題是解決對應點之間的匹配問題。其次以對應點之間的視差為依據對深度值進行計算。雙目成像是獲取同一場景中兩幅不同的圖像,兩個單目成像模型構成一個雙目成像模型。雙目成像示意圖如圖2所示。系統的基線B是兩個鏡頭中心的連接線,空間點w(z,y,z)作為世界坐標的值由(x1,y1)與(x2,y2)進行確定,如果攝像機的坐標位置和空間點w世界坐標的位置重合,圖像平面和世界坐標軸xY的平面就是平行的。如果兩個攝像機在坐標系統中的原點不同但是它們的光軸平行,那么雙目成像計算人們可以看圖3所示,圖3表示的是兩個攝像頭連線在平臺xY的示意。
立體視覺的成像過程是成像的逆過程,具有一定的不確定性。大量的數據信息在從三維影像向二維圖像進行投影的過程會出現丟失的現象,所以視覺系統要通過自然的約束條件才能保證獲取正確的解。這些約束條件在減少匹配的計算量方面可以提供有利的幫助。針對基于區域匹配快速算法,還可以應用基于視差梯度的匹配算法,這種匹配算法應用較大的搜索范圍在邊緣的特征點上進行搜索,采用視差梯度在非邊緣區減少搜索范圍。應用計算機視覺立體匹配算法可以減少成像匹配時間,大大提高了工作效率。計算機立體匹配算法征點的提取是算法的關鍵問題,今后的研究方向重點是對有效特征點提取方法的研究。
【關鍵詞】農產品 計算機視覺技術 品質檢測
農產品品質檢測工作中除了采取人工檢測法以外,還可以采取半自動或自動檢測法,如在水果分級檢測工作中的質量分級檢測法、光電分選法以及大小分級法等。然而農產品品質會受到自然生長環境或人為因素等方面的影響,農產品的色澤、大小及形狀等并不相同,無法采取單一指標進行檢測。因此充分應用計算機視覺技術,對農產品的品質進行檢測,極為重要。
1 計算機視覺技術
計算機視覺技術又被稱為機器視覺技術,指的是通過人類設計,在計算機環境下,達到再現或模擬人類視覺相關的職能行為的一種技術,包括了印刷和手寫文字的識別技術,圖像模式識別技術,物體三維表面形狀識別技術、距離識別以及速度感知等技術。該技術是諸多學科的結合與交叉,涉及到數學、生理學、信息處理、物理學、光學以及計算機等多種學科。探究計算機視覺技術的目的在于實驗人類視覺的再現及延伸,即再現高等動物的視覺系統,并對物體形狀以及類別進行識別。
此外,計算機視覺技術處理的原始資料多是圖像,所以該技術和圖像處理以及模擬識別等有著緊密的聯系。現階段,計算機視覺技術在諸多領域有著較為廣泛的運用,包括了醫學輔助診斷、資源調查、衛星圖像解釋、軍事指導、災害監測、氣象以及工業產品的外觀篩選及檢測等。同時研究該技術在農業工程領域中的應用,也成為了熱門話題。
2 在農產品品質檢測中,計算機視覺技術的具體應用
筆者在查閱相關文獻資料的基礎上,探究在農產品品質檢測工作中,計算機視覺技術在產品表面缺陷以及損傷識別工作中的具體應用;果形識別工作中的具體應用;農產品尺寸以及面積檢測工作中的具體應用。
2.1 在產品表面缺陷以及損傷識別工作中的具體應用
在對農產品進行分級的過程中,依然存在著一大問題,即農產品表面缺損以及損傷識別。而早在1984年就已經出現了采取線掃描和模擬攝像機針對蘋果表面損傷進行檢測的實驗報道,實驗結果顯示,采取數據技術能夠檢測出蘋果表面損傷,其檢測結果完全能夠達到人工分級的精度。與此同時,還出現了一種機器視覺系統,該系統將不規則的圖像信息與正常的圖像信息區分開來,在去除蔬菜內的雜物以及檢測農產品的污點等方面能夠取得較好的應用效果。此外,在1989年,國外出現了一種全新的計算方法,即運用紅外線掃描攝像機,處理蘋果表面的灰度圖像,既能夠確定蘋果表面的損傷面積,還能夠區分不同損傷區。然而還技術是以機械裝置的設定為基礎,需要消耗2s的時間,對一個蘋果進行檢測,蘋果表面缺陷分級精度以及損傷分級進度并不高。
我國在1997年,出現了運用計算機圖像處理技術對蘋果損壞自動化檢測的試驗研究,該試驗結果顯示,該技術的損壞檢出率較高,能夠規避果梗區以及花萼區對于壞損區域識別的具體影響,且該檢測技術的魯棒性較強。
2.2 在果形識別工作中的具體應用
果形識別是影響水果質量的重要因素之一,對于水果品質檢測有著重大意義。當水果成熟后,水果的外形將會發生巨大的改變,且無法采取數學方法進行鑒別,采取其他方式進行果形識別極為重要。
在1981年,有研究人員就針對形狀識別中的圖像特征進行了探討,提倡采取結構分析法以及外形輪廓曲線檢測法,針對水果外形進行識別。并在1985年,以數字圖像分析技術以及模式識別技術為依據,針對番茄定向、番茄形狀、表面缺陷以及尺寸進行分類的特殊算法,運用灰度梯度曲線,明確番茄表面缺陷以及花萼位置等。而我國則在2000年,按照果實形狀分析,通過連續性指標、半徑指標、連續指標對稱性、半徑指標對稱性等特征參數,表示果形,并首次采取參數形狀分析法。
2.3 在農產品尺寸以及面積檢測工作中的具體應用
農產品分級中,以農產品外形尺寸為依據。在1987年,國外就已經開始研究機械視覺技術在牡蠣肉分級以及尺寸檢測工作中的具體應用。并在1992年,針對人工檢測以及機器視覺檢測進行進行了對比分析,試驗結果顯示,和人工檢測技術相比,采取視覺檢測技術,能夠提高檢測的精確度,減少檢測消耗時間;同時在評價以及推廣種質資源中,準確的測量以及詳細的記錄種質形態的指標,有著極為重要的意義。為了能夠精確、快速地計算出玉米種質尺度,在1995年,有研究人員就提出了自動化選擇技術,該技術在處理玉米種質圖像中,其辨別精度極高。
而我國在2002年,有研究人員就針對水果品質進行動態、實時監測的智能化分級生產線進行了研究,該生產線,首先通過水果輸送翻轉系統,利用滾筒式輸送翻轉裝置,將水果往前輸送,在輸送過程中,以水平軸為中心,保證水果表面能夠被系統檢測到,以此獲得圖像信息。然后利用計算機視覺識別系統,對水果等級進行判斷,明確圖像信息。該系統具備了視覺識別功能。最終通過分級系統,完成水果分級工作。
3 結語
在二十世紀七十年代以后,計算機視覺技術就已經得到了較為迅速的發展,在我國,該技術在農產品品質檢測中的具體應用也得到了人們的高度關注,同時也取得了一定的成效。計算機視覺技術作為人眼的延伸技術之一,其具備了人腦功能,運用該技術代替以往的人工操作技術,已經成為了農產品品質檢測工作的必然發展趨勢。
參考文獻
[1]朱從容.計算機視覺技術在水產養殖中的應用[J].浙江海洋學院學報(自然科學版),2008,10(04):191-192.
[2]王勃,徐靜.計算機視覺技術在蘋果葉片營養診斷上的應用[J].農機化研究,2008,(03):887-888.
[3]李朝東,崔國賢,盛暢,等.計算機視覺技術在農業領域的應用[J].農機化研究,2009,10(12):667-668.
作者簡介
陳超(1995-),男,福建省福州市人。現為北京交通大學在校學生。研究方向為電子科學與技術。
【關鍵詞】計算機視覺 運動目標 跟蹤算法
在計算機等現代科學技術尚未出現以前,人們在獲取外界信息時往往主要依賴視覺,而在我國計算機技術水平不斷發展提升的背景之下,計算機視覺技術的出現使得人類肉眼視覺得到了進一步的發展延伸,尤其是在各種傳感器技術的幫助之下,使得人們能夠對保持運動狀態的目標進行實時跟蹤,從而準確掌握目標的具體形態屬性。在此背景之下,本文將運動目標設定為運動的人臉,通過探究基于計算機視覺的運動目標跟蹤算法,希望能夠為相關研究人員提供相關參考和幫助。
1 Kalman filter目標跟蹤算法的簡要概述
Kalman filter目標跟蹤算法是當前眾多跟蹤算法當中使用范圍較廣、使用頻率比較集中的一種跟蹤算法,這一算法最早可以追溯至上個世紀六十年代,人們通過將濾波理論與狀態空間模型相集合,從而得到的一種遞推估計的算法也就是卡爾曼濾波理論。其通過利用上一時刻獲取的預估值以及當下獲取的實際觀測值,在信號與噪聲狀態空間模型當中不斷更新狀態變量,進而順利完成估計預測并獲得當前時刻估計預測值。經過不斷的發展,在計算機圖像處理以及其他運動目標跟蹤當中經常會使用Kalman filter算法。如果在k時刻系統下的狀態向量用xk表示,那么在t0時刻下初始化的狀態預測方程為;在tk時刻下更新系統狀態的具體方程為
,其中Hk、Zk分別表示測量矩陣m×n維以及轉移矩陣n×n維的狀態向量。但在跟蹤計算機視覺運動目標譬如說視頻目標時,由于相鄰的兩幀視頻圖像本身時間間隔非常短,因此目標在這一時間內難以發生明顯的運動狀態變化,此時我們可以通過將此間隔時間設定為單位時間,同時目標在單位時間內一直保持勻速運動狀態,這時我們可以得到一個狀態轉移矩陣且
,定義系統觀測矩陣即為
,定義噪聲Wk以及Vk協方差矩陣則可以分別用
和表示。
如果在濾波器在經過若干次卡爾曼濾波后仍然能夠恢復至原始狀態,則其具有較好的穩定性,但如果在進行運動目標跟蹤實驗的過程當中,對于處于運動狀態的被跟蹤目標,一旦出現遮擋行為則將在第一時間內暫停估計參數,并將這一參數估計值直接代入到狀態方程當中,使得運動目標無論是否被遮擋均可以對其進行精確跟蹤。
2 基于計算機視覺的運動目標跟蹤算法
2.1 建立顏色概率模型
顏色囊括了諸多的信息量光柱點,尤其是在人類的視覺世界從本質上來說也是一種用過感知自然界色彩以及明暗變化的世界,因此人們可以通過使用三基色原理獲得RGB顏色空間。考慮到顏色與計算機視覺場景當中各個場景和目標之間有著緊密的關系,同時不同于目標的大小、形態等其他視覺特征,顏色特征鮮少會受到包括觀察視角等在內各因素的干擾影響,從某種角度上來說基于顏色特征的運動目標具有較好的穩定性。為了能夠保障目標跟蹤既穩定又迅速,需要選擇合適的顏色特征,否則將極有可能導致出現跟蹤失敗。在這一環節當中人們通常使用的是RGB顏色空間以及HSI顏色空間,但由于二者均具有一定的局限性,因此本文在對人臉特征尤其是顏色特征進行選取時,選擇了rgI顏色直方圖的方法,在解決兩N顏色空間自身缺陷的同時,盡量避免目標人臉運動位置以及尺寸等變化因素對目標追蹤造成的干擾影響。在rgI顏色直方圖當中
,,,L=r+g+I其中R、G、B就是RGB顏色空間當中的三原色,r、g、I有著相同的取值范圍即在0到1之間。保持間隔相等的情況下劃分L值即可得到rgI顏色直方圖。雖然rgI顏色直方圖與物體相對應,但如果目標只是位置以及尺寸等出現變化,rgI顏色直方圖并不會受到任何實質性影響,因此在理想情況下,利用rgI顏色直方圖能夠對視頻圖像中不同運動位置以及不同尺寸的人臉進行目標追蹤。
2.2 跟蹤算法
運動目標的不斷變化將會使得模板圖像隨之發生相應變化,因此需要不斷更新模板圖像才能夠有效完成對運動目標的連續跟蹤,本文在對運動目標的實際運動范圍進行預測過程中選擇使用卡爾曼濾波,之后利用rgI顏色直方圖在預測運動范圍之內搜索和匹配相應目標,從而通過此舉獲得與目標模板有著最小歐式距離的區域,在此過程當中存在一個特定閾值T,如果兩者的歐氏距離在進行相減時差值沒有超過這個特定閾值,那么此時該區域就是運動目標所在的實際位置,利用在這一區域當中的rgI顏色直方圖并將其充當下一幀運動目標的匹配模板,在不斷重復的過程中模板能夠實現不間斷地更新。由于相鄰的兩幀視頻圖像之間,時間間隔并不長,因此目標人臉在極短的時間間隔當中基本上不會出現突然變化,此時我們可以認為運動目標人臉的運動連續性比較強,此時利用公式
可以進行歐式距離的計算并用以衡量匹配的模板。其中匹配區域和模板的rgI顏色直方圖分別用l和l'表示,而rgI顏色直方圖中的維數則用n進行表示。根據相關視頻圖像顯示,通過不斷更新模板確實可以對目標運動人臉進行實時跟蹤顯示。
3 結束語
總而言之,本文通過選擇當前比較常見的目標跟蹤算法即Kalman filter算法,利用卡爾曼濾波以及rgI顏色直方圖完成對運動人臉的跟蹤。事實證明,Kalman filter算法確實能夠在對各目標之間的干擾進行明確區分的基礎之上,準確描述運動人臉目標,從而較好地跟蹤運動目標,但由于人臉之間本身存在一定的相似性,因此本文只是對理想狀態下的運動人臉進行跟蹤實驗,日后還需要對計算機視覺技術和Kalman filter算法進行進一步優化以妥善解決多人臉目標以及相似性問題。
參考文獻
[1]鄭薇.基于雙目視覺的運動目標跟蹤算法研究及應用[D].哈爾濱:哈爾濱工程大學,2014.
[2]李慧霞,李臨生,閆慶森,周景文.基于Mean Shift算法的目標跟蹤綜述[J].計算機與現代化,2017(01):65-70.
[3]李寰宇,畢篤彥,楊源,查宇飛,覃兵,張立朝.基于計算機視覺的運動目標跟蹤算法研究[J].電子與信息學報,2015(09):2033-2039.
[4]陳曦,殷華博.基于計算機視覺運動目標跟蹤技術分析[J].無線電工程,2014(06):22-24+39.
生活中,每個人都問過別人“這件衣服是從哪買的?”“這雙鞋是什么牌子的?”這一問題很快會被AI技術解決,只需要拿出手機對著物品拍照,就會得到商品的各種信息,并且能一鍵買買買。這就是美國著名圖片社交網站Pinterest(拼趣)即將推出的應用圖片識別購買業務。
Pinterest總裁Tim Kendall表示,“Pinterest可以即刻在存儲750多億張圖片的巨大網絡空間內進行搜索,從而為用戶找到與所拍攝照片相似的配對圖片,以及查找到哪些地方能夠買到他們所需的商品。”
目前,Pinterest的估值已經達到了110億美元,該公司的專注點正在向營收增長和創收方面轉變。相比Facebook、Twiter等社交網站,Pinterest已經率先找到了一條清晰的創收道路。
從興趣到產品
亞里士多德曾經說過,古往今來人們開始探索,都應起源于對自然萬物的驚異。科技的進步也是如此,就像微軟研發主管和項目負責人Mitch Goldberg所說:“我們想通過該應用向人們展示識別技術的無限魅力。”
今年2月,微軟旗下的Garage實驗室了一款名為“Fetch!”的應用,它可通過機器學習系統識別照片中寵物狗的品種并用文字對該品種進行簡單的介紹。
隨著計算機視覺領域開始利用深層神經網絡這種模仿人類大腦生物過程的系統來從事機器學習,識別的精確度實現了巨大飛躍。也就是說通過機器學習技術,Fetch!識別的準確度會越來越高,隨著大量圖片的涌入,Fetch! 可以自我修復錯誤,從而更加精確地識別每一只狗的樣貌、形態、動作。除了測試狗類品種以外,你還可以把朋友的照片上傳至平臺,看看他們能夠對應出哪種寵物。
微軟的這款產品基于目前最為熱門的一種圖像識別技術――“深度神經網絡”,同樣基于這種技術,微軟還有另一款有趣的產品:。去年5月,有超過5.75億圖片被提交到,超過8500萬來自世界各地的使用者訪問了這個網站,只為尋找一個簡單問題的答案――顏齡機器人認為我看起來像幾歲?如果是合照,并且顏齡機器人識別出的自己比周圍人年齡小,則更能引發用戶的興趣,這種“損人利己”的識別應用著實在社交媒體上火了一把。
另一讓計算機視覺研究技術人員特別感興趣的領域是生物識別,當下最為火爆的莫過于人臉識別技術了。早期的人臉識別技術多為安防領域,如海關識別走私犯、商店識別小偷等。近年來,深度學習的研究與應用使得人臉識別和人工智能的核心技術得到了極大的提升,攝像頭等圖像硬件的發展為人臉識別提供了很好的圖像基礎,如今人臉識別技術應用更加廣泛,比如公司可以使用刷臉打卡來杜絕代人打卡簽到現象。
其實早在2012年,谷歌就開發出了安卓系統的“刷臉解鎖”技術,但因安全問題未解決,該技術一直未能得到普及。
而今年3月,電商巨頭亞馬遜提交了一項針購物付費的專利技術,即消費者在亞馬遜網站購物時可以通過自拍或者視頻來進行付費,無須再輸入賬號密碼。在消費時系統會提示用戶表現出特定的行為、情緒或手勢來證明消費者就是本人,而不是拿著照片的冒名頂替者。
亞馬遜表示,這項技術能使消費者更加安全地進行網上購物,因為很多用戶為了省事會把所有賬戶都用同一個密碼,或者把密碼記在手機里,一旦遭遇“撞庫”或者手機被盜,后果不堪設想,而刷臉技術則沒有這個風險。
除了識別人臉,在識別其他生物方面也有了突破性進展,比如識別寄生蟲。瘧疾,是一種由瘧原蟲造成的全球性急性寄生蟲傳染病,據統計,2015年有大約有2.14億人受瘧疾的影響。
一直以來,醫療工作者是通過肉眼觀察采樣玻片來確定采樣對象是否被瘧原蟲感染,這不但是對醫療工作者經驗的考驗,而且工作效率也十分低下,而貧困地區一直都缺乏有經驗的醫療工作者。
今年2月,根據MIT Technology Review報道,Intellectual Ventures Laboratory(智能事業實驗室)開發出了能夠檢測和評估瘧疾感染的便攜式顯微鏡。這種顯微鏡采用的是一個名為“Autoscope”的系統,通過計算機視覺和深度神經網絡技術,采用深度學習算法來鑒別瘧原蟲。這款便攜式顯微鏡今年在泰國實地測試,成功鑒別出了 170塊玻片中的瘧原蟲如果這項技術得到普及之后,只要診所有一臺Autoscope顯微鏡和一些載玻片,就可解決瘧疾的診斷問題,這將使瘧疾診斷不再依賴于有限的專業醫療人員。
技術轉化為產品
新技術的出現,讓計算機不但“看見”這個世界,更能“看懂”這個世界,可以代替人眼甚至超越人眼。
人的視野是有限的,并且會受到周邊條件的影響,駕駛員在開車時會有視野盲區,還會受到光線的影響,并且大霧、暴雨等極端天氣也會嚴重影響駕駛員的視線。而計算機視覺技術就不一樣了,視野會更開闊,受限制更小。根據汽車媒體《Leftlane》報道,福特公司最新的無人駕駛汽車研究計劃是由激光感應(LiDAR)和雷達、攝像頭形成一張周圍環境的高清3D地圖,不但讓無人駕駛汽車看到攝像頭視野范圍之外的物體,而且并不受光線限制。在夜間試駕后,福特工程師Wayne Williams說:“坐在汽車里,我能感到它在走,但是我往車外看,只能看到一片漆黑。結果令人驚喜,車輛準確地沿著蜿蜒的道路行駛。”
識別場景這一領域技術的發展,使得計算機不但能當機器的眼睛,還能變成人類的眼睛。
對于雙目失明的人來說,能親自感知這個世界是夢寐以求的事,而微軟2016 Build開發者大會上Seeing AI項目正是要幫助盲人實現這一愿望。
Seeing AI項目是通過計算機視覺和自然語言去形容一個人的周圍環境、朗讀文本、回答問題以及識別人的面部表情,可以在手機上使用,也可以在Pivothead的智能眼鏡上使用。如果投入使用,將有助于為視障人士營造更公平的環境,是一款能夠真正改變人們生活的產品,就像此項目的高級項目經理Anne Taylor所說的,這是“為真正重要的場景尋求解決方案”。也許不久微軟能開發出一種仿生眼,直接發送視覺信號到大腦,讓盲人真正看到這個世界。
關鍵詞:運動目標跟蹤;生成方法;圖像感知哈希;OPENCV
中圖分類號:TP392 文獻標識碼:A 文章編號:1009-3044(2016)14-0179-03
隨著計算機信息技術的發展,計算機視覺已經成為研究熱點之一,運動目標跟蹤更是計算機視覺領域的熱門課題。如今運動目標跟蹤技術已經廣泛用于監控、交通、軍事、醫療的等領域。視頻是一幀一幀連續播放的圖像序列,目標跟蹤是指從視頻的某一幀開始,通過目標檢測方法找到到運動目標或者人工指定跟蹤目標,在之后的連續圖像序列中持續對目標進行識別和跟蹤。
目標跟蹤方法通常分為判別方法和生成方法兩種。判別方法把跟蹤看成一個二分類的問題:以目標物體作為正樣本,背景作為負樣本,通過訓練分類器可以把目標從背景中分離出來,從而實現對目標的跟蹤。目前很多判別方法提出,其中STRUCK是判別方法中最杰出的[2],但是此方法需要大量的計算,速度較慢,并不能滿足實時跟蹤的需求。生成方法首先學習外觀模型來表示目標,然后在搜索區域的候選模型中選擇出與目標模型誤差最小的一個作為跟蹤結果。生成方法最早可以追溯到Lucas和Kanade提出的基于原始圖像的整體模板法,即LK方法。僅僅使用原始圖像作為模板,不能很好地提取目標外觀特征,適應目標外觀變化,且需要的計算量較大。Hager和Belhumeur 等人改進了LK方法,對原始圖像進行降維,使用對光照不敏感的低維特征作為目標外觀的表示。在此基礎上,Black和Jepson又提出了使用一定的學習策略進行模型更新,從而更好的處理目標外觀的變化。此時生成跟蹤方法的框架已經形成。隨后很多模型的不同特征被用于跟蹤。如Comaniciu人等結合顏色直方圖和數學上的均值偏移方法,提出了meanshift方法。Collins 拓展了可自適應尺度變換的改進方法camshift。為了更好的處理遮擋和提升實時性能,局部稀疏表示(PCA、稀疏編碼等)和多種特征的聯合表示也被用于目標跟蹤。[1][2]
跟蹤的過程中會出現眾多的干擾因素影響跟蹤的性能,如尺度變換,光照變化,偏移,遮擋等問題。處理這些因素的關鍵在于構造有效且魯棒的外觀表示模型。文獻[1]證明了模型表示的選擇對于跟蹤性能的影響最大。于是近些年來,跟蹤問題更多的焦點集中在尋找有效的表示模型上。本文提出了一個有效的生成方法,使用圖像感知哈希作為模型表示進行跟蹤,
具有尺度不變性和運算速度快的優點,并且引入了模型更新策略,從而解決了目標跟蹤中出現的偏移、遮擋問題。
1圖像感知哈希
感知哈希是指將具有相同感知內容的多媒體信息映射為一段數字摘要,用來對媒體信息進行比對。圖像感知哈希則是對數字圖像的感知信息進行摘要。傳統的哈希技術僅僅簡單地把圖片看作一個二進制文件進行處理,而沒有考慮到圖像上的感知信息。隨著網絡上有損壓縮格式的使用,傳統的哈希算法如MD5、SHA1等方式不再適用于圖片的匹配,于是提出了圖像感知哈希技術,利用的圖片的感知特征作為摘要信息來進行圖像的識別和認證[4]。
在MD5、SHA1這樣的加密哈希方法中,得到的哈希值僅僅是一段固定長度的二進制數字,和其本身的內容沒有關系。單向性和抗碰撞性要求它對輸入的二進制數據的比特變化敏感,也就是說,即使輸入數據一位的比特變化,也會導致輸出哈希值的明顯的隨機變化。
對于數字圖像而言,圖像數據格式的變化,普通的圖像潤飾或者加工操作,圖像通信的信道噪聲等在劇烈改變圖像二進制數據的同時,一般都只會影響圖像呈現信息的質量,而不會改變其內容。因此大部分感知哈希算法都具有共同的基本特性:圖像可以放大縮小,可以有不同的方向、角度,甚至可以有細微的顏色差別,其哈希值都應該保持不變或者在一個指定的閾值內變化。而以上的特性也正好適用于目標跟蹤中用來匹配目標。
2提出的算法
近些年來,已經有很多不同的圖像感知哈希算法提出[5]。其中包含很多復雜的甚至可以加密的方法,但是經測試,即使將很簡單的感知哈希算法作為特征使用到跟蹤中,也能起到很好的效果。
2.1模型表示
本文中采取的感知哈希作為跟蹤目標的模型表示,計算方法如下:
1)將原圖像轉化為灰度圖,灰度圖就可以很好的保存圖像輪廓和細節,減少計算量,提高速度。
2)縮小圖像尺寸,把原大小轉化為8*8的方形圖像。縮小尺寸可以大幅度減少圖像的高頻信息,保留低頻信息。低頻信息反映了圖像的整體框架,具有對放大、縮小、平移、模糊的不變性,這也是圖像哈希可以作為目標跟蹤匹配特征的關鍵原因。
3)計算所有像素灰度的平均值,用于和每個像素比較。
4)將所有的像素值與平均值進行對比,大于等于平均值記為1,小于平均值記為0。
5)把這64個2進制位由在原圖像從左到右從上到下的順序排列,形成哈希值。
以Lena圖為例,計算圖像感知哈希的步驟如圖1所示:
2.2 運動模型和觀察模型
跟蹤算法使用圖像感知哈希作為模型特征,以兩個哈希值之間的漢明距離作為評判相似度的標準(觀察模型)。漢明距離表示哈希值中對應位置二進制位不同的個數,漢明距離越大,說明圖像越不相似,反之則越相似。
漢明距離的計算:d(x,y)=∑x[i]y[i],如下所示。
由[1]我們得知,在選取合適特征情況下,即便是用很簡單的跟蹤框架也能夠實現很好的跟蹤效果。本系統在第一幀使用人工標注的方法圈定要跟蹤的目標,之后的每一幀使用滑動窗口作為運動模型搜尋目標:在當前目標2*2的范圍內尋找目標,使用漢明距離作為觀察模型來從候選的模型中選取最接近目標的一個。如圖2。
2.3偏移問題
在模型更新的過程中,由于誤差積累,會導致跟蹤結果偏移。對于此問題,本算法采取使用第一幀和上一幀的權重共同跟蹤的方法,第t幀的模型M(t)=αM(0)+(1-α)M(t-1),其中α表示第一幀中目標模型所占的權重。隨著時間變化,第一幀的權重應逐漸減小。本方法中取α=1/(1+t)。
2.4 遮擋問題
當模型被遮擋時,如果繼續更新,會導致更新到覆蓋物更新到了錯誤的模型。所以本方法中的模型更新針對遮擋也提出了解決方法。d(h)表示漢明距離,當0
2.5算法流程
1)在視頻的某一幀使用鼠標拖拽圈定要跟蹤的目標,作為模型T,大小為p*q,左上角像素的位置為(m,n)。
2)計算選中窗口區域的感知哈希值H(T)。
3)下一幀F中使用在當前位置的2*2大小的窗口中滑動,計算每個大小為p*q的子窗口Fi,j的哈希值H(Fi,j)。i,j為子窗口Fi,j 左上角的像素在F圖中的坐標,稱為參考點。i,j的取值范圍:m-p/2
4)比較搜索窗口和模型窗口的哈希值的漢明距離D(H(T),H(Fi,j)),選取所有子窗口中漢明距離最小的子窗口作為跟蹤結果。
5)根據提出的模型更新機制決定是否將跟蹤結果Fi,j作為下一幀的跟蹤模型T,重復步驟2到步驟5。
3 基于Opencv的系統實現及仿真實驗
Opencv是一個開源的數字圖像處理和計算機視覺的函數庫,實現了圖形圖像處理和計算機視覺方面的很多通用算法,方便開發人員將注意力集中于算法的實現而不需要自己寫一些底層操作代碼,避免造成時間和精力上的浪費。
Opencv提供了數組、序列、矩陣、樹等基本結構,也包含了差分方程求解、傅里葉分析、積分運算、特殊函數等眾多高級數學計算函數,以及各種圖像處理操作和目標跟蹤、攝像機校準、三維重建等高級視覺函數。本設計中的基本功能如讀取視頻,鼠標選取操作,縮放圖像,彩色圖像轉化為灰度圖像等基本功能都由opencv提供的函數實現。
本設計基于windows10+visual studio 2013+opencv2.4.11環境,實現了在固定的背景的情況下進行穩健的目標跟蹤,具有尺度不變性和光照不變性,達到不需要預先訓練的每秒30幀以上的實時跟蹤效果。圖3為程序在第82、269、550、736幀跟蹤到的結果。
4 結論
實驗結果表明,在目標跟蹤中引入圖像匹配中的感知哈希方法作為跟蹤特征,有較快的運行速度、準確度和魯棒性,可以作為一種良好的特征用于目標跟蹤。雖然與Object Tracking Benchmark[2]中排名靠前的算法相比,本設計仍然有差距,但是提出了一種將圖像感知哈希引入跟蹤的概念。近些年來還不斷有新的感知哈希算法提出,不乏兼具尺度不變性,旋轉不變性等良好特性的感知哈希算法,試想將這些方法用于運動目標跟蹤,會具有更好的跟蹤效果,可作為目標跟蹤發展的下一步研究方向。
參考文獻:
[1] N Wang, J Shi, DY Yeung, J Jia. Understanding and Diagnosing Visual Tracking Systems[C].International Journal of Computer Vision, 2015.
[2] Wu Y, Lim J, Yang M H. Object Tracking Benchmark[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2015.
[3] 徐光柱,雷幫軍.實用性目標檢測與跟蹤算法原理及應用[M].北京,國防工業出版社, 2015.
[4] Schneider M, Shih-Fu Chang. A Robust Content based Digital Dignature for Image Authentication[C]. Proc of IEEE International Conference on Image Processing, Lausanne, 1996.
關鍵詞:高速鐵路 路基 沉降 沉降觀測 預測模型
中圖分類號:U215
文獻標識碼:A
文章編號:1007-3973(2012)005-037-02
1 前言
鐵路路基暴露在室外,加之我國地域廣闊,地形、地質、水文、氣候等情況復雜:路基邊坡和坡腳受坡面雨水沖刷、日曬雨淋將引起土的干濕循環、氣溫變化將引起土的凍融變化、河水對邊坡或坡腳處地基不斷的沖刷和淘刷等,使路基常年處于升降動態循環之中,路基附加應力受其很大影響。路基填料級配不良、排水失效、過渡段碎石級配失效或不養生、路基橫向碾壓、填料含水率超標等將引起路基沉降。鐵路兩旁新修建的建筑物尤其是特大型建筑也會對路基產生影響,所以鐵路路基沉降在一定意義上講不可避免。但過大的變形沉降將直接影響旅客舒適度以及行車安全,所以必須對高速鐵路路基沉降加以防治。本文著重介紹高速鐵路路基沉降觀測及預測技術。
2 高速鐵路路基沉降測量控制要求
只有做好高速鐵路路基沉降測量工作,才能保證沉降控制工作的順利完成,為接下來的工作提供數據資料。所以工程技術人員要采用科學正確的方法,高效的完成測設工作,要保證測量精度要求,利用配套計算機對所有觀測值進行嚴密平差,保證整個控制精度完全能夠符合國家工程測量技術規范和工程設計要求。
2.1 設備要求
高速鐵路沉降觀測要求高精度,為了精確測量路基的沉降情況,一般規定測量的誤差應小于變形值的1/10—1/20。采用一般儀器,會受到周圍環境的影響而導致誤差過大,所以對觀測儀器的精度要求極高。觀測時應優選受環境影響小的儀器,比如精密水準儀。
2.2 觀測人員要求
高速鐵路沉降觀測要求高精度,工程技術人員應該有較高的職業技術水平和職業道德。觀測人員應該專業、準時、高效的完成測量任務,對觀測數據認真負責,堅決杜絕補測或修改數據等惡劣行為。
2.3 實際觀測的具體要求
觀測前,要對觀測地點的地形、地貌、地質、水文以及氣候等情況加以調查,聯系實際情況選擇最適宜的觀測方法,既要保證觀測的高效,又要保持正精度的要求。
2.4 觀測點的選取
高速鐵路沉降觀測精度高,所以對觀測點的選取要求也很高,在保證方便觀測的前提下,選擇合適的觀測點,最好是視野開闊,地勢平坦的穩定位置。
2.5 觀測周期及觀測時間
施工階段,應隨施工進度及時進行。觀測次數與時間間隔應視地基與加荷情況而定。在觀測過程中,如有路基附近荷載突然增減、長時間連續降雨等情況,均應及時增加觀測次數。若路基發生大量沉降、不均勻沉降或嚴重裂紋時,應該立即進行逐日甚至一天數次的連續觀測。
3 路基沉降預測模型的應用
對高速鐵路路基沉降進行預測傳統的方法有三種:(1)采用分層總和法計算最終沉降量,利用簡化固結公式計算固結度,然后推算沉降的發展規律與趨勢。(2)根據固結理論,結合室內試驗獲得土的各種本構模型,利用有限元方法預測最終沉降量以及其發展規律。(3)基于前期沉降量實測資料來建立沉降量與時間關系數學模型的預測方法。
3.1 曲線擬合法
曲線擬合,就是通過實驗獲得有限對測試數據(xi, yi),利用這些數據來求取近似函數y=f(x)。式中x為輸出量,y為被測物理量。即通過分析實測資料與時間的關系,建立適當的沉降與時間的函數關系,進而推測沉降的發展規律。曲線擬合法是將沉降近似看做按照某種規律變化的過程,對實際測量的沉降數據進行擬合,建立某種相適應的曲線模型,采取適宜的優化方法,反推出計算公式所需的參數,在運用于后期的沉降預測。此方法參數較少并且易于確定,所以應用廣泛。工程中常用的曲線擬合法包括:雙曲線法、星野法、指數曲線法、三點法、沉降速率法、Asaoka法、S形成長曲線模型。
3.2 灰色系統理論
灰色系統理論是20世紀80年代,由中國華中理工大學鄧聚龍教授首先提出并創立的一門新興學科,它是基于數學理論的系統工程學科。灰色系統理論,是一種研究少數據、貧信息不確定性問題的新方法。灰色系統理論以“部分信息已知,部分信息未知”的“小樣本”、“貧信息”不確定性系統為研究對象,主要通過對“部分”已知信息的生成、開發,提取有價值的信息,實現對系統運行行為、演化規律的正確描述和有效監控。
3.3 人工神經網絡
人工神經網絡是一種應用類似于大腦神經突觸聯接的結構進行信息處理的數學模型。在工程與學術界也常直接簡稱為神經網絡或類神經網絡。神經網絡是一種運算模型,由大量的節點和之間相互聯接構成。每個節點代表一種特定的輸出函數,稱為激勵函數。每兩個節點間的連接都代表一個對于通過該連接信號的加權值,稱之為權重,這相當于人工神經網絡的記憶。網絡的輸出則依網絡的連接方式,權重值和激勵函數的不同而不同。而網絡自身通常都是對自然界某種算法或者函數的逼近,也可能是對一種邏輯策略的表達。利用人工神經網絡理論建立預測路基沉降的BP模型和Elman模型,兩種模型在預測路基沉降時,不需要建立任何土工模型,只要采集訓練網絡的樣本就可以比較精確的預測路基沉降。
3.4 遺傳算法
遺傳算法是由美國的J.Holland教授1975年首先提出,是一類借鑒生物界的進化規律(適者生存,優勝劣汰遺傳機制)演化而來的隨機化搜索方法。其主要特點是直接對結構對象進行操作,不存在求導和函數連續性的限定;具有內在的隱并行性和更好的全局尋優能力;采用概率化的尋優方法,能自動獲取和指導優化的搜索空間,自適應地調整搜索方向,不需要確定的規則。
路基沉降預測模型的建立對于高速鐵路沉降預測與控制至關重要。適宜的預測模型可以很好地預測路基沉降的發展趨勢,對于工程施工以及線路運營階段的管理都有指導作用。通過路基沉降預測模型與實測數據,推算最終沉降量,若預測沉降超限,應及時采取相應的工程措施。
4 一種新的沉降測量方法:計算機視覺測量技術
計算機視覺測量技術是近年來測量領域中迅速發展起來的嶄新技術,它是以現代光學為基礎,融合計算機技術、激光技術、圖像處理與分析技術等現代科學技術為一體,組成光電一體化的綜合測量系統。視覺測量技術的檢測儀器設備能夠實現智能化、數字化、小型化、網絡化和多功能化,具有精度高、非接觸、在線檢測、實時分析與控制、連續工作等特點。計算機視覺也稱為機器視覺,是指利用計算機對采集的圖像或者視頻進行處理,從而代替人眼的視覺功能,實現對客觀世界的三維場景的感知、識別和理解的技術。計算機視覺使用計算機及相關設備對生物視覺進行模擬。其主要任務是通過對采集的圖像或視頻進行處理,以獲得相應場景的三維信息。計算機視覺使用的理論方法主要基于幾何、概率、運動學計算和三維重構等視覺計算機理論,其基礎包括攝影幾何學、剛體運動學、概率論與隨機過程、人工智能等理論。運用計算機視覺測量技術,可以實現高速鐵路沉降的遠程自動化觀測,方便、快捷、實時性強,即可以保證測量的精度,又減輕了工程技術人員的負擔,是一項有待發展的新興測量技術。
5 結論
綜上所述,高速鐵路路基沉降對于工程建設、旅客舒適度、運營安全有著致命影響,所以路基沉降觀測是必須采取的。采用正確的觀測方法,嚴格按照基本要求和規范觀測,建立正確的陳建預測模型,保證路基沉降在標準的允許范圍之內是高速鐵路建設的關鍵。隨著新興技術的發展,沉降觀測及防治措施必定越來越多,越來越精確,我國的高速鐵路事業也必將更上一層樓。
參考文獻:
[1] 仝校濤.試論高速鐵路路基沉降控制方法[J].黑龍江科技信息,2011,(27).
[2] 李春光.高鐵路基沉降分析及控制[J].建筑科技與管理,2011,(3).
[3] 易思蓉.鐵道工程(第二版)[M].中國鐵道出版社,2009.
【關鍵詞】 計算機視覺 嵌入式 雙目立體視覺 物體大小 opencv
引言
隨著計算機計算能力的提高,圖像分析越來越凸顯出其在各個領域的優勢,而單攝像頭所得到的單張平面圖像已經滿足不了人們在各個領域內對圖像處理的要求,雙攝像頭的圖像處理技術應運而生。人眼對世界的感知就是通過雙眼得到的,圖像工程領域模仿人眼的結構,設計了雙目攝像頭,在二維圖像的基礎上將圖像拓展成為了三維。
本文基于OpenCV庫,OpenCV是一個開源的計算機視覺庫,可以運行在Linux、Windows和Mac OS操作系統上,它輕量級而且高效――由一系列 C 函數和少量 C++ 類構成,實驗平臺為Exynos 4412開發板,是一款基于ARM Cortex-A9架構的嵌入式開發平臺,從雙目測距的原理開始,使用了canny算子等算法實現了對雙目攝像頭中物體的提取和識別,并通過輪廓檢測實時計算出物體的尺寸大小。經實驗驗證,計算結果準確,具有很高的實用價值。
一、雙目測距的原理
1.1基本原理
雙目測距是基于視差的原理,該模型是基于一套無畸變、對準、已測量好的完美標準立體實驗臺的數學模型,即兩攝像頭所得圖像無任何畸變,完全基于小孔成像原理,兩圖像平面完全在一個平面內,每一行像素點平行且對其,兩攝像頭參數完全相同,如下圖。
深度與視差成反比,兩者是明顯的非線性關系,當視差接近0時,微小的視差變化會導致很大的深度變化;當視差較大時,微小的視差變化幾乎不會引起深度多大的變化。因此,立體視覺系統僅僅對于物體與攝像機相距較近時具有較高的深度精度。
1.2相機的標定的基本原理
對攝像機進行標定,其實質是求解攝像機成像模型中的相關參數。在眾多攝像機模型中,最簡單的是針孔模型。但是攝像機鏡頭都是采用的透鏡成像,并不是理想的針孔模型,透鏡的使用帶來了透鏡畸變。[1]在opencv中,常用的攝像頭畸變模型為
其中,R為兩攝像頭間的旋轉矩陣,T為兩攝像頭間的平移矩陣。Rr為右攝像頭經過張氏標定得到的相對標定物的旋轉矩陣,Tr為右攝像頭通過張氏標定得到的相對標定物的平移向量。Rl為左攝像頭經過張氏標定得到的相對相同標定物的旋轉矩陣,Tl為左攝像頭經過張氏標定得到的相對相同標定物的平移向量。
在opencv中,可以利用棋盤格標定盤進行標定,使用FindChessboardCorners()抓取角點。獲取亞像素角點坐標 FindCornerSubPix(),單目標定,求取攝像機內外參數ClibrateCamera2()。雙目標定,求取兩攝像機相對位置關系StereoClibrate()。
圖為立體標定后的修正圖。
二、物體識別
2.1物體識別的基本原理
首先對雙攝像頭得到的圖片進行立體匹配,然后對原始圖片進行二值化處理、高斯模糊、canny算子輪廓檢測,尋找物體輪廓并用最小四邊形將物體完整框出,通過計算四邊形四個頂點的坐標得到物體的像素大小。
2.1物體識別的opencv的實現
Opencv提供了BM算法、SGBM算法、GC算法三種立體匹配算法,三種算法的匹配速度從高到低,匹配質量從低到高,出于匹配速度和匹配質量的考慮,在這里使用SGBM算法進行計算,在opencv中提供了cv::Ptr類,運行效果如圖。
三、物體實際大小的計算
3.1物體實際大小的計算原理
獲得景深圖后,對物體輪廓進行檢測,并用最小四邊形框出物體的輪廓,通過計算四邊形四個頂點的坐標得到物體中心點的像素坐標,通過雙目測距的原理獲得物體中心點距離攝像頭的距離。根據三角形原理,可以計算出物體的寬度和高度,實現物體大小的測量。
3.1計算物體實際大小的實現
首先使用reprojectImageTo3D生成三維點云,使用findContours獲得物體輪廓,遍歷刪除最大最小的輪廓,使用minAreaRect獲得輪廓的最小矩形并得到矩形四個頂點的坐標,通過三角函數計算出物體的大小,并通過雷達扇形圖顯示在屏幕上。
四、結束語
通過對opencv平臺的利用,可以將注意力完全集中到圖像識別的算法上去,本文基于Exynos 4412開發板,所編寫的程序具有很高的可移植性和運行實時性。全文對雙目攝像頭物體大小識別的各個步驟進行了概括性的介紹,包括雙目測距的原理、攝像頭的標定、物體輪廓的識別等方面,并對各個步驟的原理做了簡要介紹。本文基于算法的實時性和準確性考慮,經過多次實驗選取了相對符合要求的算法,保證了實驗結果的穩定性。盡管如此,本套研究成果在算法的優化上仍有提高的空間,后面會繼續完善算法從而擴大算法使用的領域和準確性。
參 考 文 獻
[1](袁 利 劉海華 陸雪松. 基于 OpenCV 的雙目攝像機標定. 現代科學儀器 2013.4)
關鍵詞:計算機視覺;視覺檢測系統;四足機器人
1引言
運營商巡檢任務,主要有設備的外觀、溫度、噪音狀況巡視,其中包括變壓器、網絡交換設備、母線、隔離開關、路由網關等,巡檢任務量大,并且要在雷雨等特殊天氣和用電高峰期時增加特殊巡檢,但目前主要方式為人工巡檢,巡檢效果因人而異,與巡檢人員對設備的了解、人員的責任心等有很大關系,還存在一定危險性[1]。因此,急需打造基于智能機器人的視覺檢測系統,采用AI技術對通信設備關鍵零部件圖像進行實時分析,判別設備零部件的狀態故障與關鍵參數變化,并結合5G的高帶寬低時延高并發特性,以5G網絡進行“云-端”高分辨率圖像傳輸和智能控制,持續提高協同運營水平,保證制造企業安全運轉[2-3]。
2功能介紹
天津移動AI實驗室主持研發了面向智慧巡檢的機房巡檢四足機器人“赤驥”。“赤驥”取名來自“穆王八駿”,傳說為周穆王八駿之首,代表了四足機器人如駿馬一般快如閃電。為了解決人工巡檢強度大、質量不均衡、輪式機器人無法適應狹窄空間和復雜地形等問題,打造了以四足機器人為平臺的檢測系統,以5G網絡實現4K級高清圖像的實時傳送,在移動云高性能GPU集群完成處理和分析,并指揮機器人實時響應后臺指令,從而完成圖像自動存儲對比分析、紅外精確測溫、巡檢及告警等作業,探索智慧工業、指揮園區、智慧安防場景下的四足機器人巡檢。如圖1所示。
2.1構建基于四足機器人的視覺安全巡檢系統,驅動智慧化變革
機房巡檢四足機器人在機房環境中巡檢,需要滿足運動、障礙規避的能力和導航精度,攜帶有相應的攝像頭和傳感器,具有配電設備檢測功能。機器人完成圖像采集后,高清視頻通過5G-CPE經高速網絡傳遞到云端GPU集群,進行目標檢測和異常識別,檢測場景包括:工程人員合規性檢查、電子屏及儀表讀數檢測、熱成像測溫檢測、異常侵入檢測等情況,自動觸發告警,提醒運維人員進行檢查。
2.2打造多模數據融合的四足機器人檢測平臺,支撐巡檢新方法、新流程
機房巡檢四足機器人主要由運動底盤、控制管理系統、監控管理系統、網絡模塊組成。運動底盤是巡檢系統的四足平臺,上面搭載著多種傳感器,比如激光雷達、姿態傳感器、超聲波傳感器等用于定位和導航,另外上層搭載眾多智能設備如可見光攝像機、熱成像測溫攝像機、拾音器裝置等,將視覺數據采集完畢后,配合GPU集群部署的計算機視覺深度學習框架,完成配電站的巡檢任務。
2.3構建四足機器人控制管理系統和軟件環境,實現“5G+AI”技術融合賦能
控制管理系統,通過網絡系統連接四足機器人軟件環境,進行巡檢任務中的環境地圖建立、巡檢路徑點部署、設備狀態信息記錄和巡檢任務啟動等管理過程。按照預設的巡檢路線到達位置后,以多種視覺傳感器采集視頻,以目標檢測、圖像分割和異常分類等方法,自動檢測電氣化設備是否安裝正確,是否存在異常連接、關鍵原件缺失、設備安裝錯誤等問題,檢測結果可以在控制管理系統的手機APP中查詢。監控管理系統用于巡檢任務下達,并遠程觀測巡檢任務的執行情況,必要時可以通過遠程點檢方式,由人工和智能方式協同檢測。網絡模塊包括機載路由器、局域網交換機和無線CPE(5G模組),車載網絡路由器和局域網交換機通過有線以太網連接,多種高清視覺設備為了傳輸穩定也采用有線連接,四足機器人系統局域網交換機通過無線CPE,以5G高速網絡實現和GPU集群進行數據交互,以即時控制。如圖2所示。
3應用情況
機房巡檢四足機器人“赤驥”,除了應用在運營商機房,也可應用于工廠、園區、變電站、城市地下管廊、電力隧道管井及其他重要場所,通過上述區域的例行檢查和定點巡查,獲取環境信息以及傳感設備的識別信息。一臺機器人可覆蓋2萬5千平米的巡檢區域,巡檢時段可達2小時/日,異常識別精準度90%,相比人工巡檢效率提升2倍。目前,四足機器人是機器人巡檢領域的發展新趨勢,也存在續航能力不足、自動回充能力不足、負載設備重量限制等問題,天津移動將不斷解決問題,加強四足機器人的實際應用效果。系統目前已在天津移動公司內全面推廣,在智慧工業行業拓展、5G基站施工巡檢、統一資源池機房巡檢、通信機房巡檢,在天津移動移通大廈、曹莊樞紐等重要機房場景內累計試運行5個月,單次巡檢面積2000平方米,累計巡檢面積達30萬平方米,巡檢次數25輪次。本成果適用于智慧工業、智能制造企業的巡檢管理,可以顯著加強工業互聯網發展背景下創新管理的主動性,精確性和互動性,提升了客戶滿意度,探索了面向工業應用的人工智能賦能新模式,形成強大的精細化管理能力。
4推廣價值
四足機器人“赤驥”填補了中國移動在機器人控制和計算機視覺技術領域的空白,相關人工智能技術(計算機視覺,級聯神經網絡、目標檢測)在集團內處于領先地位,具有非常好的產品可持續性、推廣性和示范效應。
4.1構建行業標準,降本增效成果顯著
利用現有通信機房、電氣機房采集的80萬張設備檢測圖像庫,對深度學習模型的準確率和誤識別率進行測試,平均正樣本率98.8%,負樣本率97.9%。顯著高于外部開源視覺框架系統在天津移動設備圖像庫的表現。通過機器人的攝像頭采集,到識別出溫度異常、設備缺陷或者異常人員,全流程僅3-5秒,處理效率高。單個圖像視界內支持同時100個小目標的識別和比對,多任務多目標處理能力強,準確度不下降。對于單次比對,基于級聯神經網絡實現微小目標識別和分類,無延遲,無漏檢。
4.2填補技術空白,獲得認證及資質
此系統在數據、模型、技術方法三個方面均填補了集團空白,具有非常好的技術可持續性。已獲得國家AI行業聯盟、天津市科委和集團公司的技術、研究、應用、自主性認證,核心價值非常高。入圍中國移動自主開發大賽決賽獲得總決賽銅獎和最佳商用推廣獎,已通過中國移動全網測評中心的檢查,自主研發能力獲得集團認證。同時,也在天津市科技成果轉化中心獲得科技成果鑒定,水平為“國際先進”。
5結束語
機房巡檢四足機器人“赤驥”,實現了中國移動機房環境巡檢效率提升。替代機房巡檢作業人員的日常例行巡檢任務,包括設備檢測、溫度檢測、煙霧檢測、儀表讀數檢測,濕度檢測、螺栓脫落檢測、異常電壓檢測、網絡設備光口電口檢測等。替代機房巡檢作業人員對工程作業的生產合規性檢測任務,包括身份合規性審查安全帽檢測、安全帶檢測等,以人工智能技術代替人力,尤其是以計算機視覺實現高清攝像,后端打造多個目標檢測、物體識別模型,實現運營商機房設備的看護。替代機房巡檢作業人員的周期抽檢任務,機房巡檢人員無需每個作業周期都到現場進行檢測,僅需要查閱機器人巡檢后的計算機視覺檢測結果,并適當使用遠程點檢功能進行設備抽檢即可,可靠度高,實現了降本增效。
參考文獻
[1]許威,閆曈,許鵬,梁振杰.特種機器人行業的新銳——四足仿生機器人[J].機器人產業,2021(04):50-57.
[2]高子航.基于5G通信的四足機器人控制系統設計[J].電子技術,2021,50(05):140-141.
關鍵詞:計算機立體視覺;雙目立體成像;視差
中圖分類號:TP37文獻標識碼:A文章編號:1009-3044(2011)12-2929-03
Binocular Stereo Imaging Based on the Computer Disparity Mapping for Stereoscopic 3D
YANG Fu-bao
(Hefei University of Technology, Hefei 230009, China)
Abstract: Binocular stereo imaging which based on the computer disparity mapping forstereoscopic 3D, deals with many challenging problems in computer vision,pattern recognition and computer graphics. The main problems are that the stereo visions are not vivid and natural enough, people don't have a thorough knowledge of the functions of their eyes and the binocular stereo visions and there are still some problems to solve in the getting of stereo images. This article proposes a new method to create stereo images based on a certain 3D model that already been built, introduces a method to creat binocular stereo visions by cameras, studys several important factors that affect stereo effects ,including the relationship between the targetcamera and the 3D models, cam wide and the control of the position of the screen, etc. These studys are based on the deep study of the binocular stereo vision of computer disparity mapping for stereoscopic 3D and provide theory and technical support for the application of binocular stereo imaging in visual stereo displays.
Key words: computer stereo vision; binocular stereo imaging; parallax
隨著《阿凡達》的熱映,立體3D現在已經成為大眾消費的一個主流產品。電影院線越來越多的電影都加入到3D立體的行列,電視頻道也開始嘗試推出三維廣播節目,越來越多的公司開始提供3DTV和藍光3D的播放設備。盡管這些技術的進步在不斷的進步,但是在立體內容的實際生產中,如何讓觀眾在一個自然、舒適的環境中觀看立體視頻仍然是一個很大的挑戰。
最根本的問題在于,在人類復雜的視覺感知和顯示設備限制的相互作用。因此,視覺內容必須適應特定應用的特殊性場景。對于立體3D視頻領域,在計算機圖形學對此內容重定向或映射的問題進行了廣泛的研究。雖然今天的3D顯示技術可以重構雙目立體視覺,但是受深度信息的影響,不能在一個平面上真實地再現圖像的深度。當屏幕上顯示一個遙遠的對象時,這種沖突會造成嚴重后果,強烈的負視差可能會導致不舒服的觀看的經驗,可以引起暫時性復視,無法融合立體圖像。
1 國內外3D視頻產業發展現狀
1.1 國外3D產業現狀
隨著《阿凡達》的大熱,消費者對3D的狂熱在國際上掀起一輪3D熱潮。美國、日本、歐洲紛紛加大3D產業的投入力度,加緊研發3D立體視頻產品,并積極參與相關國際3D標準的制定。一些國家已經開播3D頻道。英國天空電視臺正式啟播SKY3D電視頻道和美國ESPN 3D頻道直播南非世界杯足球賽之后,日本天空完美衛星通信公司聯手索尼公司將在其衛星高清電視中推出一個專門的世界杯3D頻道,為日本電視家庭提供南非世界杯足球賽3DTV直播。
美國作為全球3D產業的領跑者對于3D產業自然不遺余力,但之前的重點一直集中在3D動畫上。而與之前不同的是,此次的3D熱潮,帶動起從內容商到傳輸商到設備商這一整條產業鏈的熱情。
1.2 國內3D產業現狀
與國外的3D產業發展相比,我國的3D產業起步相對較晚,3D內容不多,在技術方案及產業鏈方面還不成熟,但是目前國內的3D產業也已步人快速成長期。在索尼、松下等國外企業紛紛推出相關產品的同時,國內各家電企業相繼推出了3D立體現實產品,并已上市銷售。
國內相關企業和科研院所在3D內容制作、3D編解碼技術、3D傳輸與存儲、3D顯示終端等方面已經擁有一定產業基礎。很多高校都已開展3D立體顯示方面的研究。據了解,在我國進行3D技術研究和產品研發的企業也越來越多。
2 雙目立體成像研究
在現實生活中,人們通過眼睛觀察的周圍環境之所以是立體的,是因為人的兩只眼睛所處的空間位置不同,可以從兩個不同的視角同時獲得兩幅不同的場景圖像,如圖1所示,左眼僅能夠看到AB面,右眼僅看到AC面,經人腦判斷后就能感知到完整的物體ABC的形狀和距離。人的大腦對這兩幅圖像進行處理后,根據兩幅圖像的差異判斷出物體與雙眼的距離等空間信息,形成一幅立體的畫面就呈現在腦海中。
理論和實驗表明,兩個目標攝像機與三維模型的位置關系、兩個目標攝像機之間的距離、會聚角變化值等,是影響立體效果的重要因素,下面就定性地討論這些因素。
IBM認為,在下一個計算時代,硬件和軟件將獲得人腦所具備的、令人震驚的新能力,即學習、適應和感知的能力。這將從根本上改善人們生活、工作和人際交往的方式。IBM將這樣一個時代稱為認知系統時代。
2013年,IBM的5 in 5技術預測正是討論了關于計算機模仿人類的看、聽、觸、味、嗅等五感,在大數據感知環境下,如何幫助人類更好地進行認知的話題。盡管這樣的預測聽起來令人難以置信,但想想在10年前尚未出現而如今已成為人們必備品的東西(比如智能手機、平板電腦),我們有理由相信這個預測成為現實,具有助力條件。
計算機具備人類五感
——深遠影響人類生活和行業發展
很快,計算機將能夠“看到”。目前,我們使用Watson等系統的深入分析能力應對人類語言的復雜性,并極為高效地分析海量非結構化數據。但是,這些數據局限于文本和數字形式的信息。科學家們相信,在未來5年內,系統不僅能夠看到和識別可視數據的內容,而且將把像素轉化為含義,開始像人類觀看和解析圖片那樣從中理解其意義。 在計算機視覺提升方面,未來,“類似人腦”的能力將使計算機能夠分析顏色、紋理、材質或邊緣信息,并能通過解析圖像得出圖片的意義。這將對醫療、零售、農業等行業產生深遠影響。
在醫療領域,解析MRI、CT掃描結果時,圖像中至關重要的內容可能極為細微,難以被人眼觀察到,能“看”的計算機將從MRI、CT和X光圖像中提取細微數據,甚至評估皮膚上斑點的圖像。其提供的評估、分析和建議將是醫生及時開處方并進行高效治療的有力工具之一。所以,能夠“看到”內容的計算機系統將幫助醫生更快、更準確地探測醫療問題。還曾有報告預測,全球醫療診斷影像市場預計到2016年增至266億美元,該數字也從某中程度上預示著相關產業的規模前景。
公用事業可以利用這項技術更好地管理電網,并且在發生自然災害的情況下,分析從無人駕駛的飛行器上安裝的攝像頭獲得的大量視頻,以評估受災最嚴重的地區,并且為確定優先救災順序而提供建議。
計算機將能夠“聽到”。比如它們能探測到可能有死亡征兆的樹木的活動,提示相關人員在樹木倒掉之前修剪或者砍伐這些樹木,從而保護人們的安全與財產。再比如它們能探測到火災中風向的改變,幫助消防人員確定后續行動,從而控制火災。
此外,計算機還將能聽到并理解對我們至關重要的聲音。例如,IBM與醫療專家和學術機構合作收集數據,將嬰兒聲音與身體內部狀況和行為關聯起來,并且開發了先進的翻譯系統,將來會在嬰兒和幼兒身上使用。這種工具將識別并理解嬰兒的咿呀學語,并根據學到的聲音含義而讓我們知道他們真正想表達什么,這樣我們就可以區分嬰兒的饑餓、過熱、疲勞還是難受。
計算機將擁有觸覺。從本質上來講,觸覺是一種物理體驗。但是,借助紅外線和觸覺反饋技術,人們已經開始在游戲行業中模擬觸覺。通過振動形式重新創造一種觸感,并且用在移動設備和游戲機上,玩家能夠在賽車游戲中獲得駕駛感受。同樣,一旦計算機擁有觸覺,在線購物時,商家將使用觸覺技術讓客戶在購買之前“觸摸”商品。購物者通過在有衣物圖像的屏幕上滑動手指,系統就可以模擬出衣物的紋理,使客戶即可感受到衣物的質地。將來,如果您希望在線購買一件毛衣,您就可以撫摸手機屏幕表面,感受其紋理、織物結構、重量、織法,并且感受穿在身上的樣子。 味覺和嗅覺通常是聯系在一起的,尤其是對于食物。未來,計算機的定制食物配對能力將使我們感到震驚,因為這種能力將最大程度改善我們喜愛的風味和質地。計算機甚至還能夠提供最佳配對建議,最大程度降低我們的饑餓感,并優化可用食物的營養價值。
擁有強大嗅覺功能的計算機也可以讓人們感覺更安全,例如計算機可以探測到全球主要城市的空氣污染等級。此外,計算機也可以安放在藝術館中,嗅出人的鼻子無法感覺到但有可能破壞重要藝術品的氣體。在未來5年內,計算機或手機中嵌入的微型傳感器將“嗅出”您是否患感冒或其他疾病。通過分析呼吸中的氣味、生物標記或者數千個分子,醫生能夠通過偵測哪些氣味正常以及哪些不正常而診斷和監控疾病的發作,例如肝病和腎病、哮喘、糖尿病和癲癇。
認知系統時代下的認知型計算機
——可歸納、演繹,并理解人類體驗
認知系統時代下的計算機將具備一套更加智能的系統,該系統一直處于不斷學習和提高的狀態。但要開始學習,首先要擁有“感知”能力。因此,模仿人類感知是認知型計算系統的要素之一,它使得計算機可以以自己的方式擁有觸覺、視覺、聽覺、味覺和嗅覺功能。這些計算機將幫助人類在環境、經濟、社會和天氣等相關事件中進行決策。
在認知系統時代,擁有人類五感的計算機將不再局限于演繹推理,或者從更普遍的數據中得出結論,而是模擬人類使用基于特定的、有情景的歸納推理能力,同時也具備學習的能力。我們將從那些能夠理解人類的體驗,并且采取措施的計算機中獲益,從而改善我們的生活、工作和娛樂方式。
當然,科學家們并不期望計算機完全替代人的功能。IBM認為,認知型計算機的真正成功,并不在于它替代人腦的功能,而在于它提供的創新能夠為人們帶來更好的生活質量,而且為我們應對最嚴峻的挑戰提供關鍵的信息,使我們能夠提出創新的解決之道。認知型計算機的誕生,即是為了令人類和計算機在認知系統時代強強聯合,完成更優秀的工作。
IBM曾多次成功預測未來科技成果
IBM每年都會對未來5年的科技做若干預測,并且絕大多數都已經成功實現,預測的準確性較高。比如2006年,IBM預測3-D互聯網將會出現。
2007年,IBM預測人們的駕駛方式將與之前的截然不同。語音啟動系統和車尾備用攝像頭等司機輔助技術已不再是豪華車的專利。
關鍵詞: 體育賽事圖表設計 信息可視化 形象化呈現 動態展示
當下,科技正以前所未有的速度迅猛發展,信息、知識充溢于社會,生活節奏越來越快,我們已進入“讀圖時代”。數據可視化已發展成為研究教學與發展的熱門領域,是結合了科學與信息形象化的綜合領域。對信息進行更為有效的梳理和表達成為當今社會信息傳達的一個迫切需要,也成為今天的信息課題。在這種背景下,圖表設計在視覺傳達設計中扮演了越來越重要的角色,它是在社會信息大量沖擊下產生的視覺傳達的新形式,無論是在自然科學、社會科學領域,還是在傳播、商業領域,圖表都發揮著重要的作用。圖表設計也以更加新鮮、活潑的形式出現在人們的視野中,并日漸成為一種流行的信息表達方式。
體育賽事圖表設計是體育運動會形象開發的重要組成部分,是為了實施各種管理、配合生產經營的需要而進行的,其功能超越了一般語言文字,尤其是在信息化社會迅速發展的今天,圖表這種準確、形象、快捷的傳達方式已經顯示出它獨特的優勢。它清晰地表現運動會各個比賽項目的內容、特點,不僅具有很強的功能性,而且是傳達體育運動會舉辦理念、國家文化和綜合國力的主要載體。可視化理論的介入,為實現體育賽事圖表設計的價值提供新的路線圖,通過圖示、表格表示某種抽象的信息,塑造出簡潔、直觀、形象、有趣、易于理解的視覺方式,讓受眾快速地獲取真實而豐富的信息,以滿足需求,優化信息的傳遞。
一、信息可視化
信息可視化(Information Visualization)是一個跨學科領域,是計算機圖形學應用領域的一個重要成果,是指運用計算機圖形學和圖像處理技術,將信息轉換為圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術。它通過形象化的手段傳達知識、信息,充分利用人們對可視模式快速識別的自然能力,將人腦與計算機這兩個最強大的信息處理系統聯系在一起,通過平面設計與信息設計的相互融合闡釋概念、功能,使受眾快速地感知、識別,并提供一種歸納整合信息的方法,兼具藝術性與實用性,旨在研究大規模非數值型信息資源的視覺呈現,如軟件系統之中眾多的文件或者一行行的程序代碼,以及利用圖形圖像方面的技術與方法,幫助人們理解和分析數據。與科學可視化相比,信息可視化側重于抽象數據集,如非結構化文本或者高維空間當中的點。
可視化提供了一種新的信息展示方法,豐富了科學發現的過程,開闊了視野。它涉及計算機圖形學、圖像處理、計算機輔助設計、計算機視覺及人機交互技術等多個領域。信息可視化技術不僅在醫藥學、生物學、工業、農業、軍事等領域被廣泛應用,近年來還進入金融、通信領域。信息設計的過程是將信息轉化為“形”,即將信息可視化。當下,信息可視化備受關注。Otto.Neurath提出:記住簡明的圖形要比忘記精確煩瑣的數字好得多。國際地圖學會(ICA)于1995年成立了一個可視化委員會(Comm ission on V isualization),開始了一個名為“Carto 2 Project”的研究項目,其目的是探索計算機圖形學的技術與方法如何更有效地應用在地圖學與空間數據分析方面,促進科學計算可視化與地圖可視化的連接與交流。
我國古代的制圖思想大部分是對空間的歸納,西晉地圖學家裴秀總結了6條原則,分別是分率、準望、道里、高下、方邪、迂直,稱之為“制圖六體”,都是關于面積比例、起伏高低和相對距離的總結。有時間線索的圖表很少,即使有,時間表現也不明顯,自然缺乏相應的論述。即使是手藝流程圖,也是按照閱讀順序布置關鍵的操作動作,“圖”的意義遠超過“表”。古人早就有對時間的表現,沙漏、日晷、鐘表等都是將抽象的時間形象化的過程,沙漏是通過容量的變化來顯示的,日晷、鐘表則利用了角度的變化。圖表對時間的表現則略有不同,它不需要及時記錄時間的動態,其目的是將有長度、有密度的時間在有限的二維空間中展現出來。在時間軸上還要有條件、事件或是數據的表現,它往往是串起整個圖表的視覺線索,是圖表中的結構性要素,非常關鍵。
二、信息的形象化呈現
形象化表達是一種直觀的表現形式,是一種開門見山的手法,它借助生動的圖形、圖像直接表達信息,使人一目了然,并給受眾一種真實的感受。這不僅可以增強文本信息的可讀性,而且可以超越語言文字壁壘,實現更深刻意義和更廣范圍的信息交流。在形象化表達作品中,人們對所表達的內容更容易理解和接受。所選取的視覺形象應具有一定的代表性和可視性。一般認為,形象化表達多選取具有代表性的具象圖形,將抽象的文本信息引人入勝地呈現出來,給受眾以直觀的現實感,使文本信息的含義更明確,使視覺傳達更快捷。形象化表達由于將文本信息通過形象化的表達方式呈現給受眾,能選用恰當的表達方式有效地表達文本信息。所以要十分注意畫面上圖表的視覺設計,應著力突出信息的內容展示,運用圖形、色彩和背景進行烘托,使抽象的信息置身于一個具有感染力的空間,這樣才能增強圖表的視覺感染力。
體育賽事圖表設計的重要特征是直觀、形象,運用形象化表達方式可以通過簡明直觀、形象生動、概括性強的圖形,把各種信息展示給受眾。在體育賽事圖表設計時,要善于在襯托、對比和夸張等多種表現形式上尋求變化,標新立異,創造出獨特的視覺效果。以2010年南非世界杯賽程圖表為例,該信息圖表生動展現了2010年南非世界杯的比賽時間、分組、流程等信息。整個表格是一個圓形的構圖,圖形中間醒目地呈現出一個形象的圓形“足球”,圓形足球明確了圖表的表達內容,同時,圓形的使用也具有很深刻的含義。圓在圖表設計中一般以直接圓、間接圓、復合圓等幾類形式出現,具有信息的高承載性、視覺認知的直觀性和良好的信息連續流等優勢。整個圖表設計成多個可視化同心圓,采用可視化的同心圓一般不會有過多冗余的復述,信息面也較為適中,因此大部分閱讀者不會對此類的圖表有過大的解讀壓力。在圖表設計中還使用了不同的色彩層級強化信息,將參賽的國家隊等分為A、B、C、D、E、F、G、H八個區顯示不同的賽區,線條粗細的層次用鮮艷的色彩傳達,易讀性很好。圖表中間是用鮮艷的粗彩條穿插在相鄰的兩個區域,用這種方式表明相鄰兩個區之間的賽事。由此可見,這個圖表設計對于信息處理來說確實具有很強的探索性,并充分考慮了信息傳遞的效能,通過視覺元素組構的秩序化、簡約化,使造型語言具有鮮明的指向性;通過圖示所具有的直觀性、形象性和易讀性,消除文字符號中晦解和枯燥的成分,強化圖表信息的認讀優勢,以便將清晰的思想可視化。
三、信息的動態展示
圖表是通過視覺的傳遞完成信息的傳遞,圖表按其呈現形態分為靜態圖表和動態圖表兩大類,一般認為,靜態的圖表不及動態的圖表容易引起受眾的注意,好的動態圖表能像動態畫面一樣吸引觀眾注意,它可為指定的報告提供針對所有指標的多維度分析。因此,為了更加有效地傳遞信息,必須考慮到受眾的欣賞和審美情趣,提高信息傳達的感染力、豐富性及交流的效率。
動態圖表是圖表分析的較高級形式,一旦從靜態圖表跨入動態圖表,則分析的效率和效果都會進入另一個境界,可以讓用戶進行交互式的比較分析。比如2009年歐洲杯信息結構設計得非常有特點,圖表設計以表盤為基本形態,圖表中間背景為世界地圖,整個圖表設計成動態賽程圖表信息結構,在圖表中整合了多個維度的信息。12點方向是比賽的具體時間,在特定日期舉辦的比賽,對應的其他3個方向的列表中的焦點都會發生相應的變化。3點方向是比賽的球場,按球場查看特定球場舉辦的比賽,對應的其他3個方向的列表中的焦點都會發生相應的變化。6點方向是比賽的階段,分為小組賽、半決賽、決賽等,對應的其他3個方向的列表中的焦點都會發生相應的變化。9點方向是參加比賽的隊伍,在任何一個坐標上做出選擇,對應的其他3個方向的列表中的焦點都會發生相應的變化。觀眾可以隨意地按隊伍、場地、時間、賽事階段查知所要的信息。這樣的圖表營造了動態的可視化感官體驗,幫助受眾快速瀏覽,數倍地提高信息的使用效率。這樣的圖表很適于表現體育賽事的賽程,充分體現了信息圖表設計的可視化的表達。
由此可見,這份圖表充分發揮了圖表動態表現的優點,讓數字和圖像交織在一起。搭建邏輯結構需要對信息層次進行劃分,并營造一種動態的可視化感官體驗。這種可視化以圖形形式記憶復雜計算的結果,幫助受眾快速瀏覽并達到目的,數倍提高信息的使用效率,使這個可視化作品達到一定高度。
四、結語
信息圖表的可視化是當前一直在討論的問題,但可視化并不意味著信息的裝飾,過多地強調圖形的趣味性,不尊重信息自身的邏輯和講述的邏輯,圖表的作用也就喪失了。張衡的“心之謀,書之謀”對當前的圖表設計來說是很有意義的總結。信息圖表是人們應對信息社會的一種手段,可以讓世界秩序化、條理化、可視化。圖表成為體育賽事傳播信息不可或缺的方式,它在體育賽事的各類圖形、文字及其數據結構中尋求突破點,把人們熟知又多見的種種視覺元素進行重新組合,取得形象化、個性化、趣味性強的可視化的視覺效果。它在高效、快速傳播信息的同時還能給受眾帶來視覺和心理上的愉悅,清晰的圖表設計強化了受眾的感知,滿足了受眾的閱讀需求。21世紀是信息的時代,信息可視化為信息時代的人們開辟了廣闊的道路,在人們直接、快速、高效地獲取信息的同時也為人類走向非物質社會奠定了堅實的基礎。信息可視化的目標是幫助人們增強認知能力,這也是信息可視化的意義所在。
參考文獻:
[1]席濤.信息視覺設計[M].上海交通大學出版社,2011.5.
[2][英]卡羅琳·奈特,杰西卡·格拉澤.新圖表設計[M].上海人民美術出版社,2011.1.
[3]肖勇,張尤亮,圖雅.信息設計[M].湖北出版集團、湖北美術出版社,2010.3.
[4][美]尤尼·利普頓.信息設計實用指南[M].上海人民美術出版社,2008.1.
[5]趙燕偉.機械產品可拓概念設計研究[J].中國工程科學,2001,VOL3,(5):67-71.
[6]葉蘋,段佳.圖表設計[M].江西美術出版社,2006.6.
[7]覃京燕,朱向未,李丹碧林.信息可視化中交互設計方法探議[J].裝飾,2007,(3).
目前,全球正在興起新一輪數字化、智能化制造浪潮,“3D打印”作為其中的一個標志性概念,在最近幾年正獲得越來越廣泛的關注。作為快速成形技術的一種,3D打印以經過智能化處理后的3D數字模型文件為基礎,運用粉末狀金屬或塑料等可粘合材料,通過逐層打印、迭加成形的方式來增量構造物體。3D智能數字化與3D打印就像一對孿生兄弟,相輔相成、密不可分。
3D智能數字化軟件是3D打印的核心,其利用計算機來生成數字化的3D圖紙模型。正所謂“巧婦難為無米之炊”,缺少數字化文件支持的3D打印機將會變得毫無用處。3D數字化目前有兩大類的方法。第一大類是使用3D設計軟件,由設計師從無到有地設計數字化產品。當然,并非人人都有能力自己設計3D形狀,因此第二大類的3D數字化就是3D掃描(俗稱3D照相),基于計算機視覺、計算機圖形學、模式識別與智能系統、光機電一體化控制等技術對現實存在的3D物體進行掃描采集,以獲得逼真的數字化重建。
在獲得初步的數字化模型之后,往往還需要進行個性化編輯定制,才會最終輸出到3D打印機。這種追求高附加值的個性化定制,之前都是以較大的手工工作量為代價的,尤其是當需要“大批量定制”時。因此,為提高效率,3D智能數字化技術將發揮關鍵的作用。比如,需要為一萬名用戶定制個性化的眼鏡、服裝、帽子、鞋子,如果使用人工逐一為每位用戶進行手工測量和手工設計,工作量和成本都將變得不可接受。而應用智能數字化技術,如采用視覺計算方法,利用攝像頭自動采集、分析提取每位用戶的體貌個性特征,并自動根據視覺美感進行形狀設計、顏色膚色搭配等,可極大地縮減定制周期。
之后的一切都交給3D打印機,其無需機械加工或任何模具,就可加工任意復雜的中空形狀,解決了許多過去難以制造的復雜結構的成形問題。目前,3D打印機已經能夠使用各式各樣的新材料(如液體、粉末、塑料絲、金屬、沙子、紙張、甚至巧克力、人體干細胞等),通過噴墨沉積、熔融沉積成形、激光燒結、立體光刻等工藝將三維數字模型變成實物,從玩具、工具,到廚房用品、建筑、時尚衣服應有盡有,甚至還可直接打印具備觸感的人造耳朵、人體骨骼、人造假牙、鮮肉,以及槍支、跑車、無人飛機等。以通過“智能云網”模式定制一雙鞋子為例,普通用戶只需在手機上下載一個App應用,給自己的雙腳拍幾張照片,并指定喜歡的款式和顏色。然后,位于云端的智能計算服務將根據重建出的3D腳形把鞋子設計出來,并在云制造集群中搜索到鄰近的打印地點,以便快速送貨上門。
目前的3D 打印技術,在很多基礎研究領域已取得了突破,如對金屬熔敷成形技術的研究,解決了鈦合金、超高強度鋼等難加工大型復雜整體關鍵構件激光成形工藝問題。但仍有不少復雜工藝問題需要解決,如多種材料的混合制造問題。只有實現了混合材料打印,多元結構的部件才能一次制造出來,以避免傳統的首先制造單個(不同材料)零件再組裝在一起的弊端。當前,3D 打印技術的攻關難點主要集中在設備和功能材料的制備、智能控制問題的解決、激光器/噴嘴等核心元部件的研制等方面。
通過智能感知設備,3D打印機還可控制制造的行為,對打印的過程進行實時監控,如監測產品的質量和強度,然后根據反饋信息隨時做出調整,以實現閉環控制。也就是說,這臺3D打印機具有學習和控制的能力。可以想象的是,會有專為糖尿病患者推出的食品打印機,通過微型皮膚植入物監測病人的血糖,依據每日不同的身體狀況為其量身打印食物。在將來,通過把人工智能從計算機拓展到現實世界,還可打印具備感知和學習能力的智能物品,達到“機器制造機器”的新境界。