時(shí)間:2022-02-07 10:26:01
開篇:寫作不僅是一種記錄,更是一種創(chuàng)造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇匹配算法論文,希望這些內(nèi)容能成為您創(chuàng)作過程中的良師益友,陪伴您不斷探索和進(jìn)步。
關(guān)鍵詞:Rete算法,智能防火墻,規(guī)則,快速,匹配
Rete算法是一個(gè)快速的模式匹配算法,它通過形成一個(gè)Rete網(wǎng)絡(luò)進(jìn)行模式匹配,利用基于規(guī)則的系統(tǒng)的兩個(gè)特征,即時(shí)間冗余性(Temporalredundancy)和結(jié)構(gòu)相似性(structural similarity),提高系統(tǒng)模式匹配效率。
一、模式匹配的基本概念
1、可滿足規(guī)則:一個(gè)規(guī)則稱為可滿足的,若規(guī)則的每一模式均能在當(dāng)前工作存儲(chǔ)器中找到可匹配的事實(shí),且模式之間的同一變量能取得統(tǒng)一的約束值。形式化地說,規(guī)則
if P1,P2,…Pmthen A1,A2,…An
稱為可滿足的,若存在一個(gè)通代σ,使得對(duì)每一個(gè)模式Pi,在工作存儲(chǔ)器中有一個(gè)元素Wi滿足
Piσ=Wii=1,2,3 …m
這里,σ作用在某個(gè)模式的結(jié)果稱為模式實(shí)例,σ作用在整個(gè)規(guī)則的結(jié)果稱為規(guī)則實(shí)例。在專家系統(tǒng)中,可滿足的規(guī)則稱為標(biāo)志規(guī)則。
2、沖突集:由全體規(guī)則實(shí)例構(gòu)成的集合稱為沖突集,也稱上程表。免費(fèi)論文參考網(wǎng)。
3、模式匹配算法的任務(wù)是:給定規(guī)則庫,根據(jù)工作存儲(chǔ)器的當(dāng)前狀態(tài),通過與規(guī)則模式的匹配,把可滿足規(guī)則送入沖突集,把不可滿足的規(guī)則從沖突集中刪去。
二、Rete算法的依據(jù)和基本思想
Rete算法快速匹配的重要依據(jù)是:
1、時(shí)間冗余性。免費(fèi)論文參考網(wǎng)。工作存儲(chǔ)器中的內(nèi)容在推理過程中的變化是緩慢的,即在每個(gè)執(zhí)行周期中,增刪的事實(shí)只占很小的比例,因此,受工作存儲(chǔ)器變化而影響的規(guī)則也只占很小的比例。由產(chǎn)生式系統(tǒng)的折射性,只要在每個(gè)執(zhí)行周期中記住哪些事實(shí)是已經(jīng)匹配的,需要考慮的就僅僅是修改的事實(shí)對(duì)匹配過程的影響。
2、結(jié)構(gòu)相似性。許多規(guī)則常常包含類似的模式和模式組。
Rete算法的基本思想是:保存過去匹配過程中留下的全部信息,以空間代價(jià)來換取產(chǎn)生式系統(tǒng)的執(zhí)行效率。
三、Rete匹配網(wǎng)絡(luò)結(jié)構(gòu)與過程
Rete算法的核心是建立Rete匹配網(wǎng)絡(luò)結(jié)構(gòu),其由模式網(wǎng)絡(luò)和連接網(wǎng)絡(luò)兩部分構(gòu)成。其中,模式網(wǎng)絡(luò)記錄每一模式各域的測試條件,每一測試條件對(duì)應(yīng)于網(wǎng)絡(luò)的一個(gè)域結(jié)點(diǎn),每一模式的所有域結(jié)點(diǎn)依次連起來,構(gòu)成模式網(wǎng)絡(luò)的一條匹配鏈。
Rete網(wǎng)絡(luò)匹配過程由模式網(wǎng)絡(luò)上的模式匹配和連接網(wǎng)絡(luò)上的部分匹配構(gòu)成。在模式網(wǎng)絡(luò)的機(jī)器內(nèi)部表示中,我們把共享一個(gè)父結(jié)點(diǎn)的所有結(jié)點(diǎn)表示成一條共享鏈。同時(shí),把每一模式匹配鏈中的結(jié)點(diǎn)表示成一條下拉鏈,于是,每一結(jié)點(diǎn)由共享鏈和下拉鏈指向其后繼結(jié)點(diǎn),模式網(wǎng)絡(luò)就是一棵可以使用典型遍歷算法進(jìn)行測試的二叉樹。
四、智能防火墻Rete算法設(shè)計(jì)
Rete快速匹配算法,函數(shù)Rete設(shè)計(jì)為:取IP地址、端口號(hào)各部分折疊、異或運(yùn)算后,以Rete長度取模。免費(fèi)論文參考網(wǎng)。算法如下(無關(guān)或部分無關(guān)稱為集合A,相關(guān)、包含相等和相等的稱為集合B):
1、Addr=sa+da sa:源地址 da:目的地址
2、Port=sp+dp sp:源端口號(hào) dp:目的端口號(hào)
int Rete(long addr, int port)
{int addrxor,key;\地址折疊異或
addrxor=(addr&~(~0﹤﹤16))∧((addr﹥﹥16)&~(~0﹤﹤16));
key=addrxor∧port; \與端口異或
return(key % max); }\max為Rete表長度
防火墻初始化時(shí),首先從規(guī)則集A用該散列函數(shù)構(gòu)造Rete表R為
Void Initialization(RULE-SET A){
FOR(r∈A)DO{ \r為每條規(guī)則
idx=Rete(r.addr,r.port);
R[idx]=&r; \R代表規(guī)則集合A
}}
因?yàn)镽ete表的長度有限,但是如果設(shè)計(jì)太大會(huì)浪費(fèi)存儲(chǔ)空間,也降低了查找速度,所以免不了會(huì)出現(xiàn)沖突。解決沖突的方法是:如果兩條規(guī)則經(jīng)過散列后落到同一位置,則把這兩條規(guī)則按照插入順序組成一個(gè)鏈表結(jié)構(gòu)。主要算法如下:
if(R[Rete(r.addr,r.port)]=NULL)\R為Rete表,r為規(guī)則
R[Rete(r.addr,r.port)]=&r;\沒有沖突,則插入Rete表
Else{J=R[Rete(r.addr,r.port)];\沖突解決方法
while (j->next!=NULL) {j=j->next;} \插入鏈表末尾
j->next=&r;}
數(shù)據(jù)包匹配流程:當(dāng)防火墻收到一個(gè)數(shù)據(jù)包以后,用算法Match查找規(guī)則集(A和B)。
Match(IP-Packet p) { \p為數(shù)據(jù)包
Int idx=Rete(p.addr,p.port) ; \首先用Rete算法查找A類規(guī)則
IF (R[idx].addr≧p.addr&& R[idx].port=p.port) \找到匹配規(guī)則
return R[idx] ;
Else {int idex I =halfquery(p.addr) ; \利用折半查找索引表
J=L[indexl] ; \L代表規(guī)則集合B
While(j!=NULL){\順序匹配找到的規(guī)則鏈
IF (Matchrule(p)) return j; \ Matchrule為規(guī)則匹配函數(shù)
Else j=j->next;
}}
Return(Norulematch);
}
參考文獻(xiàn):
[1] 閆麗萍,潘正運(yùn). RETE算法的改進(jìn)與實(shí)現(xiàn).微計(jì)算機(jī)信息,2006 (36)
[2] 龐偉正,金瑞琪,王成武. 一種規(guī)則引擎的實(shí)現(xiàn)方法.哈爾濱工程大學(xué)學(xué)報(bào),2005(03)
[3] 江建國,張景中. 基于Rete算法的幾何自動(dòng)推理系統(tǒng). 四川大學(xué)學(xué)報(bào)(工程科學(xué)版), 2006(03)
關(guān)鍵詞:KMP;改進(jìn);模式匹配算法;字符;分析;算法
中圖分類號(hào):TP309
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,需要處理的數(shù)據(jù)內(nèi)容不斷呈現(xiàn)出大量化的特點(diǎn)。近年來,在計(jì)算機(jī)研究領(lǐng)域內(nèi)模式匹配問題受到了極大的關(guān)注。在串處理系統(tǒng)中,子串在主串中的定位操作是一種重要的過程中,稱之為串的模式匹配。隨著計(jì)算機(jī)網(wǎng)絡(luò)搜索引擎技術(shù)的發(fā)展、病毒技術(shù)的進(jìn)步以及數(shù)據(jù)壓縮方面的不斷發(fā)展,模式匹配算法在計(jì)算機(jī)應(yīng)用系統(tǒng)中得到了廣泛的應(yīng)用。目前主要的匹配算法有BF算法、KMP算法與一些改進(jìn)的算法,從方式上,可以分為精確匹配、模糊匹配、并行匹配等。本文重點(diǎn)對(duì)KMP算法進(jìn)行分析,另外對(duì)于改進(jìn)的KMP算法進(jìn)行研究與展望。
1 簡單的模式匹配算法
現(xiàn)代計(jì)算機(jī)技術(shù)不斷發(fā)展,人們的工作、生活與互聯(lián)網(wǎng)有著密切的聯(lián)系,同時(shí)網(wǎng)絡(luò)內(nèi)容也不斷豐富,每一個(gè)終端幾乎都有可能會(huì)上傳與下載數(shù)據(jù),造成網(wǎng)絡(luò)上的類似相信也非常多,如何能夠從大量的信息中進(jìn)行查找同樣的信息,則需要經(jīng)過一定的算法。[1]這種典型的應(yīng)用系統(tǒng)將會(huì)使用到匹配算法。簡單的模式匹配算法主要是一種查找過程,給出一個(gè)特定的字符串P,在一大型的文本中進(jìn)行查找,從而確定出P是否在大型文本中出現(xiàn)過,如果存在,同時(shí)給出相應(yīng)的出現(xiàn)位置。在以上的算法定義中,為了對(duì)數(shù)學(xué)模式進(jìn)行簡單描述,進(jìn)行以下符號(hào)定義。模式串為P,需要匹配的大型文本主串為T,模式串的長度為m,需要匹配的大型文本主串長度為n,在模式串中首字符與末字符分別為P1與Pm,而需要匹配的主串文本首字符與末字符分別為T1與Tn。文本字符串T與模式字符串P分別是由字符組成的一種集合,強(qiáng)行搜索模式實(shí)質(zhì)上就是把模式P與文本T進(jìn)行自左向右的挨個(gè)搜索,如果模式字符串P在某一點(diǎn)的匹配失敗,則立即將T向右移動(dòng)一個(gè)字符的位置,繼續(xù)從模式字符串P的第一位向右來搜索。[2]這種算法基本上是最符合原理的,但同時(shí)它的工作量十分巨大,體現(xiàn)出的效率并不高,需要進(jìn)行m(n-m+1)次的字母匹配運(yùn)算,往往給過程浪費(fèi)大量的時(shí)間。現(xiàn)代社會(huì)是高效社會(huì),一旦在網(wǎng)絡(luò)搜索中速度過慢,用戶將會(huì)失去耐心。目前更多的手持設(shè)備在應(yīng)用搜索時(shí)一般是即時(shí)搜索,對(duì)時(shí)間的要求較高,運(yùn)算量太大的低效搜索模式已經(jīng)不再滿足現(xiàn)代需求。每個(gè)網(wǎng)站的用戶數(shù)量都在不斷增大,形成的用戶名與密碼都需要進(jìn)行數(shù)據(jù)儲(chǔ)存,利用模式匹配法可以對(duì)賬戶與密碼進(jìn)行匹配,從而判斷是否可以登入,否則就進(jìn)行拒絕,有效提高時(shí)間,保護(hù)網(wǎng)站利用與用戶隱私。這是模式算法的典型應(yīng)用,隨著算法的不斷進(jìn)步,將會(huì)在多個(gè)網(wǎng)絡(luò)領(lǐng)域內(nèi)得以廣泛應(yīng)用。[3]
2 KMP算法
KMP算法目前已經(jīng)經(jīng)過了多年的發(fā)展,最早是由克努特、莫里斯與普照拉特同時(shí)發(fā)現(xiàn),是一種改進(jìn)的字符串匹配算法,在這種算法中,對(duì)主串指針回溯進(jìn)行了消除,利用已經(jīng)得到的部分匹配結(jié)果把模式串右行一段較遠(yuǎn)的距離,再次進(jìn)行比較與匹配,從而使算法的效率得到大幅地提升。這主要是因?yàn)樵谇捌诘钠ヅ溥^程經(jīng)驗(yàn)總結(jié)中,一旦某字符不符合模式串的匹配要求,在附近的一段文本中也將不會(huì)出現(xiàn)匹配的對(duì)象。[4]
KMP的算法思想是當(dāng)Ti與Pj匹配完成時(shí),主串的指針i與模式的串指針j將會(huì)分別加1,不斷向后面進(jìn)行再次匹配,如果Ti與Pj匹配不成功時(shí),主串的指針i保持不動(dòng),模式的串指針j將不會(huì)回到第一個(gè)位置,而是回到一個(gè)合適的位置,一旦j回到了第一個(gè)位置,將有可能會(huì)對(duì)需要匹配的文本字符進(jìn)行錯(cuò)過。主串的指針i保持不動(dòng)時(shí),算法的關(guān)鍵就在于模式的串指針j指回到了哪一個(gè)位置。模式的串指針j不可右移太大的距離,避免錯(cuò)過有效匹配,同時(shí)也要右移盡可能地大,以提高匹配效率。在某次字符匹配時(shí),一旦不匹配,模式的前j-1個(gè)字符能夠匹配,則在下一次匹配時(shí),可以把模式串向右移動(dòng)j-s-1個(gè)字符位置,從而使P1與Tj-s對(duì)齊,需要從P3+1開始進(jìn)行匹配情況檢查。為了避免遺漏問題,在以上的首字串必須是最長的,自匹配的部分字串是唯一的,與模式自身結(jié)構(gòu)有關(guān)。當(dāng)模式的第j個(gè)字條與主串里的該字符進(jìn)行比較位置時(shí),它的值主要是取決于模式本身,與主串無關(guān)。這時(shí)關(guān)鍵是要選擇模式的適當(dāng)位置。
3 改進(jìn)的KMP算法
模式匹配的KMP算法有效地避免了BM算法中頻繁回溯的問題,極大地提高了模式匹配的效率,但這種算法并不是最優(yōu)秀的。經(jīng)過長時(shí)間的探索與分析,KMP算法中的掃描部分仍然可以進(jìn)一步改進(jìn)。[5]
在改進(jìn)的KMP算法中,當(dāng)某一次匹配失敗時(shí),i指針不需要進(jìn)行回溯,而是使用已經(jīng)匹配到的結(jié)果,查看是否對(duì)i的調(diào)整進(jìn)行必要性評(píng)估,之后再?zèng)Q定與向右滑動(dòng)的位置模式進(jìn)行比較。主串指針i的有效變化可以有效提高匹配的效率。在進(jìn)行第一次匹配結(jié)束時(shí),j=6處,無法進(jìn)行匹配時(shí),i指針將會(huì)定為6,j指針為6,當(dāng)模式串向右移動(dòng)三個(gè)位置時(shí),開始進(jìn)行第二次的匹配,i的指針為9,而j的指針值為3,也就是說從主串的第九位開始進(jìn)行比較,i值的不斷增加也就加快了模式匹配的進(jìn)度,提高了工作效率。
4 利用改進(jìn)算法進(jìn)行多次模式匹配
與單模式匹配算法相比,多模式匹配算法的優(yōu)勢在于一趟遍歷可以對(duì)多個(gè)模式進(jìn)行匹配,從而大大提高了匹配效率。對(duì)于單模式匹配算法,如果要匹配多個(gè)模式,那么有幾個(gè)模式就需要幾趟遍歷。當(dāng)然多模式匹配算法也適用于單模式的情況。在入侵檢測系統(tǒng)中,一條入侵特征可能匹配或部分匹配很多條規(guī)則,如果采用單模式匹配,在匹配每條規(guī)則時(shí)都需要重新運(yùn)行匹配算法,效率很低。然而,日益增多的網(wǎng)絡(luò)攻擊使得入侵檢測的規(guī)則數(shù)目仍在不斷增長。
在實(shí)際的應(yīng)用中,模式串與主串一般需要多次的匹配,才能找到主串中是否有多次存在相同的子串,如在數(shù)據(jù)庫中進(jìn)行查找。[6]通過多次模式的匹配可以實(shí)現(xiàn)多個(gè)子串在文本中的位置,同時(shí)可以進(jìn)行標(biāo)記,有利于現(xiàn)代計(jì)算機(jī)龐大數(shù)據(jù)量的數(shù)理與分析。我國人口眾多,網(wǎng)民數(shù)量龐大,姓名與用戶名很可能會(huì)出現(xiàn)重復(fù)的情況,所以需要提前在數(shù)據(jù)庫中進(jìn)行查找,以確定是否可用,另外對(duì)匹配但其他特性不符的對(duì)象進(jìn)行排除。
5 結(jié)束語
隨著現(xiàn)代計(jì)算機(jī)技術(shù)的不斷發(fā)展,越來越多的新技術(shù)得以應(yīng)用與改進(jìn)。網(wǎng)絡(luò)安全發(fā)展形勢也要求提高網(wǎng)絡(luò)入侵檢測系統(tǒng)的性能。模式匹配的效率問題引起了足夠的重視。通過對(duì)傳統(tǒng)的KMP模式匹配算法與其發(fā)展?fàn)顩r進(jìn)行分析,明確未來發(fā)展思路,為其實(shí)踐應(yīng)用奠定理論基礎(chǔ)。
參考文獻(xiàn):
[1]李桂玲.一種改進(jìn)的KMP模式匹配算法[J].吉林工程技術(shù)師范學(xué)院學(xué)報(bào),2009(10):75-77.
[2]楊戰(zhàn)海.KMP模式匹配算法的研究分析[J].計(jì)算機(jī)與數(shù)字工程,2010(05):38-41.
[3]陳冬文,張帆,王斌,周啟海.模式匹配算法――KMP算法的改進(jìn)[A].2008中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C].成都:西南財(cái)經(jīng)大學(xué)信息技術(shù)應(yīng)用研究所,2008.
[4]明廷堂.BF與KMP模式匹配算法的實(shí)現(xiàn)與應(yīng)用[J].電腦編程技巧與維護(hù),2013(23):24-28+34.
[5]范洪博.快速精確字符串匹配算法研究[D].哈爾濱:哈爾濱工程大學(xué),2011.
[6]趙森嚴(yán),黃偉,李陽銘.一種改進(jìn)的KMP入侵檢測的模式匹配算法[J].井岡山大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(01):55-57.
【摘要】 頸動(dòng)脈超聲圖像中的運(yùn)動(dòng)信息能夠間接地反應(yīng)頸動(dòng)脈彈性等狀況,結(jié)合頸動(dòng)脈內(nèi)中膜厚度(CIMT)能夠?yàn)樾哪X血管疾病診斷提供定性與定量的依據(jù)。我們將改進(jìn)后的金字塔快速匹配算法(modified block sum pyramid,MBSP)應(yīng)用于頸動(dòng)脈超聲波圖像斑點(diǎn)跟蹤獲得運(yùn)動(dòng)信息。理論和實(shí)驗(yàn)結(jié)果都表明,改進(jìn)后的金字塔塊匹配算法能有效地減少運(yùn)動(dòng)跟蹤的運(yùn)算量,并且有著和改進(jìn)前的金字塔塊匹配算法相同的準(zhǔn)確度。運(yùn)動(dòng)跟蹤結(jié)果能夠?yàn)獒t(yī)生診斷心腦血管疾病起到一定的輔助作用。
【關(guān)鍵詞】 頸動(dòng)脈;斑點(diǎn)跟蹤;金字塔算法;運(yùn)動(dòng)分析;平均絕對(duì)差函數(shù)
Abstract:The motion information in the carotid ultrasound image can reflect the condition of carotid whether it has hardened, expanded and contracted in the right way. Then it can help doctor to diagnose cardio cerebral vascular diseases together with the carotid intima-medial thickness(CIMT).We used the modified block sum pyramid (MBSP) algorithm to analyze the motion of carotid ultrasound images. The result shows that the modified algorithm effectively reduced the computation while speckle tracking. Besides that, the MBSP algorithm has the same accuracy with the block sum pyramid. The tracking result can assist the doctor to evaluate the disk of cardio cerebral vascular diseases to a certain degree.
Key words:Carotid; Speckle tracking; Block sum pyramid; Motion analysis; Mean absolute difference
1 引 言
心腦血管疾病與頸動(dòng)脈內(nèi)中膜厚度及其運(yùn)動(dòng)特征等有著密切的相關(guān)性[1]。對(duì)于超聲波圖像而言,可以通過斑點(diǎn)跟蹤的方法獲得運(yùn)動(dòng)信息。斑點(diǎn)作為噪聲不可避免地存在于超聲波圖像中。雖然斑點(diǎn)噪聲影響超聲波圖像質(zhì)量,但是根據(jù)斑點(diǎn)噪聲的形成原理,可以通過跟蹤斑點(diǎn)來獲取圖像中相關(guān)目標(biāo)的運(yùn)動(dòng)信息。為研究組織的運(yùn)動(dòng)特征和彈性信息,進(jìn)而輔助評(píng)估心腦血管疾病提供了一種可能。斑點(diǎn)跟蹤算法一般包括兩個(gè)方面:匹配和搜索。匹配的準(zhǔn)則有許多種,常用的準(zhǔn)則有歸一化相關(guān)函數(shù)(NCCF),平均均方誤差函數(shù)(MSD)以及平均絕對(duì)差函數(shù)(MAD)等。因MAD不涉及乘法等復(fù)雜運(yùn)算,所以較為常用,本研究也采用該匹配準(zhǔn)則。搜索方法也有好多種,有全搜索法[2],十字搜索法[3],菱形搜索法[4]等。此外,在這些算法基礎(chǔ)上發(fā)展出了許多快速算法,如金字塔算法[5],連續(xù)淘汰法[6],改進(jìn)的自適應(yīng)2BIT變換法[7]等。臨床實(shí)踐中醫(yī)生除了用肉眼定性地去觀察頸動(dòng)脈的運(yùn)動(dòng)特征,有時(shí)需要定量測量出感興趣的頸動(dòng)脈某一目標(biāo)的運(yùn)動(dòng)信息(如:短軸切面輪廓在一個(gè)心動(dòng)周期內(nèi)收縮和擴(kuò)張的運(yùn)動(dòng)狀況)。這樣就能夠更加可靠地評(píng)估心腦血管疾病和風(fēng)險(xiǎn)。由于輔助診斷對(duì)運(yùn)動(dòng)跟蹤的實(shí)時(shí)性要求不是很高,而對(duì)運(yùn)動(dòng)跟蹤的準(zhǔn)確性要求較高。故我們選擇能達(dá)到全局最優(yōu)的全搜索法和金字塔快速匹配算法的組合進(jìn)行斑點(diǎn)運(yùn)動(dòng)跟蹤,并且對(duì)金字塔快速匹配算法進(jìn)行了改進(jìn),將其應(yīng)用于頸動(dòng)脈運(yùn)動(dòng)分析,高效準(zhǔn)確地跟蹤出目標(biāo)興趣點(diǎn)運(yùn)動(dòng)的相關(guān)信息。
2 原理與方法
2.1 金字塔塊匹配算法
設(shè)有塊X和Y,塊大小均為:2M×2M,對(duì)塊X和Y均建立 M+1層的金字塔。從塔頂往下依次為第0,1,…,M層。X,Y的金字塔的第m 層分別記為Xm,Ym。第m-1層和第m層關(guān)系如方程(1)所示:
Xm-1(i,j)=Xm(2i-1,2j-1)+
Xm(2i-1,2j)+Xm(2i,2j-1)+Xm(2i,2j)(1)
令:MADm(X,Y)=∑2mi=1∑2mj=1|Xm(i,j)-Ym(i,j)|(2)
可以得出結(jié)論(3):
MAD0(X,Y)≤MAD1(X,Y)≤MAD2(X,Y)…≤MADm(X,Y)…≤MADm(X,Y)(3)
兩個(gè)塊在生成了各自的金字塔之后,從頂層往下逐層計(jì)算MADm(X,Y)。如果發(fā)現(xiàn)其大于或者等于最新的MADmin時(shí),說明本候選塊一定不是最優(yōu)塊,舍棄該候選塊繼續(xù)搜索下一個(gè)候選塊,如果比較到最底層,仍然比最新的MADmin還小時(shí),將MADmin更新為當(dāng)前候選塊與參考?jí)K的MADm(X,Y)。直到所有的候選塊均搜索完后,最小的MADmin的候選塊相對(duì)于參考?jí)K的偏移量即為所要求解的運(yùn)動(dòng)向量。 金字塔匹配算法就是通過盡快地舍棄那些不是最優(yōu)的候選塊而減少運(yùn)算量的。雖然建立金字塔會(huì)增加額外的計(jì)算量,但是由于大部分的塊在比較時(shí)就被舍棄了,所以總的運(yùn)算量還是大幅地減少。
2.2 改進(jìn)的金字塔匹配算法
金字塔塊匹配算法從頂層開始往下逐層比較時(shí),層與層間的MAD值相差很大。當(dāng)層數(shù)較大時(shí),最后一層與倒數(shù)第二層的MAD值相差更大,因此,比較時(shí)仍有不少的計(jì)算冗余。為此,希望在現(xiàn)在的金字塔基礎(chǔ)上不改變運(yùn)算量,在層與層之間新增一些閾值,能夠盡早地舍棄那些不是最優(yōu)的塊。為了敘述方便,以下討論均以在最后一層(第M層)與倒數(shù)第二層(第M-1層)之間增加閾值為例。
兩個(gè)要比較的塊分別記為X,Y,塊X和Y的金字塔的第M-1層分別記為:XM-1,YM-1。設(shè)SM-1為第M-1層塔的所有像素點(diǎn)空間。將XM-1,YM-1按照相同的方式均分割為N個(gè)區(qū)域:S1M-1,S2M-1,S3M-1,SkM-1,…,SNM-1,1≤k≤N,見圖1。具體的分割方法還需要根據(jù)實(shí)際情況進(jìn)行合理的選擇。分割出的N個(gè)區(qū)域要滿足以下兩個(gè)約束關(guān)系:
∑Nk=1SM-1k=SM-1(4)
SM-1k∩SM-1l=,1≤k≠l≤N(5)
圖1 像素空間分割方法
Fig 1 Pixels partition method
圖2 實(shí)驗(yàn)所采取的分割方法
Fig 2 Experiment′s method
同時(shí)對(duì)塊X,Y的金字塔的第M層也劃分為N個(gè)區(qū)域SM1,SM2,SM3,SMk,…,SMN,1≤k≤N。也要滿足約束關(guān)系:
∑Nk=1SMk=SM和SMk∩SMl=,1≤k≠l≤N。
SM-1k區(qū)域中的每一個(gè)點(diǎn)對(duì)應(yīng)于SMk區(qū)域中的4個(gè)點(diǎn),此對(duì)應(yīng)關(guān)系和構(gòu)建金字塔時(shí)從M層到M-1層的4個(gè)點(diǎn)累加成1個(gè)點(diǎn)的對(duì)應(yīng)關(guān)系一致。
構(gòu)造如下函數(shù)表達(dá)式:(0≤n≤N)
MADM-1n(X,Y)=MADM-1(X,Y)-∑nk=1∑(i,j)∈SM-1k
|XM-1(i,j)YM-1(i,j)|+∑nk=1∑(i,j)∈SMk |XM(i,j)YM(i,j)|(6)
根據(jù)層間區(qū)域關(guān)系式(1),上式又可以寫成(7)式:
MADM-1n(X,Y)=MADM-1(X,Y)-f(n)(7)
其中f(n)可寫成(8)式:
f(n)=∑nk=1∑(i,j)∈SM-1k|XM-1(i,j)YM-1(i,j)|-
[|XM(2i-1,2j-1)YM(2i-1,2j-1)|+
|XM(2i-1,2j)YM(2i-1,2j)|+
|XM(2i,2j-1)YM(2i,2j-1)|+
|XM(2i,2j)YM(2i,2j)|](8)
又據(jù)三角不等式及上下層點(diǎn)的對(duì)應(yīng)關(guān)系知:
f(n)≤0,且f(n)隨著n的增大單調(diào)遞減,據(jù)此得出(9)、(10)、(11)的3個(gè)結(jié)論:
MADM-1(X,Y)=MADM-10(X,Y)(9)
MADM-1N(X,Y)=MADM(X,Y)(10)
MADM-10(X,Y)≤MADM-11(X,Y)
≤…MADM-1n(X,Y)≤…MADM-1N(X,Y)(11)
如果將SM-1像素空間一列一列依次從左往右分割時(shí),所得到的有關(guān)結(jié)論則和文獻(xiàn)[8]是一致的。文獻(xiàn)[8]中所提到的逐行更新算法可看作是本研究改進(jìn)算法的特例。現(xiàn)將改進(jìn)的金字塔匹配算法(以在兩幀中跟蹤一個(gè)興趣點(diǎn)為例)歸納如下:
記前后兩幀圖像分別為fi(x,y),fi+1(x,y),被跟蹤點(diǎn)坐標(biāo)為(a,b),前一幀圖像點(diǎn)(a,b)所對(duì)應(yīng)的塊稱為參考?jí)K,搜索范圍為A。
(1)計(jì)算相對(duì)于參考?jí)K運(yùn)動(dòng)位移為(0,0)的候選塊與參考?jí)K兩者的MAD值作為MADmin,并且確定后一幀圖像中的起始候選塊。MAD計(jì)算公式如(12)式所示:
MADmin=∑2M-1-1x=-2M-1 ∑2M-1-1y=-2M-1|fi(a+x,b+y)
-fi+1(a+x,b+y)|(12)
(2)依據(jù)金字塔算法構(gòu)建當(dāng)前候選塊和參考?jí)K各自的金字塔。金字塔總共假設(shè)有M+1層。沿金字塔至上而下逐層進(jìn)行比較,因?yàn)檫@里只考慮在M-1層和M層間新增閾值,所以前M-1層的比較和原金字塔塊匹配算法一樣。當(dāng)M-1層比較完后,發(fā)現(xiàn)MADM-1(X,Y)仍然小于最新的MADmin。此時(shí)則需要按照構(gòu)造函數(shù)表達(dá)式生成一個(gè)新的中間閾值,再進(jìn)行比較,其間發(fā)現(xiàn)新生成的閾值大于或者等于MADmin時(shí),舍棄,直接進(jìn)入步驟(3)進(jìn)行下一個(gè)候選塊的匹配。否則一直進(jìn)行到最后一層為止。如果其結(jié)果仍然小于MADmin時(shí),更新MADmin。
(3)按照選取的搜索算法(如全搜索法),確認(rèn)下一點(diǎn)被候選點(diǎn)及相應(yīng)的候選塊。重復(fù)步驟(2),直到A所有需要搜索的點(diǎn)搜索完為止。
(4)最后,對(duì)應(yīng)于MADmin值最小的候選塊即為最優(yōu)候選塊,其相對(duì)于參考?jí)K的偏移量,即為所要跟蹤的運(yùn)動(dòng)矢量。
2.3 利用MBSP算法分析頸動(dòng)脈圖像
(1)取頸動(dòng)脈短軸切面一個(gè)心動(dòng)周期的圖像序列。在第一幀圖像中,沿頸動(dòng)脈短軸輪廓,手動(dòng)大致均勻地選取出若干個(gè)興趣點(diǎn),興趣點(diǎn)應(yīng)盡量選取在整個(gè)運(yùn)動(dòng)序列圖像中亮度較為平穩(wěn)且肉眼觀察較為明顯的斑點(diǎn)噪聲顆粒。
(2)利用改進(jìn)的金字塔跟蹤算法(MBSP)逐幀地跟蹤所有興趣點(diǎn),得到各個(gè)興趣點(diǎn)在各幀中的運(yùn)動(dòng)矢量,再將各幀上各點(diǎn)的運(yùn)動(dòng)矢量按照適合人眼觀看的比例顯示在各幀圖像上。最后以動(dòng)態(tài)的方式播放附有運(yùn)動(dòng)矢量的頸動(dòng)脈圖像序列,醫(yī)生可以根據(jù)播放視頻中的運(yùn)動(dòng)矢量定性地掌握興趣點(diǎn)運(yùn)動(dòng)大小、方向、扭轉(zhuǎn)、是否出現(xiàn)異常等情況,做出一些如是否可能出現(xiàn)斑塊硬化等初步診斷。
(3)最后給出各個(gè)興趣點(diǎn)的收縮擴(kuò)張曲線,每條曲線給出每個(gè)點(diǎn)隨時(shí)間的運(yùn)動(dòng)速度變化。設(shè)第j幀圖像中跟蹤到的N個(gè)點(diǎn)的分別為坐標(biāo)(X1,Y1),…,(Xi,Yi),…,(XN,YN)。其均值為(X,Y)。記Vi=(Xi,Yi)-(X,Y),1
3 實(shí)驗(yàn)與結(jié)果
3.1 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)數(shù)據(jù)由合肥105醫(yī)院超聲科提供,為一個(gè)心動(dòng)周期的頸動(dòng)脈短軸切片序列圖像,共25幀。第1、11、22幀圖像分別見圖3、4、5。圖3中小白框即為我們要跟蹤的6個(gè)興趣點(diǎn),左上角為1號(hào)點(diǎn),按順時(shí)針依次排列。為了表述方便,這里只選取了6個(gè)興趣點(diǎn)為例。
分別用BSP和MBSP算法對(duì)該頸動(dòng)脈序列圖像進(jìn)行斑點(diǎn)運(yùn)動(dòng)跟蹤,其中MBSP算法在第3層和第4層增加了3個(gè)新的閾值。將第3層的像素空間從左到右依次分割成4個(gè)相同的區(qū)域,見圖2。實(shí)驗(yàn)中塊大小取為16×16,搜索范圍為8×8。圖4附上了第11幀圖像上各興趣點(diǎn)的運(yùn)動(dòng)矢量圖,兩個(gè)算法跟蹤出來的結(jié)果一樣。圖6給出了各個(gè)興趣點(diǎn)(從左往右,從上至下依次為1到6)隨時(shí)間變化的擴(kuò)張收縮運(yùn)動(dòng)速度圖。從圖中我們可以看出,興趣點(diǎn)2、3、4的運(yùn)動(dòng)表現(xiàn)出較為一致的運(yùn)動(dòng)規(guī)律,在一個(gè)心動(dòng)周期內(nèi)經(jīng)歷一個(gè)明顯的擴(kuò)張和之后的收縮過程。但是觀察興趣點(diǎn)1、5、6的運(yùn)動(dòng)速度曲線,發(fā)現(xiàn)其運(yùn)動(dòng)起伏相對(duì)來說沒有這些規(guī)律,從而可以認(rèn)為1、5、6附近區(qū)域可能出現(xiàn)一些病變。這和醫(yī)生的診斷結(jié)果:本試驗(yàn)者頸動(dòng)脈左下部區(qū)域內(nèi)膜形成了較為明顯的斑塊,而斑塊區(qū)域收縮運(yùn)動(dòng)常出現(xiàn)紊亂是相互吻合的。
3.2 性能分析
(1)準(zhǔn)確性。分析改進(jìn)后的算法和改進(jìn)前的金字塔匹配算法(BSP),容易得出前后算法運(yùn)動(dòng)跟蹤結(jié)果應(yīng)該是一致的,差異只在于計(jì)算量上。實(shí)際跟蹤的結(jié)果也證明了這一點(diǎn)。圖7、8給出了前后兩種算法的跟蹤興趣點(diǎn)1的運(yùn)動(dòng)軌跡圖,圖中橫軸、縱軸分別對(duì)應(yīng)于圖像的X軸和Y軸坐標(biāo)軸。
(2)效率。表1給出了改進(jìn)前后算法在上述實(shí)驗(yàn)過程中需要計(jì)算的各MAD值統(tǒng)計(jì)次數(shù)。計(jì)算第m層的MADm值所需要運(yùn)算量(含加減法及絕對(duì)值)可以公式化[9]為:3.22m-1,計(jì)算MADmn運(yùn)算量約為:5n·(3·22m+2-1)/16。以第4層為例,如果直接采用表1 金字塔算法改進(jìn)前后各MAD次數(shù)
原來的金字塔算法,需要計(jì)算總次數(shù)為821 457;但采用改進(jìn)后的算法需要的計(jì)算量僅為721 747。可見因?yàn)榈?層與第4層3個(gè)新增閾值的引入,第4層判決過程的總體運(yùn)算就減少12.11%,可以考慮將區(qū)域進(jìn)行更細(xì)劃分,但是要權(quán)衡因?yàn)殚撝翟黾佣斐傻谋容^運(yùn)算量。如果在第3層等層也引入同樣機(jī)制的話,運(yùn)算量將進(jìn)一步減少。
4 總結(jié)
本研究將改進(jìn)后的金字塔匹配算法應(yīng)用于斑點(diǎn)運(yùn)動(dòng)跟蹤,實(shí)驗(yàn)結(jié)果表明該算法能準(zhǔn)確而更加有效地跟蹤出運(yùn)動(dòng)矢量。并且將該方法應(yīng)用于頸動(dòng)脈運(yùn)動(dòng)分析,結(jié)合頸動(dòng)脈的自身特點(diǎn),給出有利于輔助醫(yī)生診斷的擴(kuò)張與收縮曲線等依據(jù),為頸動(dòng)脈的進(jìn)一步分析奠定了一定基礎(chǔ)。
參考文獻(xiàn)
[1]胡瑋,張軍,孔國喜,等. 超聲檢測頸內(nèi)動(dòng)脈內(nèi)-中膜厚度及其形態(tài)結(jié)構(gòu)與相關(guān)心腦血管疾病的關(guān)系[J]. 第四軍醫(yī)大學(xué)學(xué)報(bào) ,2007,28(15):1431-1433.
[2]Brünig M, Niehsen W. Fast full-search block matching[J]. IEEE Trans Circuits Syst Video Technol,2001,11(2): 241-247.
[3]Ghanbari M. The cross-search algorithm for motion estimation[J]. IEEE Trans Commun,1990, 38(7): 950-953.
[4]Zhu S,Ma K-K.A new diamond search algorithm for fast block-matching motion estimation[J].IEEE Trans Image Processing,2000,9(2):287-290.
[5]Lee C H, Chen L H. A fast motion estimation algorithm based on the block sum pyramid [J]. IEEE Trans Image Processing, 1997,6(11):1587-1591.
[6]Li W, Salari E. Successive elimination algorithm for motion estimation [J]. IEEE Trans Image processing, 1995,4(1): 105-107.
[7]Demir B, Ertu¨rk S. Block motion estimation using adaptive modified two-bit transform[J]. IET Image Process, 2007,1(2):215-222.
關(guān)鍵詞:數(shù)字圖像取證;圖像區(qū)域復(fù)制粘貼篡改
中圖分類號(hào):TP391.41文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1007-9599 (2011) 16-0000-01
Comparative Study of Ddigital Image Copy Paste Tamper Forensics Technology
Han Min,Sun Jinguo
(Chinese People's Public Security University,Beijing102623,China)
Abstract:This article describes several algorithms aiming at a common copy-paste forgery in the research field of digital image forensics,compared?the performance of?various methods.Different of kinds of tamper detection methods have been analyzed and discussed.It also prospects the future of copy-paste forgery in the research field of digital image forensics.
Keywords:Digital image forensics;Image area copy paste tamper
一、引言
近年來隨著電子技術(shù)的發(fā)展傳統(tǒng)的“膠卷相機(jī)”已經(jīng)幾乎被數(shù)碼相機(jī)所代替,這為人們省去了很多傳統(tǒng)相機(jī)使用上的不變,但伴隨著數(shù)字圖像處理軟件的發(fā)展,數(shù)字圖像的非法篡改給人們的生活以及社會(huì)帶來很多負(fù)面的影響,數(shù)字媒體的信息安全無法得到保障。復(fù)制粘貼篡改是一種常見的篡改手法,它利用同幅圖片內(nèi)各種統(tǒng)計(jì)參數(shù)比較相近,從一個(gè)區(qū)域復(fù)制一個(gè)圖塊粘貼到另一區(qū)域上,以達(dá)到掩蓋圖像真實(shí)內(nèi)容的目的。
二、數(shù)字圖像被動(dòng)取證技術(shù)
數(shù)字圖像被動(dòng)取證技術(shù),要求只給出待檢測圖像就可以鑒別真?zhèn)危丛诓灰蕾嚾魏晤A(yù)簽名提取或預(yù)嵌入信息的前提下,對(duì)圖像內(nèi)容的真?zhèn)魏蛠碓催M(jìn)行鑒別和取證的技術(shù),因此這類取證技術(shù)也叫數(shù)字圖像盲取證技術(shù)。
數(shù)字圖像被動(dòng)取證技術(shù)實(shí)現(xiàn)的可行性基于這樣一個(gè)事實(shí):任何來源的數(shù)字圖像都有自身的統(tǒng)計(jì)特征,而任何對(duì)數(shù)字圖像的篡改都會(huì)不可避免地引起圖像統(tǒng)計(jì)特征上的變化。因此,可以通過檢測圖像統(tǒng)計(jì)特征的變化,來判斷圖像的原始性、真實(shí)性和完整性。
三、取證算法
目前的取證算法大體上可以分為兩類,即基于單個(gè)像素的窮舉搜索和基于圖像塊的檢測方法。塊匹配算法共同的特點(diǎn)就是對(duì)輸入的圖像數(shù)據(jù)進(jìn)行分塊處理。得到這些塊之后,從這些塊中提取相應(yīng)的特征值構(gòu)成特征向量,不同的基于塊匹配的算法的實(shí)質(zhì)區(qū)別就在于選取的特征值各不相同。下面就各種方法進(jìn)行比較:
(一)窮舉搜索。基于單個(gè)像素點(diǎn)的窮舉法原理很簡單,但計(jì)算復(fù)雜度很高,將之應(yīng)用于大幅圖像的篡改檢測顯然是不可行的,與此同時(shí),此算法也不能夠抵抗外來的一些干擾操作,如加噪、模糊等。算法本身受條件的約束性較強(qiáng)。一般我們只用于對(duì)較小尺寸的篡改圖像的檢測。
(二)簡單塊匹配。最基本的塊匹配檢測算法是將得到的b2大小的塊展開,每個(gè)方形塊按行優(yōu)先順序被展為一行,存入一個(gè)矩陣中,這樣所有的行向量組成了一個(gè)二維矩陣X,其中列數(shù)為b2,行數(shù)為(Mb+1)(Nb+1)。為了減少算法的計(jì)算量,按照字典排序的方法對(duì)X陣中的行進(jìn)行排列。最后根據(jù)判斷是否存在等同的行向量來確定篡改結(jié)果。這種算法在圖像遭到了復(fù)制粘貼篡改后沒用進(jìn)行其他篡改的情況下顯示出了良好的性能,但是當(dāng)篡改圖像經(jīng)過如壓縮等后續(xù)操作時(shí),檢測的正確率明顯降低,這是由于塊與塊之間不再是精確的相似,檢測效果大打折扣。
Fridrich等人對(duì)此進(jìn)行了改進(jìn),先對(duì)圖像進(jìn)行塊離散余弦變換(BDCT)變換,采取經(jīng)過量化后各塊的BDCT系數(shù)進(jìn)行對(duì)比分析。由于是在DCT域上做分析,算法具有一定的魯棒性。但是當(dāng)處理的圖像比較大時(shí),由于計(jì)算量太大,往往需要很長的時(shí)間來實(shí)現(xiàn)篡改定位,這個(gè)時(shí)間很可能無法令人接受。
駱偉祺等人提出了一種魯棒的檢測算法,這種算法也是基于圖像塊匹配的。假定問題圖像為彩色圖像(大小為MxN),首先對(duì)其進(jìn)行分塊處理,分塊的方式同前面一樣,在得到了(M-b+1)x(N-b+1)個(gè)圖像塊之后,對(duì)每個(gè)圖像塊提取可以代表其內(nèi)容的七個(gè)特征值,并以向量的形式來表示,前三個(gè)分量a1、a2、a3分別是b2大小的彩色圖像塊RGB通道的均值。若為灰度圖,只需記錄像素點(diǎn)的灰度值即可,a4、a5、a6、a7則是由圖像塊內(nèi)各像素點(diǎn)的亮度分量Y組成的陣列經(jīng)過四種分解方式整合處理后得到的特征。此算法具有一定的魯棒性能,能夠抵抗一定程度的后處理操作,如模糊、壓縮等。但如果被復(fù)制的區(qū)域發(fā)生了形變,則容易造成誤判,甚至失效。
(三)基于不變矩的檢測算法。不變矩方法是一種經(jīng)典的特征提取方法,目前已經(jīng)廣泛應(yīng)用于圖像分析與模式識(shí)別領(lǐng)域中。Hu提出的7個(gè)矩不變量,不但具有平移不變性,而且還具有旋轉(zhuǎn)不變性,適合用于表示圖像的特征。但Hu矩的方法對(duì)模糊和加噪操作沒有明顯效果。
Zernike矩是一組正交矩,也具有旋轉(zhuǎn)不變性,即旋轉(zhuǎn)目標(biāo)并不改變其模值。由于Zernike矩能構(gòu)造出任意高階矩,而高階矩包含更多的圖像信息,所以Zernike矩的識(shí)別效果優(yōu)于其他方法。何坤等人提出了一種方法,將尺寸較大的篡改圖像運(yùn)用小波變換得到低頻子圖像,再把低頻子圖像分割為圖像子塊,對(duì)其子塊序列圖像分別進(jìn)行Zernike矩分析判斷是否存在復(fù)制篡改,該方法克服了噪聲和幾何變換對(duì)取證的影響。
(四)基于SVD的檢測算法。奇異值分解(SVD),是一種圖像特征分析方法。它的目的在于消除圖像數(shù)據(jù)各分量間相關(guān)性,是基于信號(hào)二階統(tǒng)計(jì)特性的一種方法。國防科技大學(xué)吳瓊等人提出了一種基于SVD的圖像復(fù)制區(qū)域檢測算法。利用奇異值分解變換來處理圖像塊數(shù)據(jù),并對(duì)圖像塊進(jìn)行相似性匹配檢驗(yàn)。這種方法對(duì)圖像羽化或邊緣模糊等處理具有魯棒性。
四、結(jié)語
目前主流算法對(duì)于相對(duì)簡單的復(fù)制粘貼篡改檢測效果較好,但偽造者為了使篡改圖像更加可信,除了采用簡單的平移、旋轉(zhuǎn)外,還可能會(huì)根據(jù)實(shí)際情況對(duì)篡改內(nèi)容進(jìn)行縮放、模糊等操作,這樣傳統(tǒng)的塊匹配算法將會(huì)失效。因此,在保證算法健壯性與檢測準(zhǔn)確率的前提下,我們要設(shè)計(jì)出能夠同時(shí)抵抗平移、旋轉(zhuǎn)、縮放、模糊等各種操作的取證算法,這是我們今后努力的方向。
參考文獻(xiàn):
[1]周琳娜.王東明數(shù)字圖像取證技術(shù)[M].北京:北京郵電大學(xué)出版社,2008:69-70
[2]駱偉祺,黃繼武,丘國平.魯棒的區(qū)域復(fù)制圖像篡改檢測技術(shù)[J].計(jì)算機(jī)學(xué)報(bào),2007,11
關(guān)于樹葉質(zhì)量的建模與分析
封鎖嫌疑犯的數(shù)學(xué)建模方法
正倒向隨機(jī)微分方程理論及應(yīng)用
數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)課程調(diào)查報(bào)告
基于膚色模型法的人臉定位技術(shù)研究
生豬養(yǎng)殖場的經(jīng)營管理策略研究
從數(shù)學(xué)建模到問題驅(qū)動(dòng)的應(yīng)用數(shù)學(xué)
大學(xué)籃球教練能力評(píng)價(jià)的機(jī)理模型
基于WSD算法的水資源調(diào)度綜合策略
關(guān)于地球健康的雙層耦合網(wǎng)絡(luò)模型
多屬性決策中幾種主要方法的比較
塑化劑遷移量測定和遷移模型研究進(jìn)展
基于信息熵的n人合作博弈效益分配模型
混合動(dòng)力公交車能量控制策略的優(yōu)化模型
垃圾減量分類中社會(huì)及個(gè)體因素的量化分析
隨機(jī)過程在農(nóng)業(yè)自然災(zāi)害保險(xiǎn)方案中的應(yīng)用
“公共自行車服務(wù)系統(tǒng)”研究與大數(shù)據(jù)處理
天然氣消費(fèi)量的偏最小二乘支持向量機(jī)預(yù)測
微積分與概率統(tǒng)計(jì)——生命動(dòng)力學(xué)的建模
美國大學(xué)生數(shù)學(xué)建模競賽數(shù)據(jù)及評(píng)閱分析
微積分與概率統(tǒng)計(jì)——生命動(dòng)力學(xué)的建模
在微積分教學(xué)中融入數(shù)學(xué)建模的思想和方法
2015“深圳杯”數(shù)學(xué)建模夏令營題目簡述
字符串匹配算法在DNA序列比對(duì)中的應(yīng)用
差分形式的Gompertz模型及相關(guān)問題研究
小樣本球面地面條件下的三維無源定位算法
數(shù)學(xué)建模思想滲入代數(shù)課程教學(xué)的試驗(yàn)研究
基于貝葉斯信息更新的失事飛機(jī)發(fā)現(xiàn)概率模型
基于人體營養(yǎng)健康角度的中國果蔬發(fā)展建模
關(guān)于數(shù)學(xué)成為獨(dú)立科學(xué)形式的歷史與哲學(xué)成因探討
深入開展數(shù)學(xué)建模活動(dòng),培養(yǎng)學(xué)生的綜合應(yīng)用素質(zhì)
完善數(shù)學(xué)建模課程體系,提高學(xué)生自主創(chuàng)新能力
利用動(dòng)態(tài)貝葉斯網(wǎng)構(gòu)建基因調(diào)控網(wǎng)絡(luò)的研究進(jìn)展
地方本科院校擴(kuò)大數(shù)學(xué)建模競賽受益面的探索
城鎮(zhèn)化進(jìn)程中洛陽市人口發(fā)展的數(shù)學(xué)建模探討
基于TSP規(guī)劃模型的碎紙片拼接復(fù)原問題研究
卓越現(xiàn)場工程師綜合素質(zhì)的AHP評(píng)價(jià)體系研究
基于Logistic映射和超混沌系統(tǒng)的圖像加密方案
嫦娥三號(hào)軟著陸軌道設(shè)計(jì)與控制策略問題評(píng)析
嫦娥三號(hào)軟著陸軌道設(shè)計(jì)與控制策略的優(yōu)化模型
微生物發(fā)酵非線性系統(tǒng)辨識(shí)、控制及并行優(yōu)化研究
含多抽水蓄能電站的電網(wǎng)多目標(biāo)運(yùn)行優(yōu)化研究
連接我們的呼吸:全球環(huán)境模型的互聯(lián)神經(jīng)網(wǎng)絡(luò)方法
垃圾焚燒廠周邊污染物濃度的傳播模型和監(jiān)測方案
以數(shù)學(xué)建模競賽為切入點(diǎn),強(qiáng)化學(xué)生創(chuàng)新能力培養(yǎng)
一種新的基于PageRank算法的學(xué)術(shù)論文影響力評(píng)價(jià)方法
基于視頻數(shù)據(jù)的道路實(shí)際通行能力和車輛排隊(duì)過程分析
[關(guān)鍵詞]通信技術(shù);交通流,GPS定位
中圖分類號(hào):TN 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-914X(2014)23-0203-01
1.研究內(nèi)容
手機(jī)定位技術(shù)是利用移動(dòng)通信網(wǎng)絡(luò)和移動(dòng)通信設(shè)備進(jìn)行手機(jī)定位的,只要能夠?qū)崿F(xiàn)雙向通信的移動(dòng)通信系統(tǒng)都可以作為這種定位系統(tǒng)的通信基礎(chǔ),如國內(nèi)移動(dòng)運(yùn)營商較多采用的GSM系統(tǒng)、CDMA系統(tǒng)等。現(xiàn)階段,國內(nèi)兩大主要移動(dòng)運(yùn)營商移動(dòng)、聯(lián)通均已推出了手機(jī)定位服務(wù)。
無線定位系統(tǒng)中將手機(jī)定位方式分為:基于網(wǎng)絡(luò)方式及利用移動(dòng)網(wǎng)絡(luò)的基站獲得手機(jī)位置信息,該方法不需要對(duì)現(xiàn)有的手機(jī)設(shè)備進(jìn)行任何改進(jìn);基于手機(jī)終端的方式,該方法需要對(duì)現(xiàn)有手機(jī)設(shè)備進(jìn)行一定的改進(jìn);以及兩者的混合式定位方式。可見,將基于網(wǎng)絡(luò)的手機(jī)定位數(shù)據(jù)作為交通檢測信息不需要過多的基礎(chǔ)設(shè)施投資,能夠?qū)崿F(xiàn)低成本、實(shí)時(shí)的交通流參數(shù)檢測。
比較實(shí)用的GPS定位技術(shù)是網(wǎng)絡(luò)輔助的GPS定位,即定位時(shí),網(wǎng)絡(luò)通過跟蹤GPS衛(wèi)星信號(hào),解調(diào)出GPS導(dǎo)航信號(hào),并將這些信息傳送給移動(dòng)臺(tái),移動(dòng)臺(tái)利用這些信息可以快速的搜索到有效的GPS衛(wèi)星,接收到衛(wèi)星信號(hào)后,計(jì)算移動(dòng)臺(tái)位置的工作可以由網(wǎng)絡(luò)實(shí)體或移動(dòng)成。基于GPS系統(tǒng)的定位技術(shù),其優(yōu)點(diǎn)是定位精度較高,定位半徑可達(dá)到幾米、十幾米。因此利用該重定位技術(shù),可提供對(duì)定位精度要求較高的業(yè)務(wù),如電子地圖顯示用戶位置等。其缺點(diǎn)是需要移動(dòng)臺(tái)內(nèi)置GPS天線和GPS芯片等模塊,并且需要支持IS-801協(xié)議,網(wǎng)絡(luò)側(cè)需要增加PDE和MPC;定位精度受終端所處環(huán)境的影響較大,如用戶在室內(nèi)或在高大建筑物之間時(shí),由于可見的GPS衛(wèi)星數(shù)量較少,定位精度將降低,甚至無法完成定位。
GPS(AssistedGPS)。A-GPS與GPS方案一樣,也需要在手機(jī)內(nèi)增加GPS接收機(jī)模塊,并改造手機(jī)天線,但手機(jī)本身并不對(duì)位置信息進(jìn)行計(jì)算,而是將GPS的位置信息數(shù)據(jù)傳給移動(dòng)通信網(wǎng)絡(luò),由網(wǎng)絡(luò)的定位服務(wù)器進(jìn)行位置計(jì)算,同時(shí)移動(dòng)網(wǎng)絡(luò)按照GPS的參考網(wǎng)絡(luò)所產(chǎn)生的輔助數(shù)據(jù),如差分校正數(shù)據(jù)、衛(wèi)星運(yùn)行狀態(tài)等傳遞給手機(jī),并從數(shù)據(jù)庫中查出手機(jī)的近似位置和小區(qū)所在的位置信息傳給手機(jī),這時(shí)手機(jī)可以很快捕捉到GPS信號(hào),這樣的首次捕獲時(shí)間將大大減小,一般僅需幾秒的時(shí)間。不需像GPS的首次捕獲時(shí)間可能要2―3分鐘時(shí)間。而精度也僅為幾米,高于GPS的精度。
在移動(dòng)電話定位系統(tǒng)中,可以利用不同的信號(hào)特征參數(shù),如信號(hào)強(qiáng)度(SS)、信號(hào)到達(dá)角度(AOA),時(shí)間測量值(包括信號(hào)到達(dá)時(shí)間TOA、信號(hào)到達(dá)時(shí)間差TDOA)等,以及他們的組合進(jìn)行定位。各種定位方法采用的信號(hào)特征參數(shù)、信號(hào)檢測設(shè)備、實(shí)現(xiàn)定位的難易程度、信號(hào)傳播中的影響因素和定位的精度都不相同,但提供“微觀”車輛運(yùn)行狀態(tài)的車載手機(jī)定位數(shù)據(jù)的確具有相同的數(shù)據(jù)特征,與傳統(tǒng)檢測器提供的車輛通過信息的數(shù)據(jù)特征完全不同。
從數(shù)據(jù)的檢測對(duì)象上看,基于GPS定位的交通流參數(shù)估計(jì),已采集道路車流中行駛的裝配GPS定位裝置的車輛自身的行駛數(shù)據(jù)――多點(diǎn)定位位置、瞬時(shí)速度數(shù)據(jù)及車輛的一些其他狀態(tài)信息為基礎(chǔ),進(jìn)而獲得檢測車輛所在道路的交通流參數(shù)。基于移動(dòng)通信網(wǎng)絡(luò)的手機(jī)定位信息包括公路沿線手機(jī)的ID號(hào)和經(jīng)緯度,利用上述手機(jī)信息獲得獨(dú)立車輛運(yùn)行狀態(tài),進(jìn)而估計(jì)信息間的單元所在路段的交通流參數(shù)。
可見,基于傳統(tǒng)檢測器和GPS定位檢測器的交通流參數(shù)估計(jì)均是以車輛為檢測目標(biāo),檢測車輛的通過或存在狀況,獲得道路上的獨(dú)立車輛信息。而基于手機(jī)定位的交通流參數(shù)估計(jì)卻以道路上行駛車輛的車載手機(jī)為檢測目標(biāo),通過車載手機(jī)信息獲得獨(dú)立車輛狀態(tài)。
標(biāo)定切換網(wǎng)絡(luò)
切換網(wǎng)絡(luò)由切換點(diǎn)和切換路段構(gòu)成,其中切換點(diǎn)指的是車載手機(jī)在道路上發(fā)生手機(jī)切換的位置;切換路段指的是連續(xù)發(fā)生兩次手機(jī)切換的路段。在沿途道路上標(biāo)定出基站切換或手機(jī)切換點(diǎn)的位置,利用預(yù)先準(zhǔn)備的專業(yè)軟件經(jīng)實(shí)地測試獲取切換點(diǎn)坐標(biāo),計(jì)算出切換網(wǎng)絡(luò)中每條道路的路段長度,如圖所示。其中(1,3)就是一個(gè)被標(biāo)定的切換點(diǎn),表示手機(jī)從基站1到基站3的切換點(diǎn)位置坐標(biāo);L1就是兩個(gè)手機(jī)切換點(diǎn)A(1,3)和B(3,6)之間的路段長度。
2.路徑匹配
與預(yù)先得到手機(jī)位置獲取交通信息方式不同,基于手機(jī)位置切換技術(shù)的路徑匹配是利用沿路行駛的車載手機(jī)切換序列來確定手機(jī)所處路段。在理想狀態(tài)下,手機(jī)在兩基站覆蓋范圍交界處發(fā)生切換,每條道路都有與之對(duì)應(yīng)的一條穩(wěn)定切換序列,按照上面原理示意圖,根據(jù)已標(biāo)定的切換網(wǎng)絡(luò),得到與實(shí)際道路對(duì)應(yīng)的手機(jī)切換序列1-3-6-9-10-12-15-18-26,當(dāng)通過七號(hào)信令解析出來的GSM網(wǎng)絡(luò)中的小區(qū)部分或全部標(biāo)識(shí)與這條道路的切換序列相一致,就能對(duì)該車載手機(jī)的行駛路徑匹配到該路段中。例如,采集到手機(jī)的切換序列為1-3-6-9、9-10-12、12-15-18-26等,都可以確定車載手機(jī)在該條道路上行駛。
另一方面,由于手機(jī)信號(hào)受多方面因素影響,如城市內(nèi)的高層建筑對(duì)信號(hào)的反射和折射、其他通信信號(hào)對(duì)手機(jī)信號(hào)傳播的干擾等,都對(duì)手機(jī)切換造成不穩(wěn)定影響,也降低了路徑匹配概率,需要進(jìn)一步研究這些現(xiàn)象,讓兩者關(guān)系趨于穩(wěn)定。
計(jì)算路段行程車速
完成切換網(wǎng)絡(luò)標(biāo)定和路徑匹配之后,就可以計(jì)算每條道路上的路段行程車速。手機(jī)至少連續(xù)發(fā)生兩次位置切換才能得到手機(jī)行駛的路段長度Li, 這時(shí)根據(jù)Vi=Li/ti 即可計(jì)算出車載手機(jī)的行駛速度。以此類推,就可以獲取切換序列中,手機(jī)對(duì)于所有相應(yīng)路段的行駛速度。
3.地圖匹配技術(shù)的算法
地圖匹配算法的要求
地圖匹配的結(jié)果需要盡可能的減小車載手機(jī)的軌跡坐標(biāo)與行駛車輛的實(shí)際位置之間存在的影響誤差,正確顯示車輛在地圖上的具置,提高系統(tǒng)信息采集的穩(wěn)定性和可靠性。因此,地圖匹配的算法就需要滿足以下要求:
選用的算法具有實(shí)時(shí)性:算法簡單,可以隨時(shí)調(diào)整車輛行駛軌跡,減少時(shí)延估計(jì);
選用的算法具有適應(yīng)性:算法針對(duì)復(fù)雜交通路況都可以進(jìn)行匹配,不受單一道路條件局限;
選用的算法具有可靠性:算法在復(fù)雜路網(wǎng)上,可以選擇正確的候選道路;
算法要求距離因素:車輛實(shí)際位置與地圖匹配道路之間的距離應(yīng)最短;
算法要求方向因素:車輛行駛軌跡與地圖匹配道路方向保持一致;
算法要求道路連通性因素:車輛行駛上一時(shí)刻的位置的匹配于一條道路上,則當(dāng)前時(shí)刻的車輛位置也匹配于該道路上,或者匹配于與該道路連通的道路上;
算法要求路徑長度因素:在某一時(shí)間間隔內(nèi),車輛行駛的實(shí)際距離與匹配到地圖上的路徑長度基本相同;
對(duì)于蜂窩無線定位,還需考慮兩個(gè)因素:
【關(guān)鍵詞】語音識(shí)別 語音輔助 辦公系統(tǒng) 有限狀態(tài)機(jī)
語音交互是人們最廣泛使用和適應(yīng)的一種日常交互方式,在電子信息領(lǐng)域,也是一種理想的人機(jī)交互方式,隨著語音識(shí)別算法的發(fā)展和相關(guān)硬件技術(shù)進(jìn)步,語音識(shí)別技術(shù)逐步走向成熟,目前在語音輸入領(lǐng)域、語音大數(shù)據(jù)分析、語音生活輔助等領(lǐng)域已經(jīng)有較多的應(yīng)用場景。但是語音輔助技術(shù)目前仍存在一定難點(diǎn),例如語音開集庫識(shí)別、語音交互速度等方面。同時(shí),語音識(shí)別技術(shù)在辦公輔助系統(tǒng)上應(yīng)用還較少,尤其是某些工作人員不方便進(jìn)行手動(dòng)指令輸入操作的場景或手動(dòng)指令輸入效率較低場景,如果利用語音輔助技術(shù),可以有效提高用戶辦公效率和系統(tǒng)適應(yīng)性。
本文基于上述問題,針對(duì)性地提出了一種語音輔助系統(tǒng)模型,通過合理的模型設(shè)計(jì)和算法設(shè)計(jì),有效改進(jìn)了上述技術(shù)難點(diǎn)帶來的語音識(shí)別效率和指令輸入效率問題,提高用戶使用語音輔助時(shí)的工作效率和用戶體驗(yàn)。
1 系統(tǒng)概述
1.1 系統(tǒng)整體框架介紹
系統(tǒng)整體框架如圖1所示,系統(tǒng)分為三層架構(gòu),分別為用戶交互層、邏輯處理層和底層框架。用戶交互層主要負(fù)責(zé)與用戶進(jìn)行指令交互工作和信息反饋工作,主要包含三個(gè)模塊,為語音監(jiān)聽模塊、用戶輸入模塊和語音反饋模塊,三個(gè)分別負(fù)責(zé)用戶語音監(jiān)聽,用戶手動(dòng)指令輸入和系統(tǒng)信息語音反饋。
邏輯層為系統(tǒng)核心部分,包含模式識(shí)別模塊、指令執(zhí)行模塊和語音識(shí)別模塊,其中,語音識(shí)別模塊獲取交互層提交的用戶語音音頻信息,將用戶語音指令或語音輸入轉(zhuǎn)換為輸入字符串,以便進(jìn)一步處理。模式識(shí)別模塊的主要作用是將用戶輸入語音轉(zhuǎn)換獲得的字符串進(jìn)行模式匹配,將無結(jié)構(gòu)的字符串轉(zhuǎn)換為結(jié)構(gòu)化的指令樹,從中提取用戶真正的指令信息。指令執(zhí)行模塊的主要功能是進(jìn)行用戶數(shù)據(jù)和系統(tǒng)操作的指令執(zhí)行,其中為其他模塊提供系統(tǒng)操作接口,供其他模塊調(diào)用。
底層框架提供了系統(tǒng)基礎(chǔ)運(yùn)行平臺(tái),分別包含系統(tǒng)運(yùn)行框架和數(shù)據(jù)庫平臺(tái),底層框架根據(jù)不同的系統(tǒng)部署要求可以進(jìn)行對(duì)應(yīng)的調(diào)整。
2 系統(tǒng)關(guān)鍵部分
2.1 語音監(jiān)聽與識(shí)別模塊
語音監(jiān)聽與識(shí)別屬于用戶交互端和邏輯預(yù)處理端,其核心部分為語音識(shí)別技術(shù)(Auto Speech Recognize,簡稱ASR),在本論文的實(shí)現(xiàn)過程中,采用科大訊飛的語音識(shí)別SDK,其語音識(shí)別算法采用深度神經(jīng)網(wǎng)絡(luò)(DNN)聲學(xué)建模,同時(shí)采用多重降噪算法進(jìn)行降噪處理,經(jīng)測試,能夠充分滿足本系統(tǒng)針對(duì)的多樣化使用場景需求。
系統(tǒng)在啟動(dòng)后,語音監(jiān)聽模塊將進(jìn)行常駐監(jiān)聽,保證用戶指令隨時(shí)處于輸入狀態(tài),減少用戶手動(dòng)操作效率降低問題,獲取語音信息經(jīng)壓縮后傳遞給語音識(shí)別模塊,語音識(shí)別模塊將音頻信息識(shí)別后轉(zhuǎn)換為字符串,此生成信息作為模式匹配樣本交給邏輯層處理。
2.2 指令模式識(shí)別模塊
指令識(shí)別模塊的主要作用是獲取經(jīng)過對(duì)用戶輸入語音轉(zhuǎn)換后的字符串,通過與系統(tǒng)預(yù)先設(shè)置的用戶指令進(jìn)行對(duì)比匹配,提取用戶輸入信息中的指令部分,再交由指令執(zhí)行模塊進(jìn)行信息處理。
為提升用戶指令匹配成功率,在指令模式識(shí)別過程中,采用有限狀態(tài)機(jī)模型(Finite-state machine),采用有限狀態(tài)機(jī),可以建立指令樣本,在對(duì)用戶輸入信息進(jìn)行指令匹配時(shí),采用順序字符串匹配算法,這樣可以高效過濾用戶信息,快速提取用戶指令。
3 系統(tǒng)關(guān)鍵技術(shù)
3.1 基于有限狀態(tài)機(jī)的指令匹配模型
此部分主要包含兩個(gè)方面,一是系統(tǒng)指令的預(yù)設(shè)定,如上文所述,在某信息系統(tǒng)嵌入該語音輔助系統(tǒng)時(shí),首先要確定該系統(tǒng)所需要對(duì)用戶提供的指令內(nèi)容,將每個(gè)指令內(nèi)容作為有限狀態(tài)機(jī)中的單一狀態(tài),例如圖2所示。
第二部分為用戶輸入信息指令提取,由于用戶指令數(shù)有限,所以,在獲取用戶模式匹配樣本之后,可以采用順序字符串匹配計(jì)算,當(dāng)匹配到預(yù)設(shè)指令時(shí),便將該指令作為狀態(tài)機(jī)狀態(tài)轉(zhuǎn)移標(biāo)志,進(jìn)而獲取用戶所需要進(jìn)行的操作,達(dá)到指令匹配目的。在匹配過程中,采用KMP算法,有效提高用戶指令輸入效率。
3.2 指令快速匹配優(yōu)化
在大多數(shù)信息系統(tǒng)中,除了用戶操作有限之外,還具有上下層級(jí)關(guān)系,為提高用戶輸入效率,在系統(tǒng)初始化設(shè)定過程中,針對(duì)具有層級(jí)關(guān)系的指令,將其構(gòu)筑為指令樹結(jié)構(gòu),如圖3中所示,如果用戶輸入指令為“AABB0246CC”,系統(tǒng)在匹配至“0”時(shí),將不再向用戶返回確認(rèn)請(qǐng)求,將繼續(xù)進(jìn)行指令匹配,直至匹配至“C”,那么最終狀態(tài)將跳轉(zhuǎn)至狀態(tài)7,向用戶返回請(qǐng)求指令7執(zhí)行,得到確認(rèn)后,將執(zhí)行指令。按照上述流程,在面對(duì)多層指令操作時(shí),用戶只需要語音輸入連續(xù)狀態(tài)指令,將直接跳轉(zhuǎn)至目標(biāo)狀態(tài),執(zhí)行目標(biāo)執(zhí)行,達(dá)到指令快速匹配目的,這樣極大提升了用戶輸入效率,省去大量重復(fù)語音指令輸入步驟。
4 總結(jié)
目前語音識(shí)別正在進(jìn)入越來越多的領(lǐng)域,利用本文設(shè)計(jì)的語音輔助系統(tǒng),用戶指令輸入效率得到顯著提升,同時(shí)給出整體模型,以便其他信息系統(tǒng)平臺(tái)高效接入此語音輔助系統(tǒng)。
參考文獻(xiàn)
[1]王炳錫.實(shí)用語音識(shí)別基礎(chǔ)[M].北京:國防工業(yè)出版社,2005.
[2]童拉.辦公自動(dòng)化系統(tǒng)中語音功能的設(shè)計(jì)和實(shí)現(xiàn)[J].湖北工業(yè)大學(xué)學(xué)報(bào),2005,20(02):71-73.
[3]訊飛開放平臺(tái).科大訊飛股份有限公司.2017.http:///.
查看更多《信息技術(shù)》雜志社信息請(qǐng)點(diǎn)擊: 《信息技術(shù)》編輯部
基金項(xiàng)目
(1)基于c++ builder的共焦顯微鏡三維重建方法 楊召雷 張運(yùn)波 董洪波
(4)m—link在通信系統(tǒng)仿真中的設(shè)計(jì)與實(shí)現(xiàn) 姚云龍 周俊 劉強(qiáng)
(8)基于嵌入式的無線煤炭自燃預(yù)警系統(tǒng) 劉德文 杜宇人
(11)tts語音單元的無損壓縮與按需解壓縮技術(shù) 卡斯木江·卡迪爾 古麗娜爾·艾力 艾斯卡爾·艾木都拉
無
(14)2012年中國國際信息通信展覽會(huì)開幕 無
基金項(xiàng)目
(15)低載荷工業(yè)機(jī)器人運(yùn)動(dòng)學(xué)分析與仿真 陳蓓玉 胡凱 楊樂
(19)基于zigbee無線傳感網(wǎng)絡(luò)監(jiān)測系統(tǒng)的實(shí)現(xiàn) 楊俊 阮超 陳睿瑤 付紅橋
(23)endnote x5軟件在論文撰寫過程中的應(yīng)用 程宏輝 程筱農(nóng) 奚和平 黃新
(26)一種近距離無線傳感器系統(tǒng)的設(shè)計(jì) 葉天鳳 胡長暉 葉夢君 萬里光
(29)sakai網(wǎng)絡(luò)教學(xué)平臺(tái)統(tǒng)一身份認(rèn)證中心的實(shí)現(xiàn) 柯水洲 馬雪梅 王新舸 鄒剛
(33)增益連續(xù)可調(diào)寬帶前置放大電路設(shè)計(jì)與實(shí)現(xiàn) 汪俊杰 蓋建新 劉旭 程爽
(37)actionscript3.0垃圾回收機(jī)制及優(yōu)化策略 李智勇
(40)基于彩信的遠(yuǎn)程控制寵物籠系統(tǒng)的研制 楊樂 高超
(42)spring mvc技術(shù)分析及在實(shí)踐教學(xué)系統(tǒng)中的應(yīng)用 符紅霞
(47)支持向量機(jī)在廣義預(yù)測控制中的應(yīng)用 張偉 賈蓉
(50)測控信息技術(shù)領(lǐng)域提高學(xué)生實(shí)踐創(chuàng)新能力的方法 王可寧 劉纏牢 王偉 張雄星
(53)一種復(fù)雜背景下車牌定位算法 趙大偉 陳剛
研究與探討
(58)基于spce061a的語音手動(dòng)雙控制開關(guān)的設(shè)計(jì) 李建新 張肖飛 徐麗妍
(62)基于bp神經(jīng)網(wǎng)絡(luò)的鉆井復(fù)雜情況和事故診斷 崔猛 汪海閣 李洪 紀(jì)國棟 于洋
無
(65)第九屆通信企業(yè)管理現(xiàn)代化創(chuàng)新成果審定會(huì)開幕 無
研究與探討
(66)一種基于單攝像頭的虛擬鍵盤 楊騁
(68)基于橢圓曲線的充值卡加密 孫傳亮 周海港
(72)基于ccd和光電編碼器的差速整定方法研究 李增彥 張迪洲 張男
(77)嵌入式軟件仿真測試平臺(tái)開發(fā) 林丹丹
(80)基于anybus-s pn io模塊的profinet遠(yuǎn)程i/o設(shè)計(jì) 楊明 王永剛 張陸毅
(85)采用mel倒譜參數(shù)的咳嗽聲識(shí)別方法 尹永 莫鴻強(qiáng)
(92)模板匹配算法的兩種實(shí)現(xiàn)方法比較 謝方方 楊文飛 陳靜 李芳 于越
(96)基于msp430的低頻信號(hào)分析儀設(shè)計(jì) 張君 李金龍 郭建強(qiáng) 楊林曉
(101)基于labview的雙向智能鑰匙充放電測試系統(tǒng) 尹武 張文娟 周繼宇
br> (104)多用途市電負(fù)載功率調(diào)功電路的設(shè)計(jì) 姚正武 部紹海 林濤 李樹偉
(107)gps周跳探測與修復(fù)方法的比較分析 徐歡 唐亮 都業(yè)濤
(112)并行計(jì)算技術(shù)綜述 王磊
(116)衛(wèi)星遠(yuǎn)程監(jiān)視及實(shí)時(shí)故障診斷研究與應(yīng)用 陳懷木 賈銀山 穆友勝
(121)基于soa的一體化繳費(fèi)接入管理平臺(tái)設(shè)計(jì) 王樹全 鄒寧峰 金鑫
(125)基于增量式pid控制算法的智能車設(shè)計(jì) 肖文健 李永科
應(yīng)用技術(shù)
(128)油層保護(hù)模糊專家系統(tǒng)的分析與設(shè)計(jì) 張丹 曹謝東 魏存擋 龐揚(yáng)
(131)基于multisim10低頻信號(hào)源的設(shè)計(jì)與仿真 蘭羽 周茜
(134)光電池基本特性的測定 趙楠 孫雪萍 李平舟
(137)基于單片機(jī)的無視頻報(bào)警監(jiān)測儀設(shè)計(jì) 李釗
(140)基于hfss的有孔屏蔽體的屏蔽效能分析 陳新平 楊顯清
(144)戰(zhàn)術(shù)無線電臺(tái)半實(shí)物仿真系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) 張愛民 辛廣輝 鄭振華
(147)基于混合高斯模型與核密度估計(jì)的目標(biāo)檢測 呂游 任政 李向陽 方向忠
(151)基于業(yè)務(wù)流程的信息化建設(shè)與應(yīng)用 劉光偉
(153)基于國產(chǎn)cpu的嵌入式醫(yī)療電子無線網(wǎng)絡(luò)設(shè)計(jì) 裴家俊 張輝 劉蕓 戎蒙恬
(157)利用vba及office自動(dòng)化技術(shù)輔助人事辦公 王晶
(159)數(shù)字鐘電路的設(shè)計(jì) 曹嘯敏
(163)基于電磁傳感器的智能車自主尋跡系統(tǒng)設(shè)計(jì) 師克 王洪軍 李永科
無
(166)上海市中國軟件名城創(chuàng)建暨軟件產(chǎn)業(yè)工作會(huì)召開 無
應(yīng)用技術(shù)
(167)異步時(shí)鐘亞穩(wěn)態(tài)仿真方法 高文輝 胥志毅 鄔天愷 劉文江 仲景尼
(170)lwip的移植及其在并行系統(tǒng)中的應(yīng)用 趙虎 黎英 游謙
(173)盲人行走輔助裝置中道路檢測算法的研究 徐姍姍 應(yīng)捷 宋彥斌
無
(176)尚冰出席第八屆中國信息無障礙論壇開幕式并致辭 無
應(yīng)用技術(shù)
(177)多載波傳輸系統(tǒng)的頻偏及采樣鐘聯(lián)合補(bǔ)償算法 李炎 周志平 李鑫
(181)智能小車模糊-pid控制調(diào)速系統(tǒng)設(shè)計(jì) 張家驊 徐連強(qiáng) 吳迎春
無
(183)第九屆海峽兩岸信息產(chǎn)業(yè)和技術(shù)標(biāo)準(zhǔn)論壇舉行 無
綜述與評(píng)論
(184)epc信息管理系統(tǒng)在裝備器材保障中的研究 康帥 高慶 程遠(yuǎn)增
(187)基于供應(yīng)鏈信息共享的備件資源整合研究 黃健 程中華 王亞彬
(190)航空航天偵察情報(bào)保障能力綜合評(píng)價(jià)模型研究 童濤 楊桄 譚海峰 王壽彪 葉怡
(194)裝備保障信息評(píng)價(jià)研究 趙國存 劉占嶺
無
(f0003)
關(guān)鍵詞:XML數(shù)據(jù);節(jié)點(diǎn)加權(quán);樹編輯距離;相似性
中圖分類號(hào):TP391.1
隨著網(wǎng)絡(luò)快速發(fā)展,由于結(jié)構(gòu)化的XML類型數(shù)據(jù)可擴(kuò)展且跨平臺(tái)而成為當(dāng)前網(wǎng)絡(luò)數(shù)據(jù)的主流形式。XML文檔的迅速增多并集成統(tǒng)一平臺(tái)后,會(huì)產(chǎn)生不被需要的“臟數(shù)據(jù)”,而對(duì)這些數(shù)據(jù)的清洗變的更加重要。這些“臟數(shù)據(jù)”使輕則會(huì)使獲得的信息不準(zhǔn)確,重則獲得完全錯(cuò)誤的信息。為了使XML數(shù)據(jù)源中的數(shù)據(jù)能發(fā)揮最正確的作用,清洗平臺(tái)中的“臟數(shù)據(jù)”成為一個(gè)組要解決的問題。
非一致性轉(zhuǎn)換、相似性判定、信息抽取等3方面是當(dāng)前XML數(shù)據(jù)清理的主要關(guān)注點(diǎn)。如韓愷等人提出的在上下文語義影響下的XML文檔的匹配方法[1],F(xiàn)lesca等人將結(jié)構(gòu)化的XML文檔與時(shí)間序列、脈沖等內(nèi)容聯(lián)系起來進(jìn)行相似性檢測[2]。以上兩篇文章關(guān)于XML數(shù)據(jù)清理方法考慮了不同DTD樹間的匹配算法,其中文檔內(nèi)容提到較少,部分方法設(shè)計(jì)思想很好,但實(shí)踐可行性有限。
首先,將一個(gè)XML文檔轉(zhuǎn)化為一棵樹或一個(gè)圖,然后通過度量這兩棵樹(圖)間的距離來體現(xiàn)XML文檔間的相似度。在眾多樹相似度匹配的研究工作中,普遍接收和采用的既是樹編輯距離算法[3-6]。Tai[3]最早將編輯距離的方法應(yīng)用到檢測兩顆樹間的相似性。以他的理論為基礎(chǔ),提出的一系列樹編輯距離算法及相關(guān)的改進(jìn)算法等。
1 相似重復(fù)記錄
信息集成中,數(shù)據(jù)清洗和提高數(shù)據(jù)質(zhì)量是檢測和消除集成數(shù)據(jù)中的相似重復(fù)記錄中最需要解決的問題之一。相似重復(fù)記錄的概念是指雖然在現(xiàn)實(shí)世界中表述的是同一個(gè)實(shí)體,但由于拼寫錯(cuò)誤或表達(dá)方式的不同,而導(dǎo)致數(shù)據(jù)庫管理系統(tǒng)不能將其識(shí)別為重復(fù)的記錄。這些重復(fù)記錄的產(chǎn)生導(dǎo)致決策者在最終決策時(shí)由于依據(jù)的信息不正確而產(chǎn)生較大的影響。以此為基礎(chǔ),重復(fù)記錄檢測在信息的抽取、轉(zhuǎn)換、加載的過程中顯得更加重要。目前研究的主要方向體現(xiàn)在西文、中文字符集的相似重復(fù)記錄的檢測,已有了一定研究。但對(duì)于半結(jié)構(gòu)化的XML數(shù)據(jù)的重復(fù)記錄檢測算法的研究還有待進(jìn)一步提高。
XML數(shù)據(jù)在網(wǎng)絡(luò)中使用的增多以及在數(shù)據(jù)庫中的使用,使得這種數(shù)據(jù)類型在數(shù)據(jù)清理中越來越重要。實(shí)際多種XML數(shù)據(jù)被認(rèn)為不一致,例如拼寫錯(cuò)誤等導(dǎo)致字符串屬性不一致,從而使得此字符串類型數(shù)據(jù)不一致。另外,實(shí)際相同的XML數(shù)據(jù)由于結(jié)構(gòu)上不同被認(rèn)為是不同的數(shù)據(jù)。即使數(shù)據(jù)源具有相同的DTD結(jié)構(gòu),屬性個(gè)數(shù)不同、屬性值拼寫不同均可導(dǎo)致XML數(shù)據(jù)不一致。
在XML數(shù)據(jù)的ETL中,主要摒棄其中的“臟數(shù)據(jù)”,也就是檢測出相似記錄合并,普遍采用的方式即將XML文檔轉(zhuǎn)換成樹結(jié)構(gòu),轉(zhuǎn)換的過程中要將樹中的節(jié)點(diǎn)與數(shù)據(jù)元素相對(duì)應(yīng),即節(jié)點(diǎn)名為元素標(biāo)簽名。編輯距離方法分為兩種,字符串編輯距離算法用判定兩個(gè)字符串是否相似,而通過樹編輯距離方法時(shí)大家更清晰的認(rèn)識(shí)到帶標(biāo)號(hào)有序樹間差異。以下給出與樹編輯距離相關(guān)的概念定義。
2.1 基本概念
目前對(duì)于數(shù)據(jù)相似性的檢測主要采用編輯距離的方式,而此方式又分為兩種,字符串編輯距離主要用于字符串領(lǐng)域,樹編輯距離主要應(yīng)用于兩棵樹或圖的差異檢測,以下給出具體概念描述。
(1)字符串編輯距離:定義字符串S1、S2,當(dāng)S1轉(zhuǎn)換為S2時(shí)所需要的編輯操作的最小數(shù)目,此轉(zhuǎn)換指單個(gè)字符上的轉(zhuǎn)換,而操作主要指插入、修改、刪除。此概念普遍應(yīng)用于字符串的相似性檢測。
(2)樹編輯距離:定義兩棵樹T1、T2,當(dāng)T1轉(zhuǎn)換到T2時(shí)所需要的書編輯操作的最小代價(jià),此轉(zhuǎn)換指節(jié)點(diǎn)的轉(zhuǎn)換。而節(jié)點(diǎn)的插入、刪除、修改三種操作稱為樹編輯操作:
1)修改(替換):節(jié)點(diǎn)改變;
2)刪除:刪除某一節(jié)點(diǎn)的同時(shí),將該節(jié)點(diǎn)的兒子節(jié)點(diǎn)重新定義為兄弟節(jié)點(diǎn)并插入到其父節(jié)點(diǎn)的子樹中;
3)插入:插入某一節(jié)點(diǎn)的子節(jié)點(diǎn),而該節(jié)點(diǎn)的原部分子節(jié)點(diǎn)轉(zhuǎn)換為新插入節(jié)點(diǎn)的子節(jié)點(diǎn)。
樹編輯距離體現(xiàn)了在兩個(gè)樹轉(zhuǎn)化的過程中樹編輯操作的最小次數(shù),而實(shí)際編輯操作次數(shù)計(jì)算方式可以通過映射這一概念來體現(xiàn),將整個(gè)求解過程解釋為樹之間的映射過程,稱為編輯映射。
(1)樹編輯距離算法:定義兩個(gè)樹T1和T2,在兩個(gè)樹之間建立一映射,直接體現(xiàn)了樹與樹節(jié)點(diǎn)間的對(duì)應(yīng)關(guān)系。在樹與樹之間建立映射需要滿足一系列的條件,首先給出兩組對(duì)應(yīng)關(guān)系屬于此映射,分別為(i1,j1),(i2,j2),其中1≤i、j的值≤樹的節(jié)點(diǎn)數(shù),則,當(dāng)且僅當(dāng)j1≤j2時(shí),i1≤i2;另外當(dāng)且僅當(dāng)節(jié)點(diǎn)j1是節(jié)點(diǎn)j2的祖先是,節(jié)點(diǎn)i1是節(jié)點(diǎn)i2的祖先,從而將樹編輯距離的計(jì)算轉(zhuǎn)換為映射的計(jì)算,在計(jì)算過程中,最好的結(jié)果即是所付的代價(jià)最小。
(2)樹編輯距離相似性檢測:XML類型數(shù)據(jù)相似性的檢測可以分兩步走,首先計(jì)算文檔轉(zhuǎn)換為樹結(jié)構(gòu)時(shí),數(shù)據(jù)所對(duì)應(yīng)的節(jié)點(diǎn)元素字符串間的差異,然后把字符串差異的計(jì)算合并到樹編輯距離的計(jì)算之中來。樹編輯距離的值越小,則兩顆XML樹越相似,此過程中給出閾值的概念作為評(píng)判的標(biāo)準(zhǔn),當(dāng)值小于設(shè)定的閾值時(shí),認(rèn)為兩個(gè)XML數(shù)據(jù)相同。
3 優(yōu)化的XML相似重復(fù)數(shù)據(jù)檢測算法
時(shí)間復(fù)雜度體現(xiàn)了完成操作所需要付出的代價(jià),而針對(duì)上述的樹編輯距離算法其時(shí)間復(fù)雜度跟樹的節(jié)點(diǎn)數(shù)以及樹的高度有直接的關(guān)系。因此,當(dāng)XML文檔的數(shù)據(jù)量足夠大的時(shí)候,計(jì)算代價(jià)會(huì)成倍增長,這在實(shí)踐過程中是無法忍受的,因此,必須采用優(yōu)化措施來減少樹編輯距離計(jì)算。本文優(yōu)化樹編輯距離算法,在整個(gè)過程中,首先通過樹節(jié)點(diǎn)的權(quán)值進(jìn)行第一次匹配,將相似性更大的數(shù)據(jù)聚集到一個(gè)集合中,在此集合中采用樹編輯距離方法進(jìn)一步匹配,從而減少時(shí)間復(fù)雜度。
3.1 帶權(quán)樹的生成
由于XML文檔可以轉(zhuǎn)化為多種樹表示形式,針對(duì)XML文檔通過SAX(Simple API for XML)解析器進(jìn)行解析,將XML文檔轉(zhuǎn)化為XML樹結(jié)構(gòu),并具有相應(yīng)的可行匹配方法。根據(jù)解決問題的側(cè)重點(diǎn)不同,XML帶權(quán)樹的屬性在XML文檔中具有不同的重要程度。通過XML帶權(quán)樹的權(quán)值的大小來表示屬性的重要性。根據(jù)權(quán)值本身的設(shè)置特點(diǎn),在帶權(quán)樹中,設(shè)置相同根節(jié)點(diǎn)的同一層次上的節(jié)點(diǎn)權(quán)值之和等于1。
3.2 相似性粗略匹配
針對(duì)完全展示XML文檔的信息的帶權(quán)樹,通過權(quán)值的不同體現(xiàn)每個(gè)元素重要程度的不同。通過權(quán)值進(jìn)行粗略匹配主要體現(xiàn)在XML樹的屬性相同時(shí),權(quán)值是否相同,權(quán)值差異越小,則判斷樹的相似性越高。在整個(gè)判斷的過程中,還需要考慮到屬性的多少,即樹分支數(shù)目。
通過實(shí)際情況分析推測出重復(fù)記錄相似度的計(jì)算方法如下:帶權(quán)樹Ta和Tb,N代表兩樹所有節(jié)點(diǎn)的個(gè)數(shù),a1 a2 … aN,b1 b2 …bN分別代表權(quán)值,其體現(xiàn)了屬性的重要程度。另外,當(dāng)某一屬性僅存在于一棵樹中時(shí),則設(shè)定此屬性的權(quán)值為0,相似度的計(jì)算公式見(1)[7]:
S(Ta,Tb)=(N-(a1-b1+a2-b2+ … +aN-bN))/N
=1-( (ai-bi))/N (1)
上述公式作為相似度計(jì)算的工具,可以很好的計(jì)算出任意XML帶權(quán)樹之間的相似性,通過具體的數(shù)據(jù)來體現(xiàn)差異的大小,從而進(jìn)行簡單的匹配,節(jié)省時(shí)間。
根據(jù)以上描述給出XML類型數(shù)據(jù)相似性檢測的偽代碼算法描述如下:
(1)將輸入的XML數(shù)據(jù)集轉(zhuǎn)換為XML帶權(quán)樹;
(2)通過節(jié)點(diǎn)權(quán)值來計(jì)算兩棵帶權(quán)樹間的相似度,從而粗略匹配數(shù)據(jù);
根據(jù)上述思想給出粗略匹配的偽代碼描述。
(a)從所有的XML樹中任取其中一棵樹;
(b)以所取樹為基準(zhǔn),通過相似性度量公式計(jì)算基樹與其它樹之間的相似度,目的為了得到所有的相似度值;
(c)將上述相似度值與系統(tǒng)輸入的相似度量λ進(jìn)行比較,若大于等于λ;
(d)將相似度值大于等于λ的XML樹聚合成新的集合C1;
(e)任取一不在集合C1中的帶權(quán)樹Tb;
(f)重復(fù)執(zhí)行步驟(b);
(g)直到所有的帶權(quán)樹均存在于一個(gè)集合中。
(3)在經(jīng)過第(2)步聚集的所有新集合中使用樹編輯距離算法,當(dāng)計(jì)算后的距離值小于給定的閾值δ時(shí),認(rèn)為兩個(gè)是相似的XML數(shù)據(jù)。
4 結(jié)束語
本文首先介紹了一系列概念定義,包括相似重復(fù)記錄,兩種編輯距離,并詳細(xì)描述了樹編輯距離相似性檢測算法及相關(guān)問題。在此基礎(chǔ)上,提出一種檢測XML數(shù)據(jù)相似性的方法,即將XML文檔轉(zhuǎn)換成樹結(jié)構(gòu)的基礎(chǔ)上,對(duì)樹結(jié)構(gòu)的節(jié)點(diǎn)加權(quán),并結(jié)合樹編輯距離算法。通過XML帶權(quán)樹各屬性權(quán)值計(jì)算的相似度對(duì)數(shù)據(jù)進(jìn)行粗略匹配與聚集,而在重新聚集的集合中使用樹編輯距離算法更直接的進(jìn)行相似性檢測。該方法可以大大減少不必要的樹編輯距離操作。
參考文獻(xiàn):
[1]韓愷,岳麗華等.基于上下文的異構(gòu)文檔類型定義匹配[J].小型微型計(jì)算機(jī)系統(tǒng),2005,26(02):256-260.
[2]Flesca S,Manco G,Masciari E et al. Detecting structural similarities between XML documents.In:Fernandez MF,Papakonstantinou Y,eds.Proc.of the Int’l Workshop on the Web and Databases(Web DB).2002:55-60.
[3]Tai K C.The tree-to-tree correction problem. Journal of the ACM, 1979,26(03):422-433.
[4]David T. Barnard,Gwen Clarke et al.Tree-to-tree Correction for Document Trees,1995.
[5]Zhang K,Shasha D.SIMPLE FAST ALGORITHMS FOR THE EDITING DISTANCE BETWEEN TREES AND RELATED PROBLEMS,1989,18(06):1245-1262.
[6]Zhang K.Algorithms for the constrained editing distance between ordered labeled trees and related problems,1995,28(03):463-474.
[7]江曼,陳繼明,潘金貴.基于XML的層次式過濾研究[A].2006年全國體育儀器器材與體育系統(tǒng)仿真學(xué)術(shù)報(bào)告會(huì)論文集[C].2006.
關(guān)鍵詞:偽二維隱馬爾科夫模型;符號(hào)識(shí)別;圖像匹配
中圖分類號(hào):TP312
目標(biāo)的檢測與識(shí)別主要應(yīng)用于智能交通領(lǐng)域,如飛機(jī)、艦船、車輛等目標(biāo)的檢測與識(shí)別跟蹤[1]。要實(shí)現(xiàn)圖像目標(biāo)的檢測與識(shí)別,一方面可以通過一些圖像處理的手段消除影響因素使其得到比較規(guī)范的數(shù)據(jù);另一方面就可以尋找目標(biāo)圖像上能夠保持恒定不變的某些特征參數(shù)來建立該類目標(biāo)的表述模型。建立了這樣的目標(biāo)影像的表述模型后就能實(shí)現(xiàn)影像目標(biāo)有效識(shí)別。第一種方法雖然是一個(gè)行之有效的方法,但是它需要一系列繁瑣的預(yù)處理,效率很低;本研究主要是考慮提取標(biāo)更一般化的不變量特征。
基于偽二維隱馬爾科夫模型(Pseudo Two-Dimensional Hidden Markov Model-P2DHMM)的識(shí)別方法[2],是基于P2DHMM模型的拓?fù)浣Y(jié)構(gòu)進(jìn)行圖像的匹配,計(jì)算得出P2DHMM距離,利用最近鄰原則判別,沒有固定的模板參量限制,因此P2DHMM在手跡識(shí)別、人臉識(shí)別和醫(yī)學(xué)圖像方面得到成功的應(yīng)用[3-4]。本研究將P2DHMM引入到圖像符號(hào)的識(shí)別中,工作重點(diǎn)放在三個(gè)方面:(1)研究圖像中基于P2DHMM目標(biāo)識(shí)別的二維非線性變形模型的適用性和潛在應(yīng)用價(jià)值;(2)實(shí)驗(yàn)?zāi)P偷耐負(fù)浣Y(jié)構(gòu)、主要參數(shù)和算法選擇;(3)建立典型參考圖像符號(hào)庫,進(jìn)行了圖像符號(hào)識(shí)別實(shí)驗(yàn)并分析結(jié)果,提出模型改進(jìn)的建議。
1 偽二維隱馬爾科夫結(jié)構(gòu)與特征參量構(gòu)建
1.1 隱馬爾科夫模型與偽二維隱馬爾科夫模型
隱馬爾科夫模型(HMM)是在馬爾科夫鏈的基礎(chǔ)上發(fā)展起來的,由于實(shí)際問題比馬爾科夫模型所描述的更為復(fù)雜,觀察到的事件并不是與狀態(tài)一一對(duì)應(yīng),而是通過一組概率分布相聯(lián)系,這樣的模型就稱為HMM。它是一個(gè)雙重隨機(jī)過程,其中之一是馬爾科夫鏈,這是基本隨機(jī)過程,它描述狀態(tài)的轉(zhuǎn)移;另一個(gè)隨機(jī)過程描述狀態(tài)和觀察值之間的統(tǒng)計(jì)對(duì)應(yīng)關(guān)系[5]。
二維隱馬爾科夫模型(2DHMM)是由HMM模型演變而來,它由水平方向HMM和垂直方向HMM構(gòu)成,水平HMM中的某一狀態(tài)不僅可以轉(zhuǎn)移到水平方向的其它狀態(tài),同時(shí)還可以躍遷到垂直方向HMM中的某一狀態(tài),同樣的垂直方向HMM中的狀態(tài)也可轉(zhuǎn)移到水平方向。由于二維HMM的結(jié)構(gòu)的復(fù)雜性,算法復(fù)雜,限制了2DHMM的應(yīng)用[6]。
偽二維隱馬爾科夫模型(P2DHMM)利用了一維HMM的基本拓?fù)浣Y(jié)構(gòu),將一個(gè)完整的一維HMM作為一個(gè)狀態(tài),形成P2DHMM的超狀態(tài),超狀態(tài)里面的一維HMM的狀態(tài)是子狀態(tài)。子狀態(tài)只能在相應(yīng)的狀態(tài)約束下進(jìn)行躍遷,超狀態(tài)與子狀態(tài)之間也不允許躍遷,但是在超狀態(tài)之間有狀態(tài)轉(zhuǎn)移。由于這一模型中不同超狀態(tài)下的子狀態(tài)之間不能夠躍遷,因而不是真正意義的二維模型,故也被稱為偽二維隱馬爾科夫模型,見圖1。每個(gè)超狀態(tài)為一個(gè)隱Markov模型單向左右型的拓?fù)浣Y(jié)構(gòu),超狀態(tài)間轉(zhuǎn)移的拓?fù)浣Y(jié)構(gòu)也為單向左右型。P2DHMM模型已被成功地應(yīng)用于字符識(shí)別、人臉識(shí)別等領(lǐng)域。
圖1 P2DHMM的拓?fù)浣Y(jié)構(gòu)圖
1.2 基于P2DHMM拓?fù)浣Y(jié)構(gòu)的圖像匹配
基于P2DHMM拓?fù)浣Y(jié)構(gòu)的圖像匹配,沒有進(jìn)行目標(biāo)的特征的提取直接用圖像的灰度值進(jìn)行匹配。
具體匹配算法如下所述:
假設(shè),測試目標(biāo)圖像用A=(aij)表示,其中每個(gè)像素的位置為(i,j),i=1,……,I,j=1,……J。
參考目標(biāo)圖像用B=(bxy)表示,其中每個(gè)像素的位置為:
X=1,……,X,y=1,……,Y。
基于P2DHMM拓?fù)浣Y(jié)構(gòu)的測試圖像和目標(biāo)圖像之間進(jìn)行匹配滿足的約束為:
x(1,j)=y(i,l)=1
x(N,j)=y(i,N)=N
0≤(xij-xi-1j)≤2
|xij-xij-1|=0
0≤(yij-yij-1)≤2 (1)
此約束忽略了相鄰的列的像素之間的依賴關(guān)系,相鄰列之間的垂直方向的相對(duì)置移被忽略,圖像間的映射為列到列的映射,映射關(guān)系滿足P2DHMM超狀態(tài)的轉(zhuǎn)移。每列內(nèi)的像素之間的映射也是滿足超狀態(tài)內(nèi)的子狀態(tài)之間的轉(zhuǎn)移。
超狀態(tài)之間的轉(zhuǎn)移是從左到右,子狀態(tài)之間的轉(zhuǎn)移是從下到上,躍遷都不超過2個(gè)像素寬。像素和其相鄰的像素之間的關(guān)系保持下來,參考圖像的二維變形圖像保持了原始圖像的結(jié)構(gòu)特征。
通過基于P2DHMM的拓?fù)浣Y(jié)構(gòu)對(duì)兩圖像進(jìn)行匹配,我們得到樣本B的變形的圖像B(xIJ11,yIJ11)。A,B圖像之間的距離,就轉(zhuǎn)化成A和B(xIJ11,yIJ11)之間的距離。
(2)
1.3 圖像水平方向約束的補(bǔ)償與構(gòu)建特征參量
P2DHMM不是真正的二維,放松了水平方向的約束,目前通常采用兩種方法對(duì)這種假設(shè)進(jìn)行補(bǔ)償[6-7]。第一種方法是對(duì)圖像進(jìn)行Sobel濾波(包括水平和垂直方向),得到圖像的梯度圖,在梯度圖的基礎(chǔ)上進(jìn)行識(shí)別。第二種方法是加入像素的上下文信息,比如采用3×3的區(qū)域的上下文信息。
若用U表示3×3的區(qū)域,A和 之間的距離用歐幾里的距離公式:
(3)
現(xiàn)在將這兩種方法結(jié)合,對(duì)梯度圖像進(jìn)行上下文信息的提取和重構(gòu)。
特征參量提取的步驟:
對(duì)圖像分別進(jìn)行垂直、水平方向的Sobel濾波,得到圖像的兩個(gè)梯度圖。
將兩個(gè)梯度圖上同坐標(biāo)的像素3×3的區(qū)域的9個(gè)像素的灰度值取出,得到每個(gè)像素的18維的矢量表示。
得到像素垂直方向提取結(jié)果3×3(V),水平方向提取結(jié)果3×3(H),將水平方向提取結(jié)果與垂直方向提取結(jié)果排列構(gòu)成18維的矢量表示。
2 技術(shù)路線與典型實(shí)驗(yàn)
2.1 技術(shù)路線
從一系列圖像中,選擇200種典型的圖像符號(hào)作為試驗(yàn)的參考樣本。對(duì)樣本進(jìn)行縮放、旋形成測試樣本。然后進(jìn)行P2DHMM匹配處理,處理技術(shù)路線見圖2:
圖2 P2DHMM匹配處理的流程圖
2.2 典型圖像符號(hào)P2DHMM匹配實(shí)驗(yàn)
圖3和圖4是同種圖像符號(hào)的識(shí)別效果圖。從左到右分別是測試圖像-1,變形圖像-2,變形網(wǎng)格-3,參考圖像-4。上層是垂直方向Sobel濾波的效果圖,下層是水平方向Sobel濾波的效果圖,每一次匹配結(jié)果可以得到一個(gè)P2DHMM距離值。其中,變形網(wǎng)格是參考圖像二維變形過程中,像素的坐標(biāo)位置的置移,變形圖像-2是參考圖像-4根據(jù)測試圖像得到的二維變形圖像。
如果背景相同、目標(biāo)相同,測試圖像-1和參考圖像-4相同,變形圖像-2就沒有變化,變形網(wǎng)格-3是直角網(wǎng)格,P2DHMM距離值為零。見圖5。
如果測試圖像和參考圖像是同種圖像符號(hào),發(fā)生了一定的縮放,計(jì)算得到兩圖像的P2DHMM距離值不為0,變形網(wǎng)格-3發(fā)生變化,P2DHMM距離值較小為6.79455。
如果測試圖像和參考圖像是不同種類型的圖像符號(hào),計(jì)算得到兩圖像的P2DHMM距離值不為0,變形網(wǎng)格-3發(fā)生變化,P2DHMM距離值較大為31.76735。
圖3 同一圖像符號(hào)的匹配效果圖
圖4 縮小圖像符號(hào)的匹配效果圖
圖5 不同圖像符號(hào)的匹配效果圖
我們利用圖2的技術(shù)路線開發(fā)了圖像符號(hào)識(shí)別原型系統(tǒng),取得了好的識(shí)別效果。為兩種圖像符號(hào)的識(shí)別效果圖。
圖像符號(hào)識(shí)別效果圖中。左上角為待識(shí)別圖像符號(hào),識(shí)別結(jié)果中列出了識(shí)別出的圖像符號(hào)。識(shí)別出的圖像符號(hào)按照P2DHMM距離值的大小從左到右排序,越靠左P2DHMM距離值越小,表示與待識(shí)別圖像符號(hào)越相似。
圖6 圖像符號(hào)識(shí)別效果圖
3 結(jié)束語
論文介紹了將人工智能領(lǐng)域的P2DHMM模型介紹引入到圖像目標(biāo)識(shí)別的模型構(gòu)建、算法選擇和典型實(shí)驗(yàn)的技術(shù)過程。利用基于P2DHMM的拓?fù)浣Y(jié)構(gòu)的約束進(jìn)行測試圖像和參考圖像的匹配,保持了參考圖像的結(jié)構(gòu)特征,得到更一般化的度量距離,采用了提取圖像的水平和垂直兩方向的兩幅梯度圖中像素周圍3×3 區(qū)域的像素信息表示像素值,得到像素的18維矢量表示,提高了的符號(hào)的識(shí)別率。
實(shí)驗(yàn)結(jié)果展示了P2DHMM模型在圖像符號(hào)識(shí)別方面的應(yīng)用潛在價(jià)值。另外,當(dāng)目標(biāo)背景發(fā)生變化的情況下,可以先做中值濾波處理,可以提高P2DHMM處理效果。
參考文獻(xiàn):
[1]馬建文,田國良,王長耀.遙感變化檢測技術(shù)綜述[J].地球科學(xué)進(jìn)展,2004(19):192-195.
[2]史忠植.高級(jí)人工智能[M].北京:科學(xué)出版社,1998.
[3]薛斌黨,歐宗瑛.加權(quán)合成的嵌入式隱Markov模型人臉識(shí)別[J].大連理工大學(xué)學(xué)報(bào),2002(05):32-33.
[4]張引,潘云鶴.工程圖紙自動(dòng)輸入字符識(shí)別的二維隱形馬爾可夫模型方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),1999(09).
[5]D.Keysers,C.Gollan,and H.Ney.Local Context in Non-linear Deformation Models for Handwritten Character Recognition[J].In ICPR 2004.International Conference on Pattern Recognition,2004.
[6]D.Keysers,C.Gollan,and H.Ney.Classification of Medical Images using Non-linear Distortion Models[J].In BVM 2004.Bildverarbeitung für die Medizin 2004,2004(03):366-370.
關(guān)鍵詞:危險(xiǎn)品;混沌理論;風(fēng)險(xiǎn)分析;路線選擇
中圖分類號(hào):F253.9 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1008-4428(2016)10-23 -03
一、引言
隨著社會(huì)經(jīng)濟(jì)的發(fā)展,危險(xiǎn)品運(yùn)輸已經(jīng)成為社會(huì)經(jīng)濟(jì)活動(dòng)中的一個(gè)重要組成部分。危險(xiǎn)品運(yùn)輸過程不僅是企業(yè)自身的生產(chǎn)運(yùn)作問題,而且影響到環(huán)境、工程、經(jīng)濟(jì)、社會(huì)以及政治等諸多方面,因此危險(xiǎn)品選線問題(即確定危險(xiǎn)品的運(yùn)輸路線)通常是一個(gè)雙目標(biāo)決策問題:政府管理部門追求的是盡可能減少公共風(fēng)險(xiǎn),而運(yùn)輸供應(yīng)商則關(guān)心如何降低運(yùn)輸成本。因此,危險(xiǎn)品運(yùn)輸選線問題成為企業(yè)、政府及國內(nèi)外學(xué)者高度關(guān)注的問題之一。
國內(nèi)已有關(guān)于危險(xiǎn)品選線問題的研究,可分為定性研究和定量研究兩類:定性研究多集中在建立優(yōu)化指標(biāo)體系并進(jìn)行綜合評(píng)價(jià)方面,而定量研究多集中于特定幾條線路的風(fēng)險(xiǎn)評(píng)價(jià)。任常興、吳宗之(2008)基于危險(xiǎn)品道路運(yùn)輸風(fēng)險(xiǎn)分析辨識(shí)最優(yōu)的運(yùn)輸路徑,以道路運(yùn)輸事故率、影響人數(shù)、影響人員風(fēng)險(xiǎn)、環(huán)境風(fēng)險(xiǎn)、運(yùn)輸距離和運(yùn)輸時(shí)間6個(gè)指標(biāo),確定具體起點(diǎn)-終點(diǎn)之間危險(xiǎn)品運(yùn)輸?shù)挠行窂剑捎脦繕?biāo)權(quán)重系數(shù)的Pareto-最優(yōu)路線算法尋找多個(gè)滿足要求的有效解;馬昌喜(2009)研究了不發(fā)達(dá)網(wǎng)絡(luò)環(huán)境下危險(xiǎn)品公路運(yùn)輸路徑?jīng)Q策問題,在構(gòu)建危險(xiǎn)品公路運(yùn)輸路徑?jīng)Q策指標(biāo)系統(tǒng)的基礎(chǔ)上,建立了危險(xiǎn)品路徑?jīng)Q策的BP神經(jīng)網(wǎng)絡(luò)模型;楊信豐,李引珍等(2012)為了增加城市危險(xiǎn)品運(yùn)輸路徑的實(shí)用性,對(duì)側(cè)重于多屬性時(shí)間依賴網(wǎng)絡(luò)的城市危險(xiǎn)品運(yùn)輸路徑優(yōu)化問題進(jìn)行了研究。項(xiàng)曙光、焦巍(2013)等提出了基于模糊HSE評(píng)價(jià)的多目標(biāo)反應(yīng)路徑綜合方法,全面考慮HSE因素,形成了HSE指標(biāo)結(jié)構(gòu),通過設(shè)定指標(biāo)的隸屬度函數(shù),建立模糊推理系統(tǒng),應(yīng)用層次分析法確定指標(biāo)的權(quán)重因子,形成模糊評(píng)價(jià)方法。馮艷紅、劉建芹、賀毅朝(2013)針對(duì)螢火蟲算法在全局尋優(yōu)搜索中收斂速度慢、求解精度低、易陷入局部極值區(qū)域等缺陷,提出一種基于混沌理論的動(dòng)態(tài)種群螢火蟲算法。
國外相關(guān)研究多集中于危險(xiǎn)品道路運(yùn)輸路徑優(yōu)化模型的建立及其算法研究。Erkut、Verter等(1998)從上世紀(jì)就開始從事危險(xiǎn)品道路運(yùn)輸風(fēng)險(xiǎn)定量分析的研究,認(rèn)為人口暴露聚集區(qū)是平面兩維結(jié)構(gòu)而不是平面中一點(diǎn);Serafini(2006)建立了危險(xiǎn)品路徑選擇問題的雙目標(biāo)模型,并擴(kuò)展了適用于較大網(wǎng)絡(luò)的動(dòng)態(tài)規(guī)劃模型。Martin(2009)認(rèn)為危險(xiǎn)品路徑的選擇很大程度上是根據(jù)各路段的風(fēng)險(xiǎn)來進(jìn)行的,只根據(jù)路段上的事故發(fā)生率來評(píng)價(jià)路線風(fēng)險(xiǎn)過于片面,因此在研究中引入了危險(xiǎn)品事故率、路段事故率和工作事故率三個(gè)指標(biāo)來評(píng)價(jià)風(fēng)險(xiǎn);Bhukya、Somayajulu(2011)將混沌理論運(yùn)用于DNA搜索多模式匹配算法,在初始條件產(chǎn)生及其細(xì)微的變化后,隨著時(shí)間的推移,最后的結(jié)果產(chǎn)生了巨大的差異,對(duì)多模式匹配算法的研究具有重要的借鑒意義。Abbas Mahmoudabadi等(2014)主要是運(yùn)用模糊理論,基于不同風(fēng)險(xiǎn)屬性的優(yōu)先級(jí)確定目標(biāo)函數(shù),建立危險(xiǎn)品路徑選擇模型。
綜上所述,已有研究大多基于靜態(tài)風(fēng)險(xiǎn)因素結(jié)合相關(guān)優(yōu)化理論與算法進(jìn)行研究,而對(duì)于動(dòng)態(tài)條件下運(yùn)輸路徑選擇研究較少。本文針對(duì)危險(xiǎn)品選線問題,將混沌理論運(yùn)用到其中,主要闡述三個(gè)主要部分:第一部分是基于混沌理論的道路交通事故動(dòng)態(tài)行為研究,時(shí)間限定在一個(gè)年度范圍內(nèi),根據(jù)危險(xiǎn)品在運(yùn)輸過程中的混沌特性,將危險(xiǎn)品運(yùn)輸過程中存在的風(fēng)險(xiǎn)分為事故、人口、環(huán)境和應(yīng)急設(shè)施四個(gè)因素。第二部分根據(jù)專家意見法(德爾菲法),收集行業(yè)內(nèi)專家對(duì)上述的風(fēng)險(xiǎn)因素的意見,并運(yùn)用三角模糊數(shù)法將它們轉(zhuǎn)換為確切的數(shù)值。第三部分是建立基于混沌理論的危險(xiǎn)品選線模型,并結(jié)合案例驗(yàn)證結(jié)果的正確性。本文創(chuàng)新之處是將混沌理論應(yīng)用于危險(xiǎn)品運(yùn)輸路徑選擇問題,同時(shí)結(jié)合了風(fēng)險(xiǎn)分析對(duì)各路段存在的風(fēng)險(xiǎn)因素進(jìn)行研究,建立成本和風(fēng)險(xiǎn)的多目標(biāo)模型,最后用一個(gè)算例驗(yàn)證結(jié)果的正確性。
二、混沌理論與交通流
美國氣象學(xué)家Edvard Lorenz在1963年提出了混沌理論的概念,一些在非線性系統(tǒng)中突然、戲劇性的變化可能會(huì)引起復(fù)雜的后果叫做混沌理論。如果一個(gè)非線性系統(tǒng)對(duì)初始條件表現(xiàn)出敏感的依賴,那么它就被認(rèn)為是混沌的,即初始條件出現(xiàn)很微小的差異,最終輸出結(jié)果則可能產(chǎn)生非常巨大的變化。混沌理論通常適用于短期預(yù)測,已被廣泛地應(yīng)用于多個(gè)科學(xué)領(lǐng)域,特別是在交通流理論方面。混沌理論是一種兼具質(zhì)性思考與量化分析的方法,用以探討動(dòng)態(tài)系統(tǒng)中無法用單一的數(shù)據(jù)關(guān)系,而必須用整體、連續(xù)的數(shù)據(jù)關(guān)系才能加以解釋及預(yù)測的行為。
交通流中存在混沌現(xiàn)象這一事實(shí)已經(jīng)被眾多學(xué)者的研究從多角度所證實(shí)。李洪萍、裴玉龍(2006)通過分析現(xiàn)有交通流預(yù)測方法,在此基礎(chǔ)上提出了一種基于混沌理論的交通流短時(shí)預(yù)測方法,利用基于小數(shù)據(jù)量的Wolf改進(jìn)算法計(jì)算了流率序列的最大Lyapunov指數(shù)。將基于Lyapunov指數(shù)的一維預(yù)測模式具體化,建立了交通流短時(shí)預(yù)測模型,并對(duì)模型進(jìn)行了改進(jìn),改進(jìn)后的預(yù)測結(jié)果具有較高的精度。
Lyapunov指數(shù)是衡量系統(tǒng)動(dòng)力學(xué)特性的一個(gè)重要定量指標(biāo),它表征了系統(tǒng)在向空間中相鄰軌道間收斂或發(fā)散的平均指數(shù)率。指數(shù)為正意味著在系統(tǒng)相空間中,無論初始兩條軌線的間距多么小,其差別都會(huì)隨著時(shí)間的演化而成指數(shù)率的增加以致達(dá)到無法預(yù)測。指數(shù)越大,說明混沌特性越明顯,混沌程度越高。公式(1)是用來確定Lyapunov指數(shù)的最大值λmax,
由于對(duì)交通行為的良好適應(yīng)性,Logistic映射被廣泛應(yīng)用于設(shè)定選線問題的風(fēng)險(xiǎn)因素,公式(2)為一般的Logistic映射公式,
三、 基于混沌理論的多目標(biāo)模型
根據(jù)已有的研究文獻(xiàn)可知,道路交通事故中存在顯著的混沌行為,將風(fēng)險(xiǎn)因素通過模糊語言變量轉(zhuǎn)換成確切值,結(jié)合道路網(wǎng)各條邊(分段路線)的事故率,把運(yùn)輸風(fēng)險(xiǎn)和運(yùn)輸時(shí)間的優(yōu)先順序組合作為目標(biāo)函數(shù)的衡量標(biāo)準(zhǔn),在迭代過程中更新風(fēng)險(xiǎn)因素,同時(shí)考慮不同風(fēng)險(xiǎn)和運(yùn)輸時(shí)間的優(yōu)先級(jí)。迭代次數(shù)取決于該時(shí)間段內(nèi)代表當(dāng)?shù)貙<乙庖姷膯柧碚{(diào)查結(jié)果。如果模糊語言變量是基于一年的基礎(chǔ)上,那么迭代次數(shù)應(yīng)設(shè)置為365。如果是基于半年的基礎(chǔ)上,迭代次數(shù)應(yīng)設(shè)置為180,讓所有的路徑運(yùn)行此過程并比較,列出出現(xiàn)最頻繁的路徑組合,即為在考慮風(fēng)險(xiǎn)和運(yùn)輸時(shí)間條件下危險(xiǎn)品運(yùn)輸?shù)淖罴崖窂健?/p>
假設(shè)所研究的道路網(wǎng)為由節(jié)點(diǎn)i,j的各條連線(i,j)所組成的圖形G,Ns為運(yùn)輸起點(diǎn)的集合,Nd為運(yùn)輸終點(diǎn)的集合,第一層次的目標(biāo)函數(shù)風(fēng)險(xiǎn)最小化如公式(3)所示:
式中Rsd表示從出發(fā)地s到目的地d的危險(xiǎn)品運(yùn)輸量,Wsd表示最頻繁路徑所有邊的初始運(yùn)輸風(fēng)險(xiǎn)和運(yùn)輸時(shí)間優(yōu)先級(jí)的總和,其中s、d分別屬于集合Ns、Nd。
式中Qs表示出發(fā)地s所供應(yīng)危險(xiǎn)品運(yùn)輸量的最大值,Qd表示目的地d所需求危險(xiǎn)品運(yùn)輸量的最小值。第二層次的目標(biāo)函數(shù)如公式(6)所示:
式中Ksd(t)表示經(jīng)過t次迭代后,所有邊的運(yùn)輸風(fēng)險(xiǎn)和運(yùn)輸時(shí)間加權(quán)后的總和,Pij(t)表示邊(i,j)的初始風(fēng)險(xiǎn),Pr表示其優(yōu)先級(jí),同理TTij表示邊(i,j)的初始運(yùn)輸時(shí)間,Pi表示其優(yōu)先級(jí),Pr+Pi=1意味著運(yùn)輸風(fēng)險(xiǎn)和運(yùn)輸時(shí)間的優(yōu)先級(jí)呈負(fù)相關(guān)。
經(jīng)過t次迭代后,若邊(i,j)在目標(biāo)函數(shù)被選中,則Xij(t)=1,否則為0。
式中SG(t)表示根據(jù)全道路網(wǎng)的事故得到的事故率,MQij(t)表示利用算法把模糊語言變量轉(zhuǎn)換而得到邊(i,j)的確切風(fēng)險(xiǎn)值。
公式(9)、(10)是一維Logistic映射公式,參數(shù)K1、K2根據(jù)均方誤差最小化準(zhǔn)則估算得到。
四、案例分析
以M省交通路網(wǎng)為例,每一個(gè)路段的風(fēng)險(xiǎn)因素評(píng)測主要從四個(gè)方面:事故、人口、環(huán)境和應(yīng)急設(shè)施。事故因素由當(dāng)?shù)貙<覍?duì)該路段上碰撞事故率的意見得到,人口風(fēng)險(xiǎn)對(duì)應(yīng)發(fā)生危險(xiǎn)品運(yùn)輸事故可能影響范圍的人口密度,環(huán)境風(fēng)險(xiǎn)是與影響周圍環(huán)境有關(guān)的風(fēng)險(xiǎn),比如危險(xiǎn)品泄漏后附近的河流、空氣等受污染程度,應(yīng)急設(shè)施風(fēng)險(xiǎn)則是關(guān)于路線上應(yīng)急設(shè)施的建設(shè)情況,如橋梁或隧道可能會(huì)對(duì)危險(xiǎn)品事故發(fā)生后的救援產(chǎn)生影響。由當(dāng)?shù)貙<医o出包含上述成分的語言變量,分為五個(gè)不同程度的級(jí)別:安全、中等安全、一般、中等風(fēng)險(xiǎn)和高風(fēng)險(xiǎn),并根據(jù)模糊層次分析法(FAHP)得出具體的風(fēng)險(xiǎn)值。
對(duì)于路網(wǎng)中的每一個(gè)邊,都包括事故、人口、環(huán)境和應(yīng)急設(shè)施四個(gè)風(fēng)險(xiǎn)因素,確定決策者將要使用的五個(gè)語言變量,根據(jù)三角模糊數(shù)(TFN)分配給每個(gè)變量的值如表1所示。
根據(jù)模糊層次分析法的理念,將風(fēng)險(xiǎn)因素作為運(yùn)輸過程中的決策指標(biāo),即事故(C1)、人口(C2)、環(huán)境(C3)、應(yīng)急設(shè)施(C4),五位專家作為決策者(P1,P2, …,P5)填寫調(diào)查問卷,每個(gè)語言變量的標(biāo)準(zhǔn)權(quán)重和由專家意見法得到每個(gè)標(biāo)準(zhǔn)的權(quán)重分別如表2、表3所示。
以M省道路網(wǎng)中一條邊為例,五位專家根據(jù)風(fēng)險(xiǎn)的四種因素語言變量提出自己的意見并打分,利用程度分析方法將每個(gè)風(fēng)險(xiǎn)的組成部分的三角模糊數(shù)計(jì)算加總,顯示在末行。利用重要標(biāo)準(zhǔn)的權(quán)重計(jì)算風(fēng)險(xiǎn)數(shù)值,得到最大和最小風(fēng)險(xiǎn)值分別為0.8376和0.3965,歸化到此邊的風(fēng)險(xiǎn)平均值為0.7680。
結(jié)果表明,在混沌模式風(fēng)險(xiǎn)條件下選擇長路徑和短路徑而得到最終結(jié)果之間具有明顯的差異。本文所提出的方法在較長路徑中比較短路徑中效果更加顯著,主要原因是較長線路的可選路段相對(duì)多,運(yùn)輸過程中不確定性更大。
五、總結(jié)
在本文的研究工作中,同時(shí)考慮到了運(yùn)輸風(fēng)險(xiǎn)和運(yùn)輸時(shí)間因素,其中風(fēng)險(xiǎn)由事故、人口、環(huán)境和應(yīng)急設(shè)施四部分組成。由于缺乏道路交通事故的數(shù)據(jù),運(yùn)用程度分析方法將語言變量轉(zhuǎn)換成對(duì)應(yīng)道路網(wǎng)的邊的確切風(fēng)險(xiǎn)值。對(duì)一個(gè)包括50個(gè)節(jié)點(diǎn)及若干個(gè)邊的省級(jí)道路網(wǎng)絡(luò)進(jìn)行分析研究,同時(shí)對(duì)實(shí)驗(yàn)數(shù)據(jù)中存在的混沌現(xiàn)象進(jìn)行了檢驗(yàn),驗(yàn)證了交通事故的混沌特征。然后運(yùn)用危險(xiǎn)品動(dòng)態(tài)變量和混沌理論的基本原理相結(jié)合,建立不同風(fēng)險(xiǎn)和時(shí)間優(yōu)先級(jí)的數(shù)學(xué)模型。根據(jù)一維Logistic映射方程,每迭代一次就更新動(dòng)態(tài)風(fēng)險(xiǎn)的優(yōu)先級(jí)。
建議以后研究危險(xiǎn)品選線及優(yōu)化問題時(shí),可以加上諸如天氣條件和交通狀況等更多因素進(jìn)一步深入研究,為決策者提供更加完備、合理的決策建議。
參考文獻(xiàn):
[1]馬昌喜.危險(xiǎn)品公路運(yùn)輸路徑?jīng)Q策方法研究[D].蘭州交通大學(xué), 2007.
[2]任常興,吳宗之,李晉.基于風(fēng)險(xiǎn)分析的危險(xiǎn)品道路運(yùn)輸多目標(biāo)Pareto最優(yōu)選線[J].中國安全生產(chǎn)科學(xué)技術(shù), 2008, 4(6): 9-13.
[3]馬昌喜.不發(fā)達(dá)網(wǎng)絡(luò)環(huán)境下基于神經(jīng)網(wǎng)絡(luò)的危險(xiǎn)品公路運(yùn)輸路徑?jīng)Q策[J].現(xiàn)代交通技術(shù), 2009, 6(1): 84-86.
[4]楊信豐,李引珍,何瑞春,馬昌喜.多屬性時(shí)間依賴網(wǎng)絡(luò)的城市危險(xiǎn)品運(yùn)輸路徑優(yōu)化[J].中國安全科學(xué)學(xué)報(bào), 2012, 22(9): 103-108.
[5]項(xiàng)曙光, 焦巍, 孫曉巖,等. 基于模糊HSE評(píng)價(jià)的多目標(biāo)反應(yīng)路徑綜合方法[J]. 化工學(xué)報(bào), 2013, 64(12):4330-4334.
[6]馮艷紅, 劉建芹, 賀毅朝. 基于混沌理論的動(dòng)態(tài)種群螢火蟲算法[J]. 計(jì)算機(jī)應(yīng)用, 2013, 33(3):796-799.
[7]Erkut E, Verter V. Modeling of transport risk for hazardous materials[J]. Operations Research, 1998, 46(3): 625-642.
[8]Bhukya R, Somayajulu D V L N. 2-Jump DNA Search Multiple Pattern Matching Algorithm[J]. International Journal of Computer Science Issues, 2011, 8(3).
[9]P. Serafini, Dynamic programming and minimum risk paths[J], European Journal of Operational Research, 2006, 175(8):224-237.
[10]Martin Trépanier, Marie-Hélène Leroux. Cross analysis of hazmat road accidents using multiple databases [J]. Accident Analysis Prevention, 2009, 41(3): 1192-1189.
[11]Abbas Mahmoudabadi, Seyed Mohammad Seyedhosseini. Developing a chaotic pattern of dynamic Hazmat routing problem [J]. IATSS Research, 2014, 37(7):110-118.
[12]Abbas Mahmoudabadi, Seyed Mohammad Seyedhosseini. Solving Hazmat Routing Problem in chaotic damage severity network under emergency environment[J]. Transport Policy, 2014, 36(5): 34-45.
[13]任常興,吳宗之.危險(xiǎn)品道路運(yùn)輸風(fēng)險(xiǎn)分級(jí)指數(shù)法研究[J].安全與環(huán)境學(xué)報(bào), 2006, 6(4): 126-129.
[14]G.L.L. Reniers, W. Dullaert. A method to assess multi-modal Hazmat transport security vulnerabilities:Hazmat transport SVA [J]. Transport Policy, 2013, 28(6): 103-113.
[15]李洪萍,裴玉龍.基于混沌理論的交通流短時(shí)預(yù)測模型[J].昆明理工大學(xué)學(xué)報(bào):理工版, 2006, 31(5):95-99.
[16]馮艷紅,劉建芹,賀毅朝.基于混沌理論的動(dòng)態(tài)種群螢火蟲算法[J].計(jì)算機(jī)應(yīng)用, 2013, 33(3): 796-799.
[17]呂品.基于改進(jìn)VRP模型的危險(xiǎn)品配送路徑優(yōu)化及其求解研究[J].中國安全生產(chǎn)科學(xué)技術(shù), 2011, 7(11): 87-91.
作者簡介:
關(guān)鍵詞:逆向工程;點(diǎn)云數(shù)據(jù)處理;CAD建模;汽車輪轂;實(shí)物模型數(shù)字化
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-2374(2011)36-0068-02
逆向工程是消化吸收并改進(jìn)先進(jìn)技術(shù)的一系列工作方法和技術(shù)的總和,它是以設(shè)計(jì)方法學(xué)為指導(dǎo),以現(xiàn)代設(shè)計(jì)理論方法技術(shù)為基礎(chǔ),運(yùn)用各種專業(yè)人員的工程設(shè)計(jì)經(jīng)驗(yàn),知識(shí)和創(chuàng)新思維,對(duì)已有新產(chǎn)品進(jìn)行解剖、深化和再創(chuàng)造,是已有設(shè)計(jì)的設(shè)計(jì)。逆向工程設(shè)計(jì)技術(shù)的應(yīng)用對(duì)提高我國工業(yè)產(chǎn)品設(shè)計(jì)水平,縮短設(shè)計(jì)周期,增強(qiáng)我國產(chǎn)品在國際市場上的競爭力有著重要的意義。
一、實(shí)物模型數(shù)字化
實(shí)物模型數(shù)字化是逆向工程中很關(guān)鍵的一步,數(shù)字化模型能否準(zhǔn)確反映實(shí)物模型的結(jié)構(gòu)特點(diǎn),直接影響后續(xù)的建模質(zhì)量。因此,本文引入了COMET測量系統(tǒng),COMET測量掃描系統(tǒng)是利用光柵投影法,通過非接觸方式獲得物體表面數(shù)字化點(diǎn)云數(shù)據(jù),是一個(gè)快速而高精度的測量和掃描設(shè)備,使用COMET測量系統(tǒng)測量零件表面,操作流程:表面著色處理D確定測量方法D啟動(dòng)軟硬件D調(diào)整測量角度和距離,并設(shè)置參數(shù)D掃描零件,獲取完整表面數(shù)據(jù)D數(shù)據(jù)輸出。
二、點(diǎn)云數(shù)據(jù)預(yù)處理
數(shù)字化階段獲得的點(diǎn)云數(shù)據(jù)應(yīng)當(dāng)經(jīng)過適當(dāng)?shù)奶幚砗蟛拍苡糜诤罄m(xù)的曲面建模。由于測量設(shè)備或是測量對(duì)象的原因,往往不能一次完成整個(gè)測量過程,需要將多個(gè)測量結(jié)果進(jìn)行拼接才可獲得實(shí)物的整個(gè)數(shù)字化模型。
首先,在逆向掃描過程中,分塊掃描得到的點(diǎn)云數(shù)據(jù)可看成一個(gè)具體本身固定坐標(biāo)系的實(shí)體。所以,逆向工程的點(diǎn)云數(shù)據(jù)對(duì)齊問題可以看作是不同三維實(shí)體的坐標(biāo)變換問題,即根據(jù)事先指定的最優(yōu)匹配算法,通過坐標(biāo)變換,將分塊掃描得到的點(diǎn)云進(jìn)行對(duì)齊。
其次,無論是使用接觸式測量還是非接觸式測量,在測量產(chǎn)品表面數(shù)據(jù)時(shí),都會(huì)引入數(shù)據(jù)誤差,尤其是有尖銳邊的產(chǎn)品邊界附近的測量數(shù)據(jù)。因此,在利用點(diǎn)云數(shù)據(jù)重構(gòu)模型前必須對(duì)點(diǎn)云進(jìn)行過濾。
數(shù)據(jù)精簡也是逆向工程中的關(guān)鍵技術(shù),伴隨非接觸式測量技術(shù)和測量設(shè)備的發(fā)展,我們可以很方便地獲得復(fù)雜形狀零件的表面數(shù)據(jù)。缺點(diǎn)是點(diǎn)云的數(shù)據(jù)量非常大,這就需要大量的存儲(chǔ)空間,同時(shí)在數(shù)據(jù)處理過程中,運(yùn)行速度很慢,降低工作效率。因此,有必要在保持一定精度的前提下對(duì)點(diǎn)云進(jìn)行精簡,去除大量多余的點(diǎn),只保留能夠反映曲面形狀的點(diǎn)即可,這即是點(diǎn)云精簡過程。
三、CAD模型
三維CAD模型的重構(gòu)是逆向工程的另一個(gè)核心和主要目的,是后續(xù)產(chǎn)品加工制造、快速成形、工程分析和產(chǎn)品再設(shè)計(jì)的基礎(chǔ)。三維CAD建模的理論,包括曲面建模方法、曲線和曲面的數(shù)學(xué)模型及擬合,應(yīng)用CATIA軟件是實(shí)現(xiàn)曲面重構(gòu)一個(gè)重要手段。
四、工程實(shí)例
當(dāng)前,我國汽車工業(yè)飛速發(fā)展,越來越多的新車型被引入國內(nèi)。同時(shí),國內(nèi)的汽車公司也在國外車型的基礎(chǔ)上大力自主研發(fā)設(shè)計(jì)新車型。因而,汽車的開發(fā)周期越來越短,汽車工業(yè)正逐漸由“大批量、單一車型”向“小批量,多種車型”制造模式轉(zhuǎn)變,在這種情況下,發(fā)展先進(jìn)的制造技術(shù),獲取或建立CAD模型具有重要的意義。
本文以研究汽車車輪轂蓋為例,將對(duì)某汽車車輪轂蓋進(jìn)行數(shù)據(jù)掃描,并通過逆向工程手段實(shí)現(xiàn)的原有產(chǎn)品的逆向建模,以方便進(jìn)一步的設(shè)計(jì)或模具制作,并可縮短其產(chǎn)品的開發(fā)周期。
(一)數(shù)據(jù)獲取
測量之前,首先應(yīng)檢測輪轂蓋表面是否光澤,由于我們所測量的輪轂蓋表面的顏色是深灰色,表面顏色太深,反光能力差,應(yīng)在其表面均勻地噴上白色反光噴劑,以便其有更好的反光效果。輪轂蓋曲面類型多,需多次測量,所以我們還需在被測物體的表面貼上參考點(diǎn),這樣拼合點(diǎn)云的時(shí)候,多次測量得到的不同的點(diǎn)云就可以根據(jù)參考點(diǎn)實(shí)現(xiàn)自動(dòng)拼合,將測量得到的數(shù)據(jù)以IGS格式輸入到CATIA軟件中。
(二)數(shù)據(jù)預(yù)處理
1.噪點(diǎn)刪除。由于掃描儀的誤差以及測量過程中人為誤差的存在,使得掃描最終得到的點(diǎn)云包含了大量的噪點(diǎn),其將會(huì)嚴(yán)重影響后續(xù)的反求建模,又因?yàn)橄到y(tǒng)無法精確識(shí)別誤差的存在,所以需手動(dòng)刪除。在CATIA中,利用“remove”工具進(jìn)行刪除,如圖1(a)所示。
2.點(diǎn)云精簡。點(diǎn)云在消除了噪聲點(diǎn)后,其中仍包含了大量的冗余點(diǎn),這些冗余點(diǎn)的存在不但增加了計(jì)算機(jī)的負(fù)荷,還影響數(shù)據(jù)處理和模型重建的速度,需在精度允許的范圍內(nèi)采用一定的算法對(duì)其進(jìn)行精簡。所以為了計(jì)算機(jī)運(yùn)算速度的提高,CATIA提供公差球和弦高差兩種點(diǎn)云數(shù)據(jù)精簡方式。在此因曲面曲率變化原因選用弦高差精簡方式,其結(jié)果如圖1(b)所示。精簡后,點(diǎn)云的信息如下:
Number of Data Points: 59997
Units:mm
Min X=239.9893 Max X=505.7328
Min Y=-180.0058 Max Y=97.2953
Min Z=172.3559 Max Z=833.7889
3.網(wǎng)格化。在經(jīng)過上述處理后便可以對(duì)其進(jìn)行三角網(wǎng)格化,以便對(duì)其曲率進(jìn)行分析,同時(shí)更好地觀察各種曲面的特征。
4.網(wǎng)格面曲率分析。點(diǎn)云分割是構(gòu)建曲線、曲面的基礎(chǔ),分塊方式直接影響后續(xù)的曲面構(gòu)造方式、曲面的拼接和縫合效果。數(shù)據(jù)分塊分的好,將使曲面的重構(gòu)變得簡單,可以得到高質(zhì)量的曲面。
(三)輪轂蓋CAD模型重構(gòu)
任何一個(gè)產(chǎn)品的模型建立之前,都必須有一定的基準(zhǔn),這樣才能建立產(chǎn)品準(zhǔn)確的拓?fù)潢P(guān)系,也才能準(zhǔn)確地進(jìn)行后續(xù)的加工。對(duì)于此輪轂蓋同樣為了反求建模的準(zhǔn)確性以及方便性,必須先建立其基準(zhǔn),即建立坐標(biāo)系,并使其一坐標(biāo)軸通過輪轂蓋的旋轉(zhuǎn)中心。
特征線的構(gòu)建是曲面重構(gòu)的基礎(chǔ),也是最為關(guān)鍵的環(huán)節(jié)。由前面分析可知,此輪轂蓋主要由兩個(gè)旋轉(zhuǎn)曲面以及若干相同的掃描曲面組成。對(duì)于旋轉(zhuǎn)曲面,只要重構(gòu)出它們的截面特征線即可。基本曲面重構(gòu)完成之后,只需對(duì)其進(jìn)行進(jìn)一步的處理操作,如加厚、圓角等。最終進(jìn)行表面質(zhì)量的檢查。最后完成整體模型,并對(duì)其進(jìn)行斑馬紋的檢查,如圖2所示,其質(zhì)量足以滿足操作者的要求。
五、結(jié)語
在產(chǎn)品開發(fā)的今天,建立產(chǎn)品的數(shù)字化模型是產(chǎn)品設(shè)計(jì)的中心內(nèi)容。在產(chǎn)品數(shù)字模型建立中,作為實(shí)現(xiàn)創(chuàng)新的手段,逆向工程技術(shù)的應(yīng)用越來越受到重視。本文的研究工作豐富了產(chǎn)品造型設(shè)計(jì)的理論和方法,將促進(jìn)逆向工程在產(chǎn)品設(shè)計(jì)中的應(yīng)用和推廣。
參考文獻(xiàn)
[1] 王霄.逆向工程技術(shù)及其應(yīng)用[M].北京:化學(xué)工業(yè)出版社,2004.
[2] 金濤,童水光.逆向工程技術(shù)[M].北京:機(jī)械工業(yè)出版社,2003.
[3] 許志龍.逆向工程中多視覺點(diǎn)云數(shù)據(jù)拼合技術(shù)[J].設(shè)計(jì)與研究,2006,(7).
[4] K H Lee H Woo,T Suk. Point Data Reduction Using 3D Grids[J].International Journal of Advanced Manufacturing Technology,2001,(18).