摘 要: 如何把分散的信息有效組織起來,實現(xiàn)跨部門,、跨地區(qū)的信息共享,,是金盾工程建設(shè)必須解決的一個關(guān)鍵問題。主要介紹如何圍繞“人,、地,、物、事件,、組織”治安信息五要素的業(yè)務(wù)模型,,利用Web Services、UDDI等技術(shù)創(chuàng)建智能搜索引擎,,實現(xiàn)全省范圍內(nèi)治安信息五要素關(guān)聯(lián)查詢及異構(gòu)系統(tǒng)間的全網(wǎng)漫游,。
關(guān)鍵詞: 治安信息五要素;關(guān)聯(lián)查詢,;異構(gòu)系統(tǒng),;數(shù)據(jù)漫游
近年來,公安信息系統(tǒng)從簡單的信息處理向以數(shù)據(jù)為中心的數(shù)據(jù)共享和關(guān)聯(lián)的復(fù)雜應(yīng)用轉(zhuǎn)變,,治安信息五要素智能搜索引擎就是采用先進(jìn)的計算機(jī)技術(shù)如Web Services,、SOAP、UDDI,、XML,、WSDL、分布式技術(shù)等構(gòu)建的應(yīng)用系統(tǒng),,旨在實現(xiàn)全省范圍內(nèi)人,、地、物,、組織,、事件的關(guān)聯(lián)查詢及異構(gòu)系統(tǒng)間的全網(wǎng)漫游;實現(xiàn)分布在全省不同地方的不同系統(tǒng)間或系統(tǒng)本身的五要素關(guān)聯(lián)查詢,,并能實現(xiàn)定義與發(fā)現(xiàn)異構(gòu)數(shù)據(jù)源,,能自定義搜索條件與搜索結(jié)果的展現(xiàn)方式,容易和其他系統(tǒng)對接,。治安信息智能搜索引擎的成功實施推動全省公安信息化的發(fā)展,。
1 治安信息五要素模型
1.1 五要素關(guān)系模型
隨著全國公安信息化建設(shè)的深入,國內(nèi)各級公安在實踐的基礎(chǔ)上,,總結(jié)出治安信息的五要素模型為[1]:人,、地,、物、組織,、事件,。人指自然人;地指地理位置,;物指生物或非生物,;組織是一種社會實體,它是人,、地,、物等要素之間的一種穩(wěn)態(tài)關(guān)系;事件是導(dǎo)致人,、地,、物、組織等要素關(guān)系發(fā)生變化的特殊要素,,即事件使各要素從一種相對穩(wěn)態(tài)關(guān)系轉(zhuǎn)變?yōu)榱硪环N相對穩(wěn)態(tài)關(guān)系,。事件是體現(xiàn)動態(tài)和關(guān)聯(lián)的重要環(huán)節(jié),只有處理好事件的表述方式,,才可以將五要素信息進(jìn)行有機(jī)的組織,,達(dá)到體現(xiàn)“動態(tài)全息”的目的。五要素關(guān)系模型見圖1,。
理想情況下,,同一實體在全省公安系統(tǒng)(甚至在全國公安系統(tǒng))中應(yīng)只有一個對應(yīng)要素,所有要素可以唯一標(biāo)識,,要素之間的各種聯(lián)系是有機(jī)和完整的。但在實際條件約束下,,由于種種原因?qū)е乱氐闹貜?fù)創(chuàng)建:公安不同的應(yīng)用系統(tǒng)可能對同一實體分別在本系統(tǒng)內(nèi)重復(fù)創(chuàng)建對應(yīng)要素,;以地市級為中心建立治安信息系統(tǒng)時,導(dǎo)致同一實體在不同城市系統(tǒng)內(nèi)創(chuàng)建對應(yīng)要素等,。所以,,為簡單起見,這里假定治安管理信息“五要素”業(yè)務(wù)模型為:地市內(nèi)各治安業(yè)務(wù)之間做到要素唯一創(chuàng)建,、唯一標(biāo)識,、末態(tài)屬性唯一、有機(jī)關(guān)聯(lián),;地市之間,,要素可以重復(fù)創(chuàng)建,通過唯一標(biāo)識彼此識別,,進(jìn)一步獲取要素的各方面信息,;提供與數(shù)據(jù)庫,、文件服務(wù)器間的交互支持,提供數(shù)據(jù)存儲與業(yè)務(wù)對象的映射,,通過“五要素”業(yè)務(wù)模型協(xié)助解決數(shù)據(jù)庫在性能與訪問平衡中的問題,,實現(xiàn)數(shù)據(jù)庫組織策略調(diào)整對業(yè)務(wù)系統(tǒng)的無關(guān)性。
1.2 五要素數(shù)據(jù)分布
目前全省范圍內(nèi)治安信息系統(tǒng)分布在省廳,、各地州,、各縣區(qū)和各派出所。有些系統(tǒng)是使用省中心庫,,如省級人口信息系統(tǒng),;有些是使用地市集中庫,如重點人口系統(tǒng),;有些是工作數(shù)據(jù)庫分布在派出所,,再將數(shù)據(jù)庫集中到區(qū)縣庫和地州庫,如現(xiàn)有的實有人口管理系統(tǒng),。五要素數(shù)據(jù)分布網(wǎng)絡(luò)結(jié)構(gòu)模型見圖2,。
從圖2可以看出,五要素數(shù)據(jù)可能分布在不同的地理位置和存儲于不同的系統(tǒng)中,,公安機(jī)關(guān)各職能部門通常都有自己的應(yīng)用系統(tǒng),,而且建設(shè)模式基本上覆蓋了省、地市,、區(qū)縣,、派出所四級應(yīng)用。智能搜索引擎就是要實現(xiàn)跨部門,、跨區(qū)域和異構(gòu)數(shù)據(jù)的漫游查詢,,以Web Service的方式為治安工作人員提供統(tǒng)一的操作界面,屏蔽平臺的差異性,。
2 治安信息五要素智能搜索引擎體系結(jié)構(gòu)
從上述模型來看,,如此龐大的治安管理信息系統(tǒng),各自的實現(xiàn)方式是不同的,,如何有效地控制調(diào)用這些不存在主從關(guān)系的子系統(tǒng),、事務(wù)和模塊,如何組織動態(tài)的鏈接,、模塊之間如何通信等,,是智能搜索引擎需解決的主要問題,因此提出如圖3所示的體系結(jié)構(gòu),。
整個搜索引擎分為3個層次:用戶層,、應(yīng)用層和數(shù)據(jù)層。其中,用戶層只和用戶交互,,不進(jìn)行任何業(yè)務(wù)處理,,實際上就是只有客戶端。應(yīng)用層包含系統(tǒng)中業(yè)務(wù)邏輯的實現(xiàn)和數(shù)據(jù)訪問控制,。應(yīng)用層由.net程序及XML Web Services 實現(xiàn),,并使用SOAP協(xié)議與客戶端連接。應(yīng)用層中的事務(wù)日志,、用戶狀態(tài)管理,、五要素數(shù)據(jù)源與數(shù)據(jù)表現(xiàn)定義、管理工具,、主搜索引擎,、五要素資源注冊中心等都在省中心應(yīng)用服務(wù)器上運行,搜索數(shù)據(jù)庫分布在省中心數(shù)據(jù)庫服務(wù)器上運行,。智能搜索引擎中,,應(yīng)用層的主要功能如下[2]。
(1)單點登錄和用戶狀態(tài)管理:用戶只需一次登錄系統(tǒng),,就能操作權(quán)限范圍內(nèi)的功能菜單,,并為每一個登錄的用戶保存狀態(tài)信息和記錄用戶的查詢操作信息。
(2)五要素數(shù)據(jù)源配置與數(shù)據(jù)表現(xiàn)自定義管理:對新接入的系統(tǒng)進(jìn)行數(shù)據(jù)源配置,,系統(tǒng)不用修改程序代碼便可掛接新系統(tǒng),,用戶可自定義查詢結(jié)果展現(xiàn)方式。
(3)分析處理器:接收并分析用戶的查詢請求,,訪問UDDI注冊中心,,調(diào)用搜索引擎,并返回數(shù)據(jù),。
(4)主搜索引擎:搜索任務(wù)分配的中心調(diào)度器,。系統(tǒng)從客戶端接收到查詢請求后,主搜索引擎便對查詢請求進(jìn)行分析,,把任務(wù)分發(fā)到對應(yīng)的子搜索引擎,,從子搜索引擎接收數(shù)據(jù),并返回客戶端數(shù)據(jù),。主搜索引擎與各子搜索引擎定時互發(fā)路由消息,以便主搜索引擎掌握各子搜索引擎的路由情況,。
(5)子搜索引擎:實現(xiàn)用戶定義系統(tǒng)的接入,,并把相關(guān)信息發(fā)送到中心;承擔(dān)主搜索引擎發(fā)送來的查詢?nèi)蝿?wù),,并返回主搜索引擎所需數(shù)據(jù),;定時發(fā)送路由信息給主搜索引擎,以便主搜索引擎掌握各子搜索引擎的路由情況。
(6)五要素同級分布搜索:對該子搜索引擎管轄范圍內(nèi)的同一地區(qū)級的數(shù)據(jù)庫進(jìn)行搜索,。
(7)系統(tǒng)間和子系統(tǒng)五要素關(guān)聯(lián)查詢:系統(tǒng)與系統(tǒng)間的關(guān)聯(lián)查詢,,統(tǒng)一系統(tǒng)內(nèi)五要素的關(guān)聯(lián)查詢,并返回數(shù)據(jù),。
(8)數(shù)據(jù)源適配器:調(diào)用與目標(biāo)數(shù)據(jù)庫對應(yīng)的驅(qū)動程序,,直接與數(shù)據(jù)庫打交道,向數(shù)據(jù)庫發(fā)送查詢命令,,并取得數(shù)據(jù)的模塊,。
(9)五要素漫游搜索:有異步返回數(shù)據(jù)功能,當(dāng)子搜索引擎接收到漫游查詢后,,啟動五要素漫游搜索線程,,在足夠多的時間內(nèi)搜索目標(biāo)數(shù)據(jù)庫,將搜索所得的數(shù)據(jù)放入漫游數(shù)據(jù)隊列,,并返回給主搜索引擎,。
(10)五要素資源注冊中心:對主搜索引擎注冊,使得主搜索引擎通過注冊中心被系統(tǒng)程序發(fā)現(xiàn)和調(diào)用,。
采用Web Services[3,4]技術(shù)將功能組件封裝成一個整體的服務(wù),,以UDDI的方式注冊發(fā)布。通過五要素引擎把所有的程序組織起來,,把物理位置分布不同,、運行環(huán)境不同、功能相對獨立的系統(tǒng)信息統(tǒng)一起來,,模塊之間的搭線連接由搜索引擎去實現(xiàn),;系統(tǒng)對用戶而言以瀏覽器為表現(xiàn)方式,網(wǎng)絡(luò)就是一個面向服務(wù)的大計算機(jī),,這就突破了傳統(tǒng)的分布式計算模型在通信,、應(yīng)用范圍等方面的限制。這就是五要素智能搜索引擎“無所不在的計算”的核心思想,。
3 智能搜索引擎關(guān)鍵技術(shù)介紹
3.1 分布式數(shù)據(jù)適配器
治安信息智能搜索引擎涉及的業(yè)務(wù)數(shù)據(jù)量大,,而且這些數(shù)據(jù)廣泛分布在不同的應(yīng)用系統(tǒng)中,每個系統(tǒng)采用的數(shù)據(jù)庫可能不相同,,要訪問這些數(shù)據(jù)庫,,不可能為每種數(shù)據(jù)庫分別編寫數(shù)據(jù)訪問代碼,而且搜索引擎有時需要同時訪問多種數(shù)據(jù)庫,。為此,,專門設(shè)計實現(xiàn)了一個數(shù)據(jù)適配器,用于訪問分布式的異構(gòu)數(shù)據(jù)庫[5],,其實現(xiàn)框架如圖4所示,。
分布式數(shù)據(jù)適配器綜合利用線程技術(shù),、Web Service技術(shù)和搜索引擎提供的統(tǒng)一數(shù)據(jù)訪問器和路由表服務(wù)實現(xiàn)五要素信息的漫游查詢。
3.2 系統(tǒng)之間接口標(biāo)準(zhǔn)和五要素元數(shù)據(jù)標(biāo)準(zhǔn)
系統(tǒng)把各種異構(gòu)數(shù)據(jù)按五要素模型標(biāo)準(zhǔn)建模,由各種異構(gòu)數(shù)據(jù)自身體現(xiàn)五要素的內(nèi)外聯(lián)系,使得搜索引擎以統(tǒng)一的接口處理各種異構(gòu)業(yè)務(wù)數(shù)據(jù),。首先,,將各種系統(tǒng)按五要素分類,并以某些關(guān)鍵字的組合關(guān)聯(lián)起來,;再次,,將系統(tǒng)中的各種表信息按五要素分類,并以系統(tǒng)內(nèi)部的某些關(guān)鍵字關(guān)聯(lián)起來,;最后,,用特定的標(biāo)準(zhǔn)描述各種系統(tǒng)需要表現(xiàn)的具體信息,并予以定義,。
3.3 分布式數(shù)據(jù)庫處理技術(shù)
搜索引擎提供通用數(shù)據(jù)訪問適配技術(shù)解決分布式異構(gòu)數(shù)據(jù)庫訪問難題,,本技術(shù)可以有效、安全地訪問部署在防火墻后的各種異構(gòu)數(shù)據(jù)庫,,并支持統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù)庫語言,,使系統(tǒng)在統(tǒng)一數(shù)據(jù)庫語言標(biāo)準(zhǔn)下,從而簡化了開發(fā)難度,。采用同步和異步Web Service提取數(shù)據(jù)的技術(shù)來實現(xiàn),。
3.4 搜索算法
搜索引擎算法主要有:關(guān)鍵字搜索、智能搜索路徑,、智能搜索深度優(yōu)化算法等,。關(guān)鍵字搜索就是利用系統(tǒng)間的關(guān)聯(lián)關(guān)鍵字對相關(guān)系統(tǒng)進(jìn)行分布式抓取數(shù)據(jù),并在主搜索引擎重組數(shù)據(jù)并表現(xiàn),;智能搜索路徑是基于系統(tǒng)之間的關(guān)聯(lián),,如常口系統(tǒng)與派出所綜合系統(tǒng)的關(guān)聯(lián),,派出所綜合系統(tǒng)與重點人口的關(guān)聯(lián)等,,也就是說可以形成很多關(guān)系鏈,而這些關(guān)系鏈也許是閉合的,,也許是開放的,,錯綜復(fù)雜,所以采用智能搜索路徑,,從主搜索系統(tǒng)開始,,排列不同的分支系統(tǒng),并按順序搜索數(shù)據(jù),;智能搜索深度優(yōu)化根據(jù)系統(tǒng)的多少和執(zhí)行快慢,,自由定義分支系統(tǒng)的搜索路徑深度,因為搜索引擎的搜索是按照一定的搜索路徑搜索的,。
3.5 治安五要素信息UDDI注冊中心
使用微軟的UDDI注冊中心作為治安五要素信息注冊中心來公布主搜索引擎服務(wù)接口,。通過該接口,其他系統(tǒng)認(rèn)證后可以發(fā)現(xiàn)并使用搜索引擎的服務(wù)并得到所需要的信息,。
鑒于全省治安信息數(shù)據(jù)的分布特性和各系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)的不統(tǒng)一性,,本文分析了五要素數(shù)據(jù)模型和元數(shù)據(jù)標(biāo)準(zhǔn),提出基于Web Service技術(shù)的治安信息五要素智能搜索引擎體系結(jié)構(gòu),,并利用線程,、UDDI、SOAP等技術(shù)實現(xiàn)五要素信息的關(guān)聯(lián)查詢和漫游查詢,,實現(xiàn)全省范圍內(nèi)治安信息的“一站式”搜索,。智能搜索引擎的設(shè)計和實現(xiàn)充分考慮系統(tǒng)的靈活性,把業(yè)務(wù)組件封裝成Web Service與可重用性構(gòu)件,,這樣系統(tǒng)具有易擴(kuò)展性,。目前系統(tǒng)已投入運行,并取得了一定的成效,。但怎樣定義元數(shù)據(jù)標(biāo)準(zhǔn)才能使查詢更有效還有待進(jìn)一步研究,,對多線程的管理控制也有待改進(jìn)。由于是基于Web Service技術(shù)實現(xiàn)的,,如果把SOAP的思想用到設(shè)計中,,系統(tǒng)是否更健壯等是下一步工作的內(nèi)容。
參考文獻(xiàn)
[1] 云南省公安廳.五要素引擎可行性研究報告[R].昆明:2003.
[2] 昆明世科網(wǎng)絡(luò)技術(shù)有限公司.五要素系統(tǒng)需求分析[R].昆明:2004.
[3] PAPAZOGLOU M.Web Services:principles and technology[M].Prentice Hall, 1 editon(September 23,2007).
[4] HONZLER S.XML完全探索[M].陶陽,,嵩敬波,,王鋒,譯.北京:中國青年出版社,,2000.
[5] COYLE F P.XML,、WEB服務(wù)和數(shù)據(jù)革命[M].袁勤勇,吳青,,譯.北京:清華大學(xué)出版社,,2003.