設(shè)計(jì)并實(shí)現(xiàn)了具有數(shù)據(jù)錄入、數(shù)據(jù)服務(wù)、數(shù)據(jù)輸出功能的族譜信息系統(tǒng)。 族譜信息系統(tǒng)采用了分布式結(jié)構(gòu),在每個(gè)分布數(shù)據(jù)節(jié)點(diǎn)引入內(nèi)存信息管理技術(shù),采用列存儲(chǔ)模型,自動(dòng)初始化熱點(diǎn)數(shù)據(jù),并根據(jù)用戶請(qǐng)求組織數(shù)據(jù)建立索引,同時(shí)利用事務(wù)日志對(duì)每個(gè)分布數(shù)據(jù)節(jié)點(diǎn)的內(nèi)外存進(jìn)行數(shù)據(jù)同步,對(duì)中心數(shù)據(jù)節(jié)點(diǎn)和分布數(shù)據(jù)節(jié)點(diǎn)進(jìn)行數(shù)據(jù)同步。
0引言
傳統(tǒng)的譜書式族譜在信息交互和共享方面存在著先天不足,且實(shí)體的譜書不便于后續(xù)的修改(續(xù)修)以及保存。 因此,近年來族譜數(shù)字化受到了社會(huì)的廣泛關(guān)注。
數(shù)字化族譜系統(tǒng)除了能提供給用戶錄入族譜信息、利用族譜信息的功能之外,還需要兼顧中國式族譜的特殊需求——譜書。 家族在編修族譜時(shí),通常都需要以采集好的族譜數(shù)據(jù)為基礎(chǔ),通過編輯、排版形成內(nèi)容豐富、圖文并茂、樣式美觀的譜書,然后將其印刷成冊(cè)并分發(fā)給族人。 目前,國內(nèi)外在數(shù)字化族譜系統(tǒng)方面已有一些研究和開發(fā)工作。 著名的族譜網(wǎng)站FamilySearch[2]中,用戶可以方便地創(chuàng)建和管理個(gè)性化族譜空間,但沒有提供族譜數(shù)據(jù)紙質(zhì)化輸出功能。 文獻(xiàn)[34]都實(shí)現(xiàn)了基于單機(jī)形式的族譜錄入軟件:將族譜的制作工作分割成多個(gè)任務(wù),由多位制作人員分別完成這些任務(wù)并以文件存儲(chǔ)任務(wù)中的族譜數(shù)據(jù),最后將多個(gè)數(shù)據(jù)文件合并,編輯形成最終的族譜。 但是這種數(shù)據(jù)管理方式不利于信息的共享,而且多個(gè)數(shù)據(jù)文件之前存在較多的冗余以及沖突,無法自動(dòng)完成數(shù)據(jù)文件合并。 為了加快族譜數(shù)字化進(jìn)程,結(jié)合實(shí)際的應(yīng)用需求,本文設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于B/S架構(gòu)的族譜信息系統(tǒng),該系統(tǒng)提供了族譜數(shù)據(jù)的錄入、查詢服務(wù)、紙質(zhì)化輸出等功能。 結(jié)合族譜信息系統(tǒng)中的實(shí)際需求,本系統(tǒng)的數(shù)據(jù)存儲(chǔ)采用了分布式結(jié)構(gòu)和內(nèi)存數(shù)據(jù)管理技術(shù),大大加快了族譜信息錄入和檢索的速度。
本文內(nèi)容組織如下:第1節(jié)介紹族譜信息數(shù)據(jù)的特點(diǎn);第2節(jié)介紹系統(tǒng)功能,并分析引入內(nèi)存數(shù)據(jù)管理技術(shù)的必要性;第3節(jié)將簡單介紹本系統(tǒng)中所涉及的相關(guān)內(nèi)存數(shù)據(jù)管理技術(shù);第4節(jié)介紹內(nèi)存數(shù)據(jù)管理技術(shù)在族譜信息系統(tǒng)中的具體應(yīng)用;第5節(jié)對(duì)本文工作進(jìn)行總結(jié)并對(duì)未來工作進(jìn)行展望。
第5期張文杰,等:內(nèi)存數(shù)據(jù)管理技術(shù)在族譜信息系統(tǒng)中的應(yīng)用華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2014年1族譜數(shù)據(jù)簡介
族譜數(shù)據(jù)通常由三部分構(gòu)成:世系數(shù)據(jù)、文檔數(shù)據(jù)以及多媒體數(shù)據(jù)。
(1) 世系數(shù)據(jù)包括人物數(shù)據(jù)和人物之間的親緣關(guān)系數(shù)據(jù)。 其中親緣關(guān)系主要分為父子(父女)、母子(母女)、配偶、過繼(從親屬中收養(yǎng)子女)、兼祧(一位男子同時(shí)繼承多家)。 世系數(shù)據(jù)是族譜數(shù)據(jù)中最重要的部分。 (2) 文檔數(shù)據(jù)包括在族譜中家族大事件的文字記錄和重要的人物傳記,族譜中的文檔數(shù)據(jù)除文本之外還包含圖表等,呈現(xiàn)一種圖文并茂的形式。
(3) 多媒體數(shù)據(jù)包括族譜中記錄人物或者家族大事件的圖像、音頻、視頻,這里的多媒體數(shù)據(jù)并不包括文檔數(shù)據(jù)中含有的圖表。
族譜數(shù)據(jù)中的文檔數(shù)據(jù)、多媒體數(shù)據(jù)和一般的文檔數(shù)據(jù)、多媒體數(shù)據(jù)在組織和存儲(chǔ)形式上并無明顯區(qū)別,而世系數(shù)據(jù)作為族譜數(shù)據(jù)中的核心數(shù)據(jù),其特點(diǎn)鮮明。
如果把世系數(shù)據(jù)中每個(gè)人物作為節(jié)點(diǎn),人物之間的關(guān)系作為邊,則世系數(shù)據(jù)就構(gòu)成了一種類似樹的結(jié)構(gòu),下文中也把這種結(jié)構(gòu)稱為世系樹,如圖1所示。
如果考慮更廣泛的親緣關(guān)系(如聯(lián)姻),很多世系數(shù)據(jù)就會(huì)聯(lián)系在一起構(gòu)成類似森林的結(jié)構(gòu),這和社會(huì)網(wǎng)絡(luò)[5]數(shù)據(jù)非常相似。 但是世系數(shù)據(jù)比社會(huì)網(wǎng)絡(luò)數(shù)據(jù)所表達(dá)的人物群體更加特定,人物之間的關(guān)系更加明確。
總結(jié)起來,世系數(shù)據(jù)具有以下特點(diǎn):
(1) 表達(dá)對(duì)象是特定的人物“群體”——家族(或者支系),人物關(guān)系是親緣關(guān)系,相比其他人際關(guān)系要更加緊密和牢固。
(2) 如果把人物視作節(jié)點(diǎn),把人物之間的關(guān)系視作邊,世系數(shù)據(jù)構(gòu)成了一種特殊的層次結(jié)構(gòu)—世系樹。
(3) 如果把多個(gè)世系樹用聯(lián)姻關(guān)系聯(lián)系在一起,會(huì)構(gòu)成一種特殊的圖結(jié)構(gòu),類似于森林和社會(huì)化網(wǎng)絡(luò)數(shù)據(jù)。
圖1世系樹示例圖
Fig。1The tree structure of genealogy data

2族譜信息系統(tǒng)
傳統(tǒng)族譜信息系統(tǒng)采用的是單機(jī)管理不易于擴(kuò)展功能,數(shù)據(jù)分散且有大量冗余,無法利用這些族譜數(shù)據(jù)向公眾用戶提供服務(wù)。 為了更好地收集和利用族譜數(shù)據(jù),我們?cè)O(shè)計(jì)并開發(fā)了一款基于B/S架構(gòu)的族譜信息系統(tǒng)。 該系統(tǒng)支持多用戶并行錄入同一族譜中的數(shù)據(jù),并統(tǒng)一對(duì)族譜數(shù)據(jù)進(jìn)行管理,同時(shí)通過本系統(tǒng)還可向公眾用戶提供對(duì)已錄入族譜數(shù)據(jù)的檢索。
族譜信息系統(tǒng)的主要功能包括數(shù)據(jù)錄入、數(shù)據(jù)服務(wù)和數(shù)據(jù)輸出。
2。1數(shù)據(jù)錄入
數(shù)據(jù)錄入功能主要包括三部分:世系數(shù)據(jù)錄入、文檔數(shù)據(jù)錄入、多媒體數(shù)據(jù)錄入。 其中世系數(shù)據(jù)錄入是指錄入人物的基本數(shù)據(jù)以及錄入人物之間的聯(lián)系數(shù)據(jù)。
2。2數(shù)據(jù)服務(wù)
數(shù)據(jù)服務(wù)功能主要包括數(shù)據(jù)展示、統(tǒng)計(jì)檢索、一鍵尋祖和一鍵尋親。
(1) 數(shù)據(jù)展示
數(shù)據(jù)展示功能包括族譜展示和對(duì)照預(yù)覽。 族譜展示功能主要顯示一個(gè)族譜的基本信息。 對(duì)照預(yù)覽則用于在正式輸出紙質(zhì)化族譜之前以各種不同的樣式來預(yù)覽輸出的效果。
(2) 統(tǒng)計(jì)檢索
統(tǒng)計(jì)檢索提供了對(duì)系統(tǒng)中的族譜數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和檢索的功能。 族譜統(tǒng)計(jì)是顯示整個(gè)族譜的統(tǒng)計(jì)信息,如總?cè)藬?shù)、男女比例、生死狀況等。 簡單檢索和組合檢索是在某些族譜屬性或者人物屬性上進(jìn)行檢索的功能。
(3) 一鍵尋祖和一鍵尋親
一鍵尋祖可以從族譜中根據(jù)人物之間的親緣關(guān)系得到指定人物在指定范圍內(nèi)(比如限定世代數(shù))的祖先。 一鍵尋親則是指在族譜數(shù)據(jù)中找到兩個(gè)指定人物之間的親緣關(guān)系鏈(即兩人是通過哪些人關(guān)聯(lián)在一起)。
2。3數(shù)據(jù)輸出
為了滿足用戶傳統(tǒng)紙質(zhì)譜書的需求,族譜信息系統(tǒng)中提供了數(shù)據(jù)輸出功能,主要包括族譜編排、族譜生成。
(1)族譜編排
譜志編排功能是通過用戶的個(gè)性化需求對(duì)譜書的樣式、數(shù)據(jù)出現(xiàn)的順序、名詞的表達(dá)方式等進(jìn)行設(shè)置。
(2) 族譜生成
族譜生成功能主要是在族譜編排過后,按照用戶的個(gè)性化需求從原始族譜數(shù)據(jù)中轉(zhuǎn)換生成電子版的譜書以供印刷。
2。4應(yīng)用內(nèi)存數(shù)據(jù)管理技術(shù)的必要性
通過對(duì)族譜信息系統(tǒng)的功能分析,族譜信息系統(tǒng)具有以下特點(diǎn)。
(1)數(shù)據(jù)源單一。 在數(shù)據(jù)錄入過程中,對(duì)每個(gè)錄入用戶來說,只能操作自己參與錄入的族譜數(shù)據(jù)。 同時(shí),數(shù)據(jù)輸出過程中,只需要去訪問要生成電子族譜的特定族譜的數(shù)據(jù)。
(2)數(shù)據(jù)量較大。 每個(gè)族譜都存有數(shù)量和容量龐大的世系數(shù)據(jù)、文檔數(shù)據(jù)、多媒體數(shù)據(jù)。
(3)實(shí)時(shí)性要求高。 由于本系統(tǒng)基于B/S模式設(shè)計(jì),無論是數(shù)據(jù)錄入、數(shù)據(jù)服務(wù)還是數(shù)據(jù)輸出功能,系統(tǒng)響應(yīng)時(shí)間都應(yīng)該很短。
族譜信息系統(tǒng)的大數(shù)據(jù)量和高實(shí)時(shí)性的特點(diǎn)對(duì)系統(tǒng)實(shí)現(xiàn)提出了挑戰(zhàn)。 而隨著主存的成本顯著降低,許多成熟的內(nèi)存數(shù)據(jù)管理技術(shù)為族譜信息系統(tǒng)的實(shí)現(xiàn)提供了解決方案[6]。
本文來源:http://www.nvnqwx.com/shiyongwen/2049649.htm