設計并實現了具有數據錄入、數據服務、數據輸出功能的族譜信息系統。 族譜信息系統采用了分布式結構,在每個分布數據節點引入內存信息管理技術,采用列存儲模型,自動初始化熱點數據,并根據用戶請求組織數據建立索引,同時利用事務日志對每個分布數據節點的內外存進行數據同步,對中心數據節點和分布數據節點進行數據同步。
0引言
傳統的譜書式族譜在信息交互和共享方面存在著先天不足,且實體的譜書不便于后續的修改(續修)以及保存。 因此,近年來族譜數字化受到了社會的廣泛關注。
數字化族譜系統除了能提供給用戶錄入族譜信息、利用族譜信息的功能之外,還需要兼顧中國式族譜的特殊需求——譜書。 家族在編修族譜時,通常都需要以采集好的族譜數據為基礎,通過編輯、排版形成內容豐富、圖文并茂、樣式美觀的譜書,然后將其印刷成冊并分發給族人。 目前,國內外在數字化族譜系統方面已有一些研究和開發工作。 著名的族譜網站FamilySearch[2]中,用戶可以方便地創建和管理個性化族譜空間,但沒有提供族譜數據紙質化輸出功能。 文獻[34]都實現了基于單機形式的族譜錄入軟件:將族譜的制作工作分割成多個任務,由多位制作人員分別完成這些任務并以文件存儲任務中的族譜數據,最后將多個數據文件合并,編輯形成最終的族譜。 但是這種數據管理方式不利于信息的共享,而且多個數據文件之前存在較多的冗余以及沖突,無法自動完成數據文件合并。 為了加快族譜數字化進程,結合實際的應用需求,本文設計并實現了一個基于B/S架構的族譜信息系統,該系統提供了族譜數據的錄入、查詢服務、紙質化輸出等功能。 結合族譜信息系統中的實際需求,本系統的數據存儲采用了分布式結構和內存數據管理技術,大大加快了族譜信息錄入和檢索的速度。
本文內容組織如下:第1節介紹族譜信息數據的特點;第2節介紹系統功能,并分析引入內存數據管理技術的必要性;第3節將簡單介紹本系統中所涉及的相關內存數據管理技術;第4節介紹內存數據管理技術在族譜信息系統中的具體應用;第5節對本文工作進行總結并對未來工作進行展望。
第5期張文杰,等:內存數據管理技術在族譜信息系統中的應用華東師范大學學報(自然科學版)2014年1族譜數據簡介
族譜數據通常由三部分構成:世系數據、文檔數據以及多媒體數據。
(1) 世系數據包括人物數據和人物之間的親緣關系數據。 其中親緣關系主要分為父子(父女)、母子(母女)、配偶、過繼(從親屬中收養子女)、兼祧(一位男子同時繼承多家)。 世系數據是族譜數據中最重要的部分。 (2) 文檔數據包括在族譜中家族大事件的文字記錄和重要的人物傳記,族譜中的文檔數據除文本之外還包含圖表等,呈現一種圖文并茂的形式。
(3) 多媒體數據包括族譜中記錄人物或者家族大事件的圖像、音頻、視頻,這里的多媒體數據并不包括文檔數據中含有的圖表。
族譜數據中的文檔數據、多媒體數據和一般的文檔數據、多媒體數據在組織和存儲形式上并無明顯區別,而世系數據作為族譜數據中的核心數據,其特點鮮明。
如果把世系數據中每個人物作為節點,人物之間的關系作為邊,則世系數據就構成了一種類似樹的結構,下文中也把這種結構稱為世系樹,如圖1所示。
如果考慮更廣泛的親緣關系(如聯姻),很多世系數據就會聯系在一起構成類似森林的結構,這和社會網絡[5]數據非常相似。 但是世系數據比社會網絡數據所表達的人物群體更加特定,人物之間的關系更加明確。
總結起來,世系數據具有以下特點:
(1) 表達對象是特定的人物“群體”——家族(或者支系),人物關系是親緣關系,相比其他人際關系要更加緊密和牢固。
(2) 如果把人物視作節點,把人物之間的關系視作邊,世系數據構成了一種特殊的層次結構—世系樹。
(3) 如果把多個世系樹用聯姻關系聯系在一起,會構成一種特殊的圖結構,類似于森林和社會化網絡數據。
圖1世系樹示例圖
Fig。1The tree structure of genealogy data

2族譜信息系統
傳統族譜信息系統采用的是單機管理不易于擴展功能,數據分散且有大量冗余,無法利用這些族譜數據向公眾用戶提供服務。 為了更好地收集和利用族譜數據,我們設計并開發了一款基于B/S架構的族譜信息系統。 該系統支持多用戶并行錄入同一族譜中的數據,并統一對族譜數據進行管理,同時通過本系統還可向公眾用戶提供對已錄入族譜數據的檢索。
族譜信息系統的主要功能包括數據錄入、數據服務和數據輸出。
2。1數據錄入
數據錄入功能主要包括三部分:世系數據錄入、文檔數據錄入、多媒體數據錄入。 其中世系數據錄入是指錄入人物的基本數據以及錄入人物之間的聯系數據。
2。2數據服務
數據服務功能主要包括數據展示、統計檢索、一鍵尋祖和一鍵尋親。
(1) 數據展示
數據展示功能包括族譜展示和對照預覽。 族譜展示功能主要顯示一個族譜的基本信息。 對照預覽則用于在正式輸出紙質化族譜之前以各種不同的樣式來預覽輸出的效果。
(2) 統計檢索
統計檢索提供了對系統中的族譜數據進行統計和檢索的功能。 族譜統計是顯示整個族譜的統計信息,如總人數、男女比例、生死狀況等。 簡單檢索和組合檢索是在某些族譜屬性或者人物屬性上進行檢索的功能。
(3) 一鍵尋祖和一鍵尋親
一鍵尋祖可以從族譜中根據人物之間的親緣關系得到指定人物在指定范圍內(比如限定世代數)的祖先。 一鍵尋親則是指在族譜數據中找到兩個指定人物之間的親緣關系鏈(即兩人是通過哪些人關聯在一起)。
2。3數據輸出
為了滿足用戶傳統紙質譜書的需求,族譜信息系統中提供了數據輸出功能,主要包括族譜編排、族譜生成。
(1)族譜編排
譜志編排功能是通過用戶的個性化需求對譜書的樣式、數據出現的順序、名詞的表達方式等進行設置。
(2) 族譜生成
族譜生成功能主要是在族譜編排過后,按照用戶的個性化需求從原始族譜數據中轉換生成電子版的譜書以供印刷。
2。4應用內存數據管理技術的必要性
通過對族譜信息系統的功能分析,族譜信息系統具有以下特點。
(1)數據源單一。 在數據錄入過程中,對每個錄入用戶來說,只能操作自己參與錄入的族譜數據。 同時,數據輸出過程中,只需要去訪問要生成電子族譜的特定族譜的數據。
(2)數據量較大。 每個族譜都存有數量和容量龐大的世系數據、文檔數據、多媒體數據。
(3)實時性要求高。 由于本系統基于B/S模式設計,無論是數據錄入、數據服務還是數據輸出功能,系統響應時間都應該很短。
族譜信息系統的大數據量和高實時性的特點對系統實現提出了挑戰。 而隨著主存的成本顯著降低,許多成熟的內存數據管理技術為族譜信息系統的實現提供了解決方案[6]。
本文來源:http://www.nvnqwx.com/shiyongwen/2049649.htm