數字圖書館體系結構的發展的論文
【內容提要】首先介紹了目前大多數數字圖書館所遵循的基本的數字圖書館體系結構,該結構在功能上可劃分為四個邏輯組件:資源庫、命名系統、索引/搜索系統、用戶界面。然后介紹了NSDL、NCSTRL兩個最大的數字圖書館項目在體系結構的關鍵問題方面的實踐,最后,作者提出了數字圖書館體系結構發展的看法。
【摘要題】專題探討
【【關鍵詞】體系結構/互操作
1 介紹
世界上有許多國家進行數字圖書館的建設,但到目前為止,并不存在一個通用的數字圖書館體系結構,這是由于信息技術和相關標準不斷發展的結果,怎樣基于現有的技術并考慮到未來技術的發展,構筑一個靈活強大的數字圖書館體系結構,對于數字圖書館的建設是至關重要的,這需要我們了解相關技術和標準以及數字圖書館體系結構的發展變化。
數字圖書館要為用戶提供各種簡單易用、功能強大的知識服務,通常從功能上可將數字圖書館劃分為:用戶界面、命名服務、搜索系統、資源庫等部分。數字圖書館的建設涵括各種數字資源的創建、管理、查詢、利用、存儲的整個過程。自從williamY.Arms等于1997年提出了數字圖書館的信息體系結構以來,數字圖書館的體系結構在不斷完善和發展,通過許多試驗項目仍在不斷改進。圖1代表了數字圖書館的基本體系結構。
附圖
圖1 數字圖書館的基本體系結構
資源庫
資源庫的功能包括存儲和管理各種數字對象,通常是由關系型數據庫來管理。應用程序通過資源庫提供的庫訪問協議(RAP)來訪問資源庫。可實現存儲、訪問、復制、移動和刪除數字對象等操作。
與web上的信息所不同,數字圖書館中數字資源是以數 字對象的形式進行封裝的,一個數字對象包括:
①一個全球唯一的獨立于地址的長期標識符;
②數字資料,存儲數字圖書館的資料,也就是最終用戶需要獲取的信息內容,如經XML置標后的文本、一本電子圖書等,
③元數據,關于數字資料的數據。一般情況下,元數據有三種:a.描述性元數據,用于發現和標識一個對象,如MARC和DublinCore。b.結構性元數據,為用戶顯示和導航一個對象(包括該對象的內部組織信息),如一本書由章節組成。c.管理性元數據,描述該對象的管理信息;創建日期、文件的格式、訪問權限、知識產權問題等。
命名系統
命名系統是針對長期標識符的分配、管理及解析的一個綜合系統,CNRI為數字圖書館提出了完整的命名系統“調度系統(HandleSystem)”,它是一個獨立的系統,其職能是負責數字資源的全球唯一的、長期的、獨立于地址的命名的分配、管理和解析。在調度系統中,本地名稱空間通過獲取一個調度系統的命名授權,就可以納入到全球調度名稱空間,這樣所有的本地名稱在全球調度名稱空間中將是唯一的。
索引與搜索系統
索引的創建可能是由機器的自動掃描、手工錄入和干預,或者是這兩者的結合。客戶機把查詢式提交給索引服務器,將返回相匹配的數字對象的URN(統一資源命名,如調度碼)。索引服務還提供被索引信息的元數據和查詢機制。
用戶界面
用戶界面是用戶與數字圖書館的接口,數字圖書館向用戶提供的最終服務都是通過用戶界面來實現的。一般情況下,數字圖書館借助通用的'Web瀏覽器作為其用戶界面工具。此外,用戶界面的內容編排和服務方式問題是很復雜的,不同的用戶需求是不同的,用戶對數字圖書館的簡單靈活的需求首先就表現在用戶界面上。
2 NSDL項目的體系結構介紹
NSDL(NationalSTEMDigitalLibrary,STEM—Science,Technology,EngineeringandMathematics)是NSF資助的、由多家單位來實施數字圖書館項目,它包括64個子項目,其目的是支持科學、技術、工程和數學教育,提供廣泛接入和方便使用的分布式資源網絡和學習機制,NSDL一期工程已于2002年底為公眾提供服務,它是目前規模最大的數字圖書館項目。
由于NSDL的內容和用戶的多樣性,為讓各種用戶共享不同的信息,最初的體系結構設計就是通過共享元數據,并利用元數據開發核心服務(如,搜索和發現)。其體系結構(見圖2),包括以下幾個基本概念:
附圖
圖2 NSDL體系結構
·采用公共的核心元數據實現異構系統間的資源發現。
·核心元數據與具體領域的擴展元數據相結合。
·以元數據為基礎實現跨庫搜索并創建更豐富的服務。
·采用自動索引和檢索系統來減少編目工作。
元數據庫—NSDL體系結構的關鍵部分是元數據庫。元數據庫存儲所有藏品集的元數據,并通過OAI協議把它們提供給服務商,服務商通過元數據可以開發出各種服務。在NDSL中,元數據庫可能分布在多個服務器上,并有多個鏡像。NSDL早期采用分布式元數據庫,現在改成集中式。這是因為分布式元數據庫在檢索時會因為其中的一個元數據庫的查詢失敗或響應較慢,而造成整個檢索的失敗或長時間的響應,而集中式元數據庫可以避免這種現象。
NSDL的互操作性問題
NSDL的互操作性采用三種方式來實現:
·聯合:這是一種傳統的方法,其所有的成員組織都遵從某些標準規范,如通過Z39.50協議共享在線目錄。
·OAI采集:以OAI元數據采集為基礎。每個數字圖書館藏品的元數據都能提供到DublinCore的映射,并以簡單的交換格式向外提供,這樣,服務提供商就能采集這些元數據,把它建入到信息發現系統中,而且這些藏品能夠實現良好的互操作性。
·搜集:即使各種不同的組織之間不存在任何形式的合作,通過網絡爬蟲收集開放訪問的信息仍然可以實現一定程度上的互操作。各種網絡搜索引擎就是這樣。
NSDL主要通過OAI元數據采集來實現互操作。2001年初,NSDL確定支持8種標準元數據格式,這8種元數據之間的互換通過DublinCore元數據核心集作為過渡。
(1)DublinCore
(2)DublinCorewithDC—EdExtensions
本文來源:http://www.nvnqwx.com/shiyongwen/2803237.htm