對新信息環境下信息組織的解讀論文
[摘要]在介紹傳統世界的信息組織模式的基礎上,從傳統世界信息組織的缺陷入手,比較分析數字世界的信息組織在檢索語言、元數據、分類方式、組織理念上的變革和優勢。從不同角度論證傳統世界的信息組織存在的必然性,進而探討新信息環境中信息組織的發展趨勢,指出信息組織應沿著傳統世界與數字世界的融合、社會網絡和知識關聯方向發展。
[關鍵詞]信息組織 傳統世界 數字世界 發展趨勢
1 傳統世界的信息組織
傳統世界的信息組織是指對由原子構成的實體資源的組織,包括簡單的安排事物——如餐具如何在櫥柜中擺放,商品如何在貨架中排放。但是,其最重要的組織對象是附著于各種載體上的信息,即文獻信息的組織。是一種線型模式,如圖1所示:
其中信息標引、信息描述、信息排序是關鍵的三個階段。信息標引是指在對信息內容進行分析的基礎上,根據一定規則給信息的內容屬性以標識,并作出描述的過程;信息描述是指根據信息組織和檢索的需要,對信息資源的主題內容、形勢特征、物質形態等進行分析、選擇、記錄的活動;信息排序是在信息標引后,按一定規則和方法把所有信息描述記錄組織排列成一個有序的整體。在傳統世界中,龐雜、無序的文獻信息群經過選擇、標引、描述、排序后,很好地實現了有序化,保證了原子世界中的每個實體在一定空間內的唯一性,這種機制,對信息資源的開發利用以及用戶檢索信息有著不可替代的作用。
但是,由于傳統世界的信息組織對象是原子所構成的物質,而原子的運行是遵循特定規律的:①由原子構成的物質隨著時間的推移會越來越不穩定,紙張會泛黃和分解,照片底片會溶化,所以必須采取一些措施來讓大自然的作用偏離它的軌道;②原子構成的物質需要占據空間,為了節省空間,必須為物質安排唯一的位置,同時要建立目錄、索引等檢索工具來指示物質的位置,但是這些檢索工具不可能記錄某個實體信息資源的所有信息,當實體信息資源的規模大到一定程度時,即便是引用計算機與網絡技術,信息的查找利用也很難做到高效、準確。loCaLhOst在傳統世界中,無論采用何種信息組織方式,都要受其信息組織對象自身以及環境的限制,畢竟在一個圖書館中,很難會把一本書放在它可以歸屬的多個書架上,因為這樣太浪費空間。
2 數字世界的信息組織
與傳統世界相比,數字世界的信息組織發生了很大變化。信息內容被數字化成比特;信息組織的范圍更為廣泛,不再停留在對文獻特征的描述,而是深入到了知識單元;信息組織的空間更為廣闊,它不再需要如傳統世界那般就單一的信息組織框架體系達成一致。隨著web2.0的深入發展,信息組織在檢索語言、元數據、分類方式、組織理念上蓬勃發展,展現出全新的特征,這不僅是技術上的變革,更是理念上的顛覆。
2.1 檢索語言的發展——標簽語言
標簽語言是一種純自然語言,它的語詞來自于一個平面的命名空間,不受任何預先制定的詞匯間的關系限制。以受控語言為基礎的傳統分類法和主題法主要應用于圖書館的文獻信息組織中,這類信息資源在一定意義上具有同質性,即由原子構成,由于實體空間的限制,它們一般是集中分布、規模有限、增長速度可控的;同時用戶一般都具有一定的知識基礎,對信息檢索的查全率與查準率要求比較高。在這種情況下,采用受控語言的分類法和主題法可以通過較為嚴密的機制滿足用戶的需求。但是,對于數字世界中由用戶產生的海量、動態、異質的信息資源,由一個采用受控語言的系統集中控制和組織的難度加大、成本增加,而標簽語言的優勢恰好可以解決這些困難。
2.1.1 多維度揭示信息資源 標簽既不同于分類法的類目,也不同于主題法的主題詞,它是在對信息進行概括和理解基礎上產生的,是基于對信息內容個人理解上的私人標注,可以是針對主題,也可以是與文章主題無關的語詞,因此標簽的設定要比主題詞自由、方便,它可以從多個維度來揭示信息內容,從多個語境來豐富其含義,例如,一張以長城為背景的照片,可能擁有“長城”、“艷陽高照”、“旅行”、“恐高”等標簽。
2.1.2 具有大眾性傳統世界的信息組織需要專業人員或計算機來完成信息標引、描述工作,而標簽語言沒有采用預先定義的分類法和詞表,不需要用戶擁有分類法或者本體相關的.知識。這樣,用戶可以在幾乎不需要任何學習和使用成本的情況下獨立、輕松的完成信息的標注和分類。
2.2 元數據的發展——任何信息都是元數據
元數據一股被認為是“關于數據的數據(date a—bout date)”,它由專家制定,具有嚴格的規范性,以信息內容為出發點。其實它并不是一個全新的概念,早已廣泛應用于傳統世界的信息組織當中了,像圖書中的版權頁說明、圖書館中的目錄卡片等都是元數據。元數據經過了10余年的發展,其標準越來越復雜,隨著網絡信息的快速增長,信息類型越來越多樣化,任何標準都面臨著“滯后”的風險,同時其嚴格的規范性也限制了用戶的使用。
在數字世界中,元數據正在打破那些嚴格的限制,也在挑戰傳統的元數據的概念。如果你記不清羅貫中某部著作的名稱,可以求助于google圖書的搜索框,輸入“羅貫中”,就可以看到一張羅貫中著作列表。只要點擊《三國演義》的鏈接,你就可以查到全文,其中包括那句經典的原文:“滾滾長江東逝水”。相反,如果你想知道“滾滾長江東逝水”這句話的出處,只要將這句話輸入google圖書的搜索框,就能夠看到《三國演義》被列出來。在第一個例子中,是用羅貫中的名字作為元數據來找到書中的內容,而在第二個例子中,是用書中部分內容作為元數據來找到作者和書名。可以說,在多元的數字世界中,不僅一本書中的每一個詞都可以被看做元數據,而且鏈接到這本書的每一種信息也是如此,元數據和數據的唯一區別就是,元數據是你已經了解的信息,而數據是你試圖找出來的信息。
本文來源:http://www.nvnqwx.com/shiyongwen/2807398.htm