1系統的實現
訪問量的多少是衡量網站是否成功的重要標準,但對于圖書館網站是遠遠不夠的,圖書館需要獲取完整的讀者訪問流量統計數據,來對圖書館信息資源的使用情況進行分析,網絡信息計量學方法是目前網絡界普遍采用的網站績效評估計量法,被認為是可以用科學的方法檢驗網站訪問數據的一種工具。它的目的包括了解網絡讀者的行為、確定網站是否吸引適當的讀者來訪、評定網站建設策略是否得當。其實施步驟可分為三個階段:
(1)記錄網站的訪問數據;
(2)分析記錄數據;
(3)為網站建設策略的改進提供依據。
1.1系統原理
由于網絡發布站點和數據庫本身具備了訪問計量功能,各自的信息資源收藏狀況便于人們掌握,并且能自動記錄讀者訪問的登錄情況,如登錄名、登錄時間、瀏覽文件、讀者的來源地址等,這些數據資料能夠準確反映讀者訪問信息和來源分布等情況,所以依據圖書館網絡讀者訪問統計的工作內容,制定相應的分析指標,并收集網絡讀者訪問圖書館信息資源發布站點形成的日志文件,然后利用日志統計工作軟件定時對日志文件進行處理,得到統計數據,并動態生成各種表達形式的能滿足圖書館各項統計分析工作的報表。最后把生成的分析報表導入到發布數據庫中發布出去。
圖書館各個網絡資源站點建設人員可通過瀏覽網絡讀者訪問流量統計分析報告,分析和了解讀者的訪問需求,從而做好網絡信息資源的建設工作。
讀者行為分析研究則可通過對分析報告進行質化研究,并結合一般調查法、咨詢研究法對讀者的信息尋求行為進行研究。
本系統還可利用統計分析的結果來對系統自身工作進行評估和調整。
1.2分析指標
傳統圖書館的分析指標和計量方法,雖然和數字化圖書館有很多不同,但使用的目的及計量的準則并沒有太大實質性差異[4]。
參考傳統圖書館的分析指標以及國內外類似的研究結果選定了下列10個分析指標:
(1)讀者到訪人數和潛在讀者人數的百分比;
(2)到訪讀者表現了閱讀的興趣的百分比(采取明顯的閱讀行動);
(3)可能的讀者轉為經常的讀者的百分比(經常閱讀、下載資料);
(4)讀者的持續度(重復到訪讀者);
(5)讀者的忠誠度(網頁瀏覽次數、再度到訪的次數及時間長度);
(6)讀者停止閱讀行為的百分比(閱讀行為半途中止);
(7)讀者耗損率(現有讀者中停止閱讀行為者的百分比);
(8)讀者動搖率(耗損的讀者/到訪讀者的總數);
(9)讀者最近到訪時間(據上次到訪的間隔時間);
(10)讀者到訪頻率(多久到訪一次)。
就此參數,我們可以從一個客觀的角度來觀察和評估圖書館網絡讀者訪問情況。
1.3系統框圖
網絡讀者流量統計分析系統功能框圖
1.4工作方法
本系統工作方法主要是采集網絡讀者訪問過程日志進行量化分析法,它的優缺點見表1。
讀者訪問過程日志分析法優缺點
量化分析法重視量的分析,本系統通過對訪問過程日志以量的方法加以統計分析,首先根據為了研究讀者需求分布和需求增長情況這一目的將研究內容歸類成若干分析單元,接著將分析單元以數量的方式加以表達,進而以此為解釋讀者信息尋求行為的依據。
1.5技術實現
(1)系統結構
本系統是以瀏覽器/服務器/數據庫體系結構作為基本架構,通過ASP方式實現交互式、動態的讀者訪問日志統計分析系統。系統結構框架如圖2所示:
讀者訪問日志統計分析系統結構框圖
(2)系統組成模塊
本系統有六個模塊組成:訪問日志入庫、訪問流量分析、被訪頁面分析、來訪讀者分析和統計分析圖表。
(3)系統運行環境與開發平臺
本系統運行環境和開發平臺如表2。
讀者訪問日志統計分析系統模塊
表2系統運行環境及開發平臺一覽表
軟件類別軟件名稱
數據庫SQLServer2000+FastTrendsDatabase
操作系統Windows2000SP4Server+Aix4.3.3
Web服務器軟件IIS5.0+Apache3.0
瀏覽器軟件IE5.5
網頁制作Frontpage2000+javascript
ASP工具EditplusTextEditor
編程語言VisualBasic6.0
圖表軟件Excel2000
(4)程序流程與代碼實現
該系統由main.asp(主界面程序)、flux.asp(小時、日、星期流量分析)、target.asp(被訪頁面分析)、visitor.asp(來訪讀者分析)、chart.asp(統計分析圖表)五個組成。
我們以“被訪頁面分析”模塊的程序流程和代碼說明系統組成模塊的實現過程,該模塊程序流程圖如圖4。
“被訪頁面分析”程序流程圖
相應代碼:
<table
<tdclass=定義的表格形式及表頭>
Setconn=server.creatobjectl("adodb.connection")
conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"
Setre=server.creatobject("adodb.recorderset")
re.activeconnection=conn
dbname=Application("logtime")——數據表名稱
re.open“QL語句”
dowhilenotre.eof
執行Recordset操作,服務器進行統計計算
response.write——寫入統計表
re.movenext
loop
re.close
程序中一些代碼說明:
①Recordset的Open方法:允許用戶向數據庫發出請求,通常是運行sql命令。如:Sqlquery="selectlogtimefromintemetlogwhereday(logtime)=day(getdate())andmonth(logtime)=month(getdate())andyear(logtime)=year(getdate())"Dbrs.opensqlquery,dbconnection,3,3
②Recordset的RecordCount屬性:可以取得當前在Recordset對象中的記錄條數。如:setdbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount
③Recordset的MoveNext方法:移動指針到Recordset對象的下一條數據。如:Dbrs.movenext
④Response的Write方法:負責將字符串信息輸出的用戶端。如:Response.write“頁面總訪問量:“&amount&”<br>
⑤Recordset的Close方法:可以用來關閉指定的Recordset對象。如:Dbrs.close
1.6系統運行過程
下面以西安交通大學圖書館網站為統計分析對象說明該系統運行過程。
首先我們用FTP工具抓取網址為的服務器,時間段為2003/01/01到2003/12/31的訪問日志導入到數據庫中,該服務器完成圖書館網站的部分功能:門戶信息、OPAC、館際互借、電子期刊、網絡數據庫、網絡資源、參考服務等。
對日志分析系統進行運行參數設置:讀者訪問時間間隔設為20分鐘;從最新QQ顯IP版軟件中導出讀者IP地址分配資料,轉換格式后導入到日志分析系統的地址表中,以便對讀者分群;設置過濾規格文件濾掉一些無用的訪問信息,如背景圖片、圖書館Logo,頁面美化圖片和服務器漏洞掃描日志等日志信息,然后對服務器訪問日志進行初步統計分析,保存統計分析結果準備進行進一步統計分析。
最后利用精致多樣的統計分析方法對初步統計結果進行統計分析,統計分析出的數據有:一年內資源點擊與訪問計數;一年內網站中最常使用的資源與服務;一年內點擊次數最多的讀者;一年內務分群讀者的點擊次數比例;一年內點擊次數與閱讀次數的變化;一年內上網的讀者與累積成長趨勢;一周各天的平均點擊次數;一天內各時段的平均點擊次數;校內各區讀者點擊次數比例;各項相關資源被使用的情形等等。這些數據可用Eexel軟件生成直觀的統計分析圖表,部分圖表詳見實際應用一節中。本系統的研究主要采用訪問過程日志分析法,以內容分析法、問卷調查法輔助研究。主要考慮:一是這種方法在電子商務和其它網絡應用的量化分析,已經有許多研究成果,可使我們的研究更為便利;二是可以經濟的,較具體客觀的分析到網絡讀者信息需求特性;三是通過定量的計算,定質的分析,形成一種綜合分析的方式,以求分析結果更為客觀和科學。
本文來源:http://www.nvnqwx.com/shiyongwen/2648562.htm