1系統(tǒng)架構設計
整個系統(tǒng)以廣電大數(shù)據(jù)分析平臺為基礎構建,系統(tǒng)由數(shù)據(jù)采集系統(tǒng)、數(shù)據(jù)分析中心、三個數(shù)據(jù)應用中心(推薦中心、決策中心和服務中心)組成和系統(tǒng)管理模塊組成。
1.1數(shù)據(jù)采集系統(tǒng)
大數(shù)據(jù)時代,大數(shù)據(jù)有著來源復雜、體量巨大、價值潛伏等特點,這使得大數(shù)據(jù)分析必然要依托計算機技術予以實現(xiàn).因此從兩個方向上加強數(shù)據(jù)采集統(tǒng)建設,一是側重于數(shù)據(jù)的處理與表示,強調采集、存取、加工和可視化數(shù)據(jù)的方法;二是研究數(shù)據(jù)的統(tǒng)計規(guī)律,側重于對微觀數(shù)據(jù)本質特征的提取和模式發(fā)現(xiàn),在兩個方向上的協(xié)同、均衡推進,以此來保障大數(shù)據(jù)平臺應用的穩(wěn)健成長和可持續(xù)發(fā)展.廣電的網(wǎng)絡和用戶是其核心資產(chǎn),而其中流動的數(shù)據(jù)(包括用戶基礎數(shù)據(jù)、網(wǎng)絡數(shù)據(jù)、網(wǎng)管/日志數(shù)據(jù)、用戶位置數(shù)據(jù)、終端信息等)是核心數(shù)據(jù)資產(chǎn).對于廣電運營商來說,最有價值的數(shù)據(jù)來自基礎網(wǎng)絡,對于基礎網(wǎng)絡數(shù)據(jù)的挖掘和分析是運營商大數(shù)據(jù)挖掘的最重要方向.因此其數(shù)據(jù)采集的目標包括機頂盒數(shù)據(jù)、CRM數(shù)據(jù)、帳務數(shù)據(jù)、客服數(shù)據(jù)、運維數(shù)據(jù)、媒資數(shù)據(jù)、GIS數(shù)據(jù)、財務數(shù)據(jù)和其他手工錄入、表格數(shù)據(jù).采集頻率要求可以實現(xiàn)實時采集和定時批量采集.采集這類數(shù)據(jù)帶來一個問題就是各類數(shù)據(jù)雜亂無章,會導致數(shù)據(jù)質量問題越來越嚴重,通過引進實時質量監(jiān)控和清洗技術,建設強大的分布式計算和集群能力,提高數(shù)據(jù)監(jiān)控和數(shù)據(jù)采集性能,利用分布式處理技術,實現(xiàn)數(shù)據(jù)抽取、數(shù)據(jù)清洗以及相應的數(shù)據(jù)質量檢查工作,保證采集到高質量的數(shù)據(jù),將廣電大數(shù)據(jù)中心建設成一個覆蓋廣電系統(tǒng)全部數(shù)據(jù)的存儲中心,具備采集各類結構化、非結構化海量數(shù)據(jù)的處理能力.
1.2數(shù)據(jù)分析中心
廣電企業(yè)每時每刻都在產(chǎn)生大量的數(shù)據(jù),需要對這些數(shù)據(jù)歸集、提煉,廣電企業(yè)大數(shù)據(jù)平臺建設的意義在于有效掌握規(guī)模龐大的數(shù)據(jù)信息,對這些數(shù)據(jù)信息進行智能處理,從中分析和挖掘出有價值的信息.在廣電大數(shù)據(jù)分析中需要對直播節(jié)目分析、互動業(yè)務分析、互聯(lián)網(wǎng)流量分析、互聯(lián)網(wǎng)內容分析、廣電客戶分析、市場收益分析、智能內容推送和廣告分析等,通過這類數(shù)據(jù)分析,能夠實時了解廣電運營商的經(jīng)營狀況,提供決策支持.因此采用兩種方式分析方法對收集到的數(shù)據(jù)進行分析處理.一是采用在線分析方法技術,使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數(shù)據(jù)的目的.這些信息是從原始數(shù)據(jù)直接轉換過來的,他們以用戶容易理解的方式反映企業(yè)的真實情況.在線分析策略是將關系型的或普通的數(shù)據(jù)進行多維數(shù)據(jù)存貯,以便于進行分析,從而達到在線分析處理的目的.這種多維數(shù)據(jù)存儲可以被看作一個超立方體,沿著各個維方向存貯數(shù)據(jù),它允許分析人員沿事物的軸線方便地分析數(shù)據(jù),分析形式一般有切片和切塊以及下鉆、挖掘等操作.二是數(shù)據(jù)挖掘是從海量、不完全的、有噪聲的數(shù)據(jù)中挖據(jù)出隱含的、未知的、用戶可能感興趣的和對決策有潛在價值的知識和規(guī)則.這些規(guī)則蘊含了數(shù)據(jù)庫中一組對象之間的特定關系,揭示出一些有用的信息,可以為經(jīng)營決策、市場策劃和金融預測等方面提供依據(jù).
1.3數(shù)據(jù)應用中心
在大數(shù)據(jù)分析平臺應用過程中,數(shù)據(jù)本身并不是數(shù)據(jù)分析和數(shù)據(jù)挖掘的重點,重點在于如何應用這些技術去解決企業(yè)在運營中實際的商業(yè)問題.通過對數(shù)據(jù)分析和挖掘,了解企業(yè)運行過程存在問題,預判企業(yè)中各類業(yè)務發(fā)展走向.對數(shù)據(jù)分析與挖掘結果來說主要有兩個方面,一是將分析結果給客戶使用,另一個是將分析結果提供給內部用戶使用,因此在大數(shù)據(jù)分析平臺設計中,將數(shù)據(jù)應用劃分為三個應用中心:
1)推薦中心
推薦中心面向收視、寬帶使用用戶,通過分析使用用戶的收視、互聯(lián)網(wǎng)、消費等行為,將使用用戶分群,總結群體特征,向不同群體推薦個性化的電視節(jié)目、廣告和增值應用服務.從而提升用戶的使用體驗,提升用戶的滿意度和粘度.
2)決策中心
決策中心面向廣電企業(yè)內部決策者、管理者、經(jīng)營分析人員,通過對企業(yè)經(jīng)營數(shù)據(jù)的KPI、運營監(jiān)控、經(jīng)營盤點,使企業(yè)決策者掌握企業(yè)運營狀況及發(fā)展趨勢;智能報告協(xié)助分析人員自動定位經(jīng)營中的問題;即席查詢在預定義的語義層基礎上,實現(xiàn)靈活的自定義查詢;通過主題分析滿足各部門、崗位的多維度分析需求;通過專題分析就某一具體問題進行深入挖掘,輔助專業(yè)分析人員的工作;統(tǒng)計報表滿足各部門常規(guī)統(tǒng)計需求.
3)服務中心
服務中心面向廣電的合作伙伴,比如:電視臺、廣告商、服務和內容提供商、相關政府職能部門等.通過對使用用戶收視行為的實時分析,將電視欄目實時收視率提供給電視臺,電視臺根據(jù)收視率進行在線的問卷調查,提高電視臺的影響力,幫助其增強欄目的評價體系.為廣告商提供精準的廣告投放策略,實時準確的廣告投放評估,幫助廣告商提升廣告到達率、準確度和營銷效果.為服務和內容提供商的電影、電視和增值應用等產(chǎn)品提升收視率和使用頻率,并進行評估,為其提供受眾喜好特征,幫助其推出有針對性的產(chǎn)品.通過用戶收視數(shù)據(jù)、節(jié)目反饋等信息,將相關輿情向相關政府部門匯報.
1.4系統(tǒng)管理
系統(tǒng)管理是大數(shù)據(jù)分析平臺一個輔助功能模塊,主要是為了系統(tǒng)管理員對大數(shù)據(jù)平臺進行有效的監(jiān)控和管理,提升大數(shù)據(jù)分析平臺性能使用,包含有如下幾個模塊:權限管理、數(shù)據(jù)質量管理、元數(shù)據(jù)管理、調度管理、系統(tǒng)監(jiān)控等.
2數(shù)據(jù)應用分析
移動互聯(lián)網(wǎng)的發(fā)展為傳統(tǒng)行業(yè)帶來了新的思考,如何在互聯(lián)網(wǎng)時代更好地實現(xiàn)以客戶為中心的服務理念,借助大數(shù)據(jù)分析平臺、海量的客戶非結構化的行為數(shù)據(jù)和傳統(tǒng)的結構化數(shù)據(jù),可以有效提升廣電個性化、人性化的服務水平.大數(shù)據(jù)分析平臺通過整合廣電網(wǎng)絡中多個數(shù)據(jù)源,并按照主題進行劃分,在定義主題的過程中,提供廣電業(yè)務概念的規(guī)范定義.數(shù)據(jù)模型不偏重于面向某個應用,而是站在企業(yè)角度統(tǒng)攬全局,提供可擴展的模型設計,偏范式化的設計使平臺在最大程度上保持一致和靈活擴展性.依托某廣電網(wǎng)絡公司業(yè)務開展情況,搭建數(shù)據(jù)分析平臺,具有如圖2所示的主題結構,共計8大類53小類,從廣電網(wǎng)絡運營的各個方面進行了數(shù)據(jù)分析.
本文來源:http://www.nvnqwx.com/shiyongwen/2473456.htm