大數據時代對地觀測衛星的發展現狀與趨勢論文
一、前言
對地觀測是人類利用衛星、飛船、航天飛機、飛機以及近空間飛行器等空間平臺和地面、地下的各種傳感器設備獲取觀測數據,結合各個學科的專業知識,對地面物體和地理過程進行監測和預測的科學活動,其目的是更加深刻和科學地揭示人類社會活動所依賴的地球環境和人地環境的規律和變化,增強人類對地球的利用和適應能力。對地觀測研究工作具有非常明顯的信息學特征。因此,除了地球科學方法論外,信息科學方法論也對對地觀測科學活動有非常重要的指導意義。對地觀測研究很大程度上是圍繞著“信號—數據—信息—知識”的數字化信息過程來展開的,并構成了“信息獲取—信息傳輸—信息存儲—信息加工—信息挖掘—信息呈現”的數據全生命周期。
從信息科學的角度來看,對地觀測領域知識發現的方法主要是確定模型分析方法。在遙感技術的發展初期,觀測數據量較小,用于數據挖掘分析的理論和模型也不夠成熟,因此更多是依靠專業人員的目視判讀進行信息解譯和勾繪制圖,然后再利用其他學科的知識對獲得的信息進行修正。這種方法顯然不能滿足日益增大的觀測數據量和日益復雜的應用模式需求。在數據量不斷增大、信息提取精度不斷提高的情況下,依賴于計算機處理的數據分析新模式出現了。遙感信息反演的定量化成為對地觀測信息深度應用的趨勢,這種能力也隨著計算機處理能力的提升不斷提高,逐步滿足了 MB(220 字節)、GB(230 字節)、TB(240字節)甚至部分 PB(250 字節)量級的數據分析和信息挖掘工作,從應用上解決了較大地理尺度上的復雜地學問題。提升計算機的處理速度和存儲設備的規模已經成為解決觀測數據量增大和信息模型復雜化所帶來的問題的一個很好的途徑。進入 21 世紀以后,對地觀測技術又呈現出很多新的發展趨勢,其中大數據的出現給對地觀測的研究帶來了全新的挑戰和發展機遇。近年來,隨著對地觀測需求的增加和技術的進步,各種類型傳感器獲取數據的能力不斷提高,使得國內外以專業化、行業化為特征的各類數據中心迅速崛起,對地觀測領域成為數據密集型計算的一個典型應用。整個對地觀測系統流程突出體現了“需求牽引—知識驅動”的概念和原則,形成了以社會需求為先導來發展對地觀測衛星、傳感器、平臺、數據傳輸、信息處理、應用模型及相應科學理論的發展模式。
二、對地觀測領域的大數據現象
在對地觀測領域,各類分辨率的衛星產生的遙感信息無疑屬于大數據。以我國遙感衛星為例,2008 年發射的風云三號 A 星搭載著 20 通道的中分辨率光譜成像儀和 10 通道的可見光近紅外掃描輻射計,實現了對整個地球進行連續觀測,隨后與 2010 年和 2013 年發射的風云三號 B 星和 C 星組網,對地球開展每天 6 次的觀測。衛星觀測數據切割成 5 分鐘段的數據文件,又將 250m 和 1000m 中分辨率光譜成像儀的數據分別存放,每天產生的數據文件和數據量均非常巨大。要管理、處理和分發這些全球數據需要運用“大數據”的方式,而且需要大量的數據科學家開展基礎研究工作,研究算法,從數據中實時提取地球參數信息,進而為科研、業務的數據信息需求服務。這一事實充分說明了從海量遙感數據的獲取、存儲、提取與分發、數值處理,到數據挖掘和知識發現,對地觀測活動的整個生命周期體現了大數據的“4V”特性:數據體量大 (volume)、數據來源和類型繁多(variety)、數據的真實性難以保證(veracity)、數據增加和變化的速度快(velocity)。
國際上,美國和歐洲處理和分發中分辨率數據較中國稍早幾年,美國處理 MODIS 數據和產品的方式、歐洲處理 ENVISAT/MERIS 數據和產品的方式可為我們借鑒。由于美國沒有 MODIS 的后續衛星計劃,數據的供給將隨著傳感器的失效而終止。歐洲的 ENVISAT/MERIS 于 2012 年失效,只能提供 2002-2012 年間的數據。中國風云氣象衛星規劃已持續到 2020 年,因而,在未來幾年,中國的風云衛星中分辨率遙感數據在國際上將是重要的數據源,向全球用戶提供優質的數據和產品,將是中國數據科學家肩上的重任。
1. 觀測平臺和傳感器的數據獲取
遙感數據獲取是由載有成像傳感器的遙感飛行平臺來完成的。遙感飛行平臺的發展體現在:①先進的衛星對地觀測系統,包括大型的綜合衛星平臺與小衛星星座;②先進的集成高—中—低空飛行作業的航空遙感平臺;③全面一體化的對地觀測綜合系統。未來的傳感器搭載平臺將是由相輔相成的高中低軌道上的大小衛星平臺和高中低航空平臺組成的,天地一體化、全球性、立體和多維的觀測體系。與此同時,對地觀測傳感器的數據獲取能力將向著“三高”(高空間分辨率、高光譜分辨率和高時相分辨率)和全天候方向發展。遙感平臺和傳感器的技術進步使得獲取的數據量大幅度增大。比如剛剛退役的 Landsat -5 衛星在其29 年的在軌工作期間,平均每年獲取 8.6 萬景影像,每天獲取 67GB 的觀測數據。而 2012 年發射的資源 3 號衛星,每天的觀測數據獲取量可以達到 10TB 以上。類似的傳感器現在已經大量部署在衛星、飛機等飛行平臺上,未來 10 年全球天、空、地空間中部署的百萬計傳感器每天獲取的觀測數據將超過 10PB。
2.天- 空- 地一體化的對地觀測數據網絡傳輸
巨大的觀測能力需要通過覆蓋天-空-地的高速數據傳輸網來實現對地觀測平臺和全球地面接收站網絡之間的數據傳遞。這種傳輸能力要通過一個由光纜、地面微波、蜂窩移動通信和低、中以及靜止軌道的衛星通信系統組成的、服務于全球的、無縫隙覆蓋的、全球一體化的高速天-空-地對地觀測數據傳輸網絡實現。現在,單個傳感器的信號下傳速率已經突破了 Gbit/s。
3. 海量數據的快速處理
標準遙感產品的快速生成需要高吞吐量、高精度及自動化的分布式數據處理能力,以滿足規模化、業務化的標準產品生產的要求。標準產品快速處理的突出特點是即時性和大吞吐量,兼有數據密集、計算密集的性質。海量遙感數據的處理需要利用龐大的網絡計算資源,通過并行計算、分布式處理以及集群計算技術來實現網絡化大數據量處理及多機分布式并行處理,以滿足應用的需求。我們可以利用網格技術把分散在不同地理位置的計算機組織成一個“虛擬的超級計算機”,來提供高性能和高吞吐量的計算環境,為完成計算密集型任務提供有力的手段;同時充分利用網絡上多種閑置計算設備的處理能力,完成傳統計算模式下不能完成的各種大數據量的計算任務,從而保證標準產品的快速處理和生成。
4. 下一代空間數據設施
下一代空間數據設施建設將以全球尺度問題求解和多樣化實體數據設施建設為前提,基于傳統空間數據設施和聯邦數據設施,通過松耦合形式建立一種非中心化、虛擬化、按需服務化和全球化的數據服務體系。分布在世界各地的各種對地觀測數據中心,將在下一代空間數據設施的連接下,面向特定專題,與高性能的信息化設施結合,動態形成大量專業化的虛擬數據設施。這些設施不僅可以匯聚和提供超大規模的數據,還具備對數據進行深度加工和挖掘的計算能力。地球觀測組織(GEO)所推動建立的全球綜合地球觀測系統(GEOSS)就是一種下一代空間數據設施,這種設施管理和處理的都是超大規模的對地觀測數據和空間數據。
5. 數字地球與未來地球
作為和對地觀測銜接的科學框架,數字地球是一個廣泛的以信息高速公路和空間基礎設施為依托的概念,其核心思想是用數字化手段整體性解決地球的各種科學問題,并最大限度地利用信息資源。未來的數字地球不再局限于進行地學數據的表達和呈現,而將成為一種對地球的各種學科的數據和模型進行綜合分析的平臺。同時,由國際科學理事會(ICSU)和國際社會科學理事會(ISSC) 共同發起的“未來地球”計劃將多學科交叉研究推向更加重要的位置。不論數字地球還是未來地球,其多學科的高度數據復雜性是非常顯著的信息特征。和常規的單學科研究不同,在這種綜合研究場景中,信息技術要面對的是多學科復雜數據類型之間的數據建模、數據發現和數據整合問題。
本文來源:http://www.nvnqwx.com/shiyongwen/2471586.htm