地址:北京市密云區(qū)高嶺鎮(zhèn)政府辦公樓
王經理 13393261468
Q Q:514468705/1049705527
郵箱:[email protected]
數據查詢,、數據分析與數據建模技術的介紹:
前文我們對數據查詢進行了側重簡要的介紹,,接下來我們再來探討下數據分析和數據建模,。
數據分析
目前,社交網站,、電子商務等網絡服務的迅速發(fā)展,使得網絡服務及網絡信息規(guī)模裂變式增長,,這樣就會對大規(guī)模數據的處理帶來了很大的挑戰(zhàn),。金融業(yè)、零售業(yè),、醫(yī)療,、電信、航空等領域也會產生大量的數據,,在數據挖掘中如何處理海量數據,,提高挖掘質量和效率,是迫切需要解決的問題,。數據固有的記錄歷史信息的能力,,使得企業(yè)認識到,大量數據中,,尤其是歷史數據中是隱藏著許多有價值的東西的,。
通過對歷史數據的分析,能夠對現在和未來的業(yè)務發(fā)展有很大的幫助。這種分析需要兩點的支持,,一是對海量數據的規(guī)整和處理,,數據的量越多,數據的種類越豐富,,其提供的結果越準確,、越詳細。二是有數據統計分析的方法,,根據分析業(yè)務內容的不同,,使用的分析方法也會有所不同,常用的幾種分析方法包括:分類,、聚合,、關聯等。
數據分析最重要的領域為數據挖掘,。針對海量數據的增長速度,,許多國內外從事海量數據挖掘、知識發(fā)現領域的相關人士進行了深入的研究,。海量數據的存儲和處理能力本身就對數據挖掘或機器學習提出了很高的要求,,Google在這方面做的工作很有意義。
Google公司提出的MapReduce是可以在大型計算機集群上對海量數據進行并發(fā)處理的一種框架模型,。它首先通過設定一個Map函數把輸入數據變換成相應的鍵值對,,然后通過自定義的 Reduce函數聚集起來具有同樣鍵的值,并輸出結果?,F實世界中大都可以用此模型來表示對海量數據的處理,。另外,并行數據庫是數據庫技術與并行技術結合的產物,,并被視為種高性能的數據庫系統,,它能大大提高關系型數據庫中處理海量數據的效率。
數據建模
數據模型是對信息系統中客觀事物及其聯系的數據描述,,它是復雜的數據關系之間的一個整體邏輯結構圖,。數據模型不但提供了整個組織藉以收集數據的基礎,它還與組織中其他模型一起,,精確恰當地記錄業(yè)務需求,,并支持信息系統不斷地發(fā)展和完善,以滿足不斷變化的業(yè)務需求,。對于任何一個信息系統來說,,數據模型都是它的核心和靈魂。
數據建模是一種用于定義和分析數據的要求和其需要的相應支持的信息系統的過程,。因此數據建模的過程中,,涉及的專業(yè)數據建模工作,,與企業(yè)的利益和用戶的信息系統密切相關。
從需求到實際的數據庫,,有三種不同的類型,。用于信息系統的數據模型作為一個概念數據模型,本質上是一組記錄數據要求的最初的規(guī)范技術,。數據首先適合企業(yè)的最初要求,,然后被轉變?yōu)橐粋€邏輯數據模型,該模型可以在數據庫中的數據結構概念模型中實現,。一個概念數據模型的實現可能需要多個邏輯數據模型,。數據建模中的最后一步是確定邏輯數據模型到物理數據模型中對數據、訪問,、性能和存儲的具體要求,。數據建模定義的不只是數據元素,也包括它們的結構和它們之間的關系,。
來源:精密空調 http://kugq.cn