隨著市場競爭的日趨激烈,商業活動也變得越來越復雜,企業對信息的依賴性也變得越來越高,對信息的處理和利用能力的強弱決定了企業的興衰成敗,因此企業對決策的準確性和及時性的要求也越來越高,充分利用、挖掘企業現有的海量數據,能夠幫助企業做出更好的商業決策,使得在提供多維數據集中數據的關系系統方面的投資產生更高的回報,從而提高企業的競爭力。
1 數據倉庫
數據倉庫是一個面向主題的、集成的、與時間相關、穩定的數據集合,用于支持管理決策。數據倉庫將來自于一個或多個數據源的數據根據不同的主題進行存儲,并對原始數據進行抽取、轉換和加載等一系列篩選和清理工作。數據倉庫是BI的核心,它的性能高低直接決定了BI的表現。
數據倉庫具有以下特征:1)面向主題性:要求數據倉庫中存儲的不是以應用劃分的數據而是以業務內容劃分的數據,建立可獨立維護的良構的主題數據庫;2)數據集成性:要求數據倉庫中的數據采用統一的編碼方式,對原有的分散的數據庫中的數據進行抽取、加工、匯總、消除數據的不一致性后進入數據倉庫;3)非易失性:在數據進入數據倉庫之后并不進行一般意義上的數據更新操作,被長期保留,以便為決策者提供決策分析數據,所涉及到的操作主要是查詢;4)反映歷史變化:數據倉庫中的數據通常反映的是歷史信息,只增不刪,使數據倉庫中的數據總是擁有時間維度,使決策者通過這些信息,對企業的發展歷程和未來的發展趨勢做出定量分析和預測。
數據倉庫的關鍵技術可分為數據抽取(將OLTP系統中數據按照數據倉庫的格式組織數據)、數據清洗(去除數據的不一致性,并去除與分析無關或不利于分析的數據)、數據轉換(將來源不同的分散數據集成并轉換以供分析使用)、數據裝載和維護(周期性的加載新數據,刷新當前數據,并重新計算以供決策使用)等。
圖1 數據倉庫的實現過程
2 多維數據集
多維數據集是OLAP中的主要對象,是一項可對數據倉庫中的數據進行快速訪問的技術,多維數據集是一個數據集合,通常從數據倉庫的子集構造,并組織和匯總成一個由一組維度和度量值定義的多維結構。度量值是用戶將要分析的數值數據,而維度則是度量值將要被深化的類別,維度是可以分層的。多維數據集是由關系數據庫中的一組特殊表創建的,這些表是事實數據表和維度表。
1)事實表,每個數據倉庫都包含一個或多個事實表,事實表通常包含大量的行,主要特點是包含數字數據(不包含描述性的信息)。這些數字信息可以匯總,以提供企業作為歷史的數據,每個事實數據表包含一個由多個部分組成的索引,該索引包含作為外鍵的相關性維度表的主鍵;
2)維度表包含事實數據表中事實記錄的特性,有些特性提供描述性信息,有些特性指定如何匯總事實數據表數據,以便為分析者提供有用的信息,維度表包含幫助匯總數據的特性的層次結構。
3 構建多維數據集
3.1 構建數據倉庫
以商品銷售管理數據庫為例構建數據倉庫,在商品銷售管理數據庫中包含很多表,通過ETL完成數據抽取、清洗和轉換以構建商品銷售管理數據倉庫,如表1。
表1 商品銷售管理數據倉庫
在此系統中,如果對數據倉庫中所存放的歷史數據進行分析和集成,就可以分析出各個國家每個季度的銷售情況,甚至可以進一步深化到每個城市每個月的銷售情況,根據所獲得的結果,做出合理的決策。通過對商品銷售管理系統的需求分析,確定以產品銷售分析為主題,以產品銷售的地理位置和時間等為數據倉庫的索引基準點,以上索引基準點都可以作為商品銷售管理的數據倉庫維度,而產品的銷售情況為事實表。
3.2 確定維和度量值
在實際決策過程中,決策者往往希望能從多個角度觀察多個指標的值。并且找出這些指標之間的關系,這些觀察數據的角度叫做維。根據此系統的需求,關于銷售管理數據將從員工、時間、地理位置,供貨商,銷售額等角度展開,通過對商品名稱銷售的國家、時間段和銷售額跟蹤采集的數據可以導出各種商品在不同時間段、不同銷售地點的銷售額等度量值,根據這些度量值得到事實表。本系統的事實表是商品銷售情況表,其中OrderDate屬于時間維,ProductID屬于產品維,EmployeeID屬于員工維,ShipperID屬于供貨商維等。
3.3 為維度表選擇屬性
在完成事實表之后,就可以為維度表選擇屬性了,利用維度設計器可以很容易的從維度屬性創建層次結構。在此為地理位置維添加屬性,第一級別是國家,然后依次是省/州、城市、郵政編號,然后將其銷售額匯總,從而得到決策者需要的信息,對于特定銷售情況好的商品的城市,可以增加該商品供貨,以滿足銷售需求,而對于銷售情況相對較差的城市,決策者可以考慮減少供貨,并采取積極有效的措施,如進行促銷活動來刺激消費,從而增加銷售量,提升利潤。
4 結束語
多維數據集可以針對不同的維度進行多角度的分析,還可以對數據進行鉆取、切片等,功能非常強大。對于EXCEL用戶來說,可以使用透視表通過拖拽各個維度,從全方面多角度進行分析,多維數據模型為OLAM決策支持和分析系統的設計提供依據,對于決策分析非常實用。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.vmgcyvh.cn/
本文標題:基于多維數據集的BI技術研究