1.概述
日前,數(shù)據(jù)正以前所未有的、驚人的速度產(chǎn)出,根據(jù)國際數(shù)據(jù)公司的“數(shù)字宇宙研究報告”, 2011 年全球被創(chuàng)建和被復(fù)制的數(shù)據(jù)總量已達到了1.8ZB,預(yù)測在2020 年,世界的數(shù)據(jù)量將可能增加到了50倍。傳統(tǒng)數(shù)據(jù)庫等存儲工具都難以滿足如此大規(guī)模要求,維基百科把“無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合”稱為大數(shù)據(jù)。一般地,大數(shù)據(jù)能正確地反映全球的本質(zhì)和運行的規(guī)律,利于人們充分的、有效的配置資源。所以,大數(shù)據(jù)具有極高的利用價值,譽為“未來的新石油”。
大數(shù)據(jù)的價值問題已不是僅停留在一個話題上了,已引起全球地區(qū)和企業(yè)的高度重視。在2012年3 月, 美國發(fā)布了《Big Data Research andDevelopment Initiative》,旨在提升利用大量復(fù)雜數(shù)據(jù)集合獲取知識和洞見的能力,并投入兩億美元以上資金鼓勵各企業(yè)進行探究及開發(fā)。微軟、IBM、谷歌等商業(yè)巨頭相繼進軍該領(lǐng)域。在大數(shù)據(jù)時代構(gòu)建及借助功能全面的企業(yè)系統(tǒng)具有非常重要的現(xiàn)實意義。因此,挖掘數(shù)據(jù)中有用的價值,用于決策,贏得優(yōu)勢是企業(yè)開展競爭的一個關(guān)鍵。
2.大數(shù)據(jù)的產(chǎn)生背影和特征
2.1 大數(shù)據(jù)發(fā)展背影
伴隨著信息技術(shù)的發(fā)展,各種傳感器、攝像頭、手機和個人電腦的普及,世界更容易被感知了,所以產(chǎn)生的數(shù)據(jù)量越來越大。談及大數(shù)據(jù)產(chǎn)生的根本原因,首先是爆發(fā)式的數(shù)據(jù)增長,量膨脹式增加。量大包含實時的數(shù)據(jù)會越來越多,非結(jié)構(gòu)化數(shù)據(jù)極其多;第二個原因是數(shù)據(jù)的社會化趨勢,如UGC 及碎片化的信息。
大數(shù)據(jù)的發(fā)展大致可劃分兩個階段,第一個階段主要是大型的互聯(lián)網(wǎng)企業(yè)。包括谷歌、百度、阿里巴巴等走在大數(shù)據(jù)的前列的原因來源于本身擁有大數(shù)據(jù),沒有現(xiàn)成的解決方案,資本市場對大數(shù)據(jù)非常敏感和火熱的學(xué)術(shù)界,成立各種各樣大數(shù)據(jù)的機構(gòu)。第二個階段,這里面很重要的一點還是大型的互聯(lián)網(wǎng)企業(yè)是大數(shù)據(jù)這里面主要的力量,經(jīng)過大數(shù)據(jù)轉(zhuǎn)型的IT 廠商。
2.2 大數(shù)據(jù)的特征
大數(shù)據(jù)是指無法再可容忍的時間內(nèi)用于傳統(tǒng)IT 技術(shù)和軟硬件工具對其進行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合。大數(shù)據(jù)的特點可以總結(jié)為5V, 即數(shù)量(Volume)、多樣性(Variety)、速度(Velocity)、價值(Value) 以及真實性(Veracity)。
海量的數(shù)據(jù),聚合在一起供分析的數(shù)據(jù)規(guī)模非常龐大。谷歌執(zhí)行董事長艾瑞特·施密特曾說,現(xiàn)在全球每兩天創(chuàng)造的數(shù)據(jù)規(guī)模等同于從人類文明至2003年間產(chǎn)生的數(shù)據(jù)量總和。“大”是相對而言的概念,對于搜索引擎,EB 屬于比較大的規(guī)模,但是對于各類數(shù)據(jù)庫或數(shù)據(jù)分析軟件而言,其規(guī)模量級會有比較大的差別。
多樣性的數(shù)據(jù),數(shù)據(jù)形態(tài)多樣,從生成類型上分為交易數(shù)據(jù)、交互數(shù)據(jù)、傳感數(shù)據(jù);從數(shù)據(jù)來源上分為社交媒體、傳感器數(shù)據(jù)、系統(tǒng)數(shù)據(jù);從數(shù)據(jù)格式上分為文本、圖片、音頻、視頻、光譜等;從數(shù)據(jù)關(guān)系上分為結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù);從數(shù)據(jù)所有者分為公司數(shù)據(jù)、政府?dāng)?shù)據(jù)、社會數(shù)據(jù)等。
井噴式增長的數(shù)據(jù),一方面是數(shù)據(jù)的呈井噴式增長,另一方面是要求數(shù)據(jù)訪問、處理、交付等速度極快。美國的馬丁·希爾伯特說,數(shù)字數(shù)據(jù)儲量每3年就會翻1倍。人類存儲信息的速度比世界經(jīng)濟的增長速度快4倍。
價值不可估量的數(shù)據(jù),盡管我們擁有大量數(shù)據(jù),但是發(fā)揮價值的僅是其中非常小的部分。大數(shù)據(jù)背后潛藏的價值巨大,被譽為“未來的新石油”。美國社交網(wǎng)站Facebook有10億用戶,網(wǎng)站對這些用戶信息進行分析后,廣告商可根據(jù)結(jié)果精準(zhǔn)投放廣告。對廣告商而言,10億用戶的數(shù)據(jù)價值上千億美元。據(jù)資料報道,2012年,運用大數(shù)據(jù)的世界貿(mào)易額已達60億美元。
真實性的數(shù)據(jù),一方面,對于虛擬網(wǎng)絡(luò)環(huán)境下如此大量的數(shù)據(jù)需要采取措施確保其真實性、客觀性,這是大數(shù)據(jù)技術(shù)與業(yè)務(wù)發(fā)展的迫切需求;另一方面,通過大數(shù)據(jù)分析,真實地還原和預(yù)測事物的本來面目也是大數(shù)據(jù)未來發(fā)展的趨勢。經(jīng)過社會的大范圍在調(diào)查對于大數(shù)據(jù)特性關(guān)注度,統(tǒng)計如圖1。
圖1 大數(shù)據(jù)特征的關(guān)注度
從圖中我們不難看出,在大數(shù)據(jù)的幾個特征中,“多樣性”和“價值”極受人們關(guān)注。“多樣性”之所以被最為關(guān)注,在于數(shù)據(jù)的多樣性使得其存儲、應(yīng)用等各個方面都發(fā)生了變化,大數(shù)據(jù)類型繁多,包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)。同時,由于數(shù)據(jù)顯性或隱性的網(wǎng)絡(luò)化存在,使得數(shù)據(jù)之間的復(fù)雜關(guān)聯(lián)無所不在。針對于多樣化數(shù)據(jù)的處理需求也成為了技術(shù)重點攻關(guān)方向。而“價值”則不言而喻,不論是數(shù)據(jù)本身的價值還是其中蘊含的價值都是企業(yè)、部門、政府機關(guān)所希望的。
因此,如何將如此多樣化的數(shù)據(jù)轉(zhuǎn)化為有價值的存在,是大數(shù)據(jù)所要解決的重要問題。
3.大數(shù)據(jù)的價值利用
近年來,微軟、甲骨文、惠普、IBM、SAP 等公司已經(jīng)在數(shù)據(jù)管理和分析領(lǐng)域投入超出150 億美元。據(jù)Gartner 最新預(yù)測,大數(shù)據(jù)產(chǎn)業(yè)2014年將在全球范圍內(nèi)帶來近千億美元的IT 開支;2015 年,大數(shù)據(jù)將為全球帶來440 萬個IT 崗位,這將帶來一個空前的大躍進。
大數(shù)據(jù)作為一種重要的戰(zhàn)略資產(chǎn),已經(jīng)不同程度地滲透到每個行業(yè)領(lǐng)域和部門,其深度應(yīng)用不僅有助于企業(yè)經(jīng)營活動和競爭,還有利于推動國民經(jīng)濟發(fā)展。大數(shù)據(jù)使經(jīng)濟決策部門能夠更敏銳地把握經(jīng)濟走向,及時制定并實施科學(xué)的經(jīng)濟政策。大數(shù)據(jù)可以提高企業(yè)經(jīng)營決策水平和效率,推動創(chuàng)新,給企業(yè)、行業(yè)領(lǐng)域帶來不可估量的價值。大數(shù)據(jù)技術(shù)作為一種重要的信息技術(shù),對于提高安全保障能力、應(yīng)急能力、優(yōu)化公共事業(yè)服務(wù),提高社會管理水平的作用正在日益凸顯。
自2008年11月IBM 提出“智慧地球”概念以來,2009年1月,美國奧巴馬總統(tǒng)公開肯定了IBM“智慧地球”思路,2009 年8 月,IBM 又發(fā)布了《智慧地球贏在中國》計劃書,正式揭開IBM“智慧地球”中國戰(zhàn)略的序幕。智慧城市是大數(shù)據(jù)的源頭,大數(shù)據(jù)是智慧城市的內(nèi)核。以智慧交通為例,智慧交通領(lǐng)域的海量數(shù)據(jù)融合了各類數(shù)據(jù),并以城市交通為主題,在海量變化數(shù)據(jù)中建立關(guān)聯(lián)關(guān)系,找到所需數(shù)據(jù)的準(zhǔn)確信息,并被及時推送到對象手中,提高了城市管理的精確性,提升了城市居民的幸福感受。
數(shù)據(jù)挖掘是一種重要的戰(zhàn)略行為,它就像“石油”一樣具有極不可估量的開采價值,非常有利于幫助企業(yè)、行業(yè)及政府機構(gòu)做出更為精準(zhǔn)、更為科學(xué)的決策,實現(xiàn)更大的商業(yè)利益。所以,有效利用大數(shù)據(jù)并不等同于簡單使用決策支撐,而是一種產(chǎn)生高、快、準(zhǔn)的效益決策。
在數(shù)據(jù)迸發(fā)時代,若是仍墨守成規(guī)的再依靠簡單的經(jīng)驗來做決策,將是白白浪費一個將企業(yè)乃至一個行業(yè)進行質(zhì)的飛躍的大好機會,現(xiàn)在企業(yè)要的是以數(shù)據(jù)為依據(jù),挖掘數(shù)據(jù)的價值,借助數(shù)據(jù),做出精準(zhǔn)的判斷,進行科學(xué)的決策,贏得提升的先機。
4.數(shù)據(jù)的標(biāo)準(zhǔn)化探究
在大量快速變化、多樣化、低價值密度、低質(zhì)數(shù)據(jù)中提取數(shù)據(jù)價值。在大數(shù)據(jù)上開掘城市智慧。大數(shù)據(jù)猶如大儲油罐,分析數(shù)據(jù)多樣性,解決數(shù)據(jù)爆炸的問題,解決數(shù)據(jù)垃圾的問題,進行數(shù)據(jù)標(biāo)準(zhǔn)化與增強、補全數(shù)據(jù)資源,避免數(shù)據(jù)垃圾化,實現(xiàn)數(shù)據(jù)資產(chǎn)化。
圖2 數(shù)據(jù)標(biāo)準(zhǔn)化結(jié)
不以規(guī)矩,無以成方圓,制定數(shù)據(jù)標(biāo)準(zhǔn)為解決之道。一切數(shù)據(jù),皆應(yīng)有標(biāo)準(zhǔn)。在生活中數(shù)據(jù)不乏規(guī)范及標(biāo)準(zhǔn),如:
數(shù)據(jù)名址標(biāo)準(zhǔn):人名、機構(gòu)名、商品名、地址;數(shù)據(jù)編碼標(biāo)準(zhǔn):身份證號碼,工商注冊號,車牌號,手機號,工號;
國際標(biāo)準(zhǔn)國家標(biāo)準(zhǔn)行業(yè)標(biāo)準(zhǔn)地方標(biāo)準(zhǔn)企業(yè)標(biāo)準(zhǔn);
數(shù)據(jù)標(biāo)準(zhǔn)布局;
數(shù)據(jù)實體標(biāo)準(zhǔn);
數(shù)據(jù)庫表結(jié)構(gòu)及數(shù)據(jù)字典規(guī)范;
數(shù)據(jù)交換標(biāo)準(zhǔn): 多為XML 標(biāo)準(zhǔn)(XML vocabulary);
數(shù)據(jù)表示標(biāo)準(zhǔn):如CSS;
行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)。
圖3 數(shù)據(jù)標(biāo)準(zhǔn)化流程
創(chuàng)新的數(shù)據(jù)標(biāo)準(zhǔn)制定與評估,自底向上的標(biāo)準(zhǔn)制定。傳統(tǒng)的自頂向下,自底向上與自頂向下相結(jié)合!
數(shù)據(jù)標(biāo)準(zhǔn)依賴數(shù)據(jù)規(guī)則來落地、實施,數(shù)據(jù)規(guī)則則輔助人來制定數(shù)據(jù)標(biāo)準(zhǔn)和輔助人來評估數(shù)據(jù)標(biāo)準(zhǔn)。涉及的人力資源配置及工作分工的問題,因此,需要明權(quán)責(zé)的跟進數(shù)據(jù)治理規(guī)范,指導(dǎo)數(shù)據(jù)處理過程規(guī)范,使數(shù)據(jù)稽查規(guī)范可落地。
大數(shù)據(jù)時代的到來極大地改變既有的技術(shù)與商業(yè)格局,改變了企業(yè)的競爭模式.TRS 公司開推出了大數(shù)據(jù)管理系統(tǒng),采用分布式并行計算、多副本機制、沒有單點的高可靠體系架構(gòu),兼容Hadoop 標(biāo)準(zhǔn),支持PB 級海量數(shù)據(jù)管理;支持實時及用戶行為數(shù)據(jù)的高效管理和分析;創(chuàng)新的多檢索引擎機制;支持線性擴展,充分釋放硬件潛力,為大數(shù)據(jù)管理提供支撐,規(guī)范了數(shù)據(jù)。
結(jié)語
大數(shù)據(jù)已成為企業(yè)的一種資產(chǎn),像石油一樣驅(qū)動生產(chǎn)力的發(fā)展,對其分析與管理已經(jīng)成為企業(yè)獲取競爭優(yōu)勢制高點、產(chǎn)業(yè)轉(zhuǎn)型和及智慧城市等的推動的重要途徑。現(xiàn)在只有適應(yīng)數(shù)據(jù)變革,標(biāo)準(zhǔn)先行,抓住先機,實現(xiàn)低成本、高效率的競爭優(yōu)勢,才能贏得先機,乃至實現(xiàn)先知、先行、先贏!
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.vmgcyvh.cn/
本文標(biāo)題:大數(shù)據(jù)的標(biāo)準(zhǔn)化研究
本文網(wǎng)址:http://m.vmgcyvh.cn/html/consultation/10839716648.html