ODCC峰會(huì)現(xiàn)場(chǎng):關(guān)于“大數(shù)據(jù)”,ZNV中興力維曹友盛博士說了什么 2016年09月28日11:28 來源:慧聰安防網(wǎng)|
9月27日,2016開放數(shù)據(jù)中心峰會(huì)在北京國(guó)際中心如期舉行,吸引了百度、騰訊、施耐德、IBM等眾多行業(yè)精英、資深、企業(yè)大佬匯聚一堂。ZNV中興力維作為數(shù)據(jù)中心領(lǐng)域的佼佼者,受邀攜新一代智慧數(shù)據(jù)中心綜合管理(下稱“維統(tǒng)管”)華麗亮相,現(xiàn)場(chǎng)展示受到觀眾的熱烈圍觀和稱贊。本次峰會(huì)上,ZNV中興力維曹友盛博士就“力維在DCIM中的布局”與在場(chǎng)嘉賓、觀眾分享了自己的看法與觀點(diǎn)。
ODCC峰會(huì)現(xiàn)場(chǎng)
如何將IDC的數(shù)據(jù)轉(zhuǎn)為核心競(jìng)爭(zhēng)力
通常,DCIM是指數(shù)據(jù)中心基礎(chǔ)設(shè)施管理。但在力維看來,對(duì)于一個(gè)數(shù)據(jù)中心來說,它的意義遠(yuǎn)遠(yuǎn)不只是對(duì)于基礎(chǔ)設(shè)施的管理。
雖然今天大家都在談大數(shù)據(jù),許多企業(yè)也懂得如何產(chǎn)生數(shù)據(jù),但是知道如何保存數(shù)據(jù)和利用數(shù)據(jù)的企業(yè)卻非常少。而Google是一個(gè)既會(huì)產(chǎn)生數(shù)據(jù),又會(huì)使用數(shù)據(jù)的。谷歌最擅長(zhǎng)的是使得數(shù)據(jù)成為他們的核心競(jìng)爭(zhēng)力,谷歌所有的,最初的目的只有一個(gè)就是產(chǎn)生數(shù)據(jù)。
當(dāng)因特網(wǎng)的末端設(shè)備被化后,當(dāng)數(shù)據(jù)中心被物聯(lián)網(wǎng)化后,數(shù)據(jù)中心每天所產(chǎn)生的數(shù)據(jù)將以指數(shù)形式高速增長(zhǎng)。數(shù)據(jù)中心運(yùn)營(yíng)者在優(yōu)化及規(guī)劃現(xiàn)有設(shè)施擴(kuò)展的過程中,如何更好地運(yùn)用系統(tǒng)里的數(shù)據(jù)采集量、多樣性、預(yù)測(cè)性的價(jià)值和真實(shí)性,分析的能力和速度將變得尤為重要。因此,對(duì)IDC數(shù)據(jù)的理解還突顯了IBM對(duì)大數(shù)據(jù)的五個(gè)定義:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)、Veracity(真實(shí))。
而力維對(duì)DCIM的認(rèn)識(shí)從最初的“基礎(chǔ)設(shè)施管理”到“綜合管理”,又進(jìn)一步向前推進(jìn)到:“基于大數(shù)據(jù)概念的IDC綜合解決方案。
ZNV中興力維CTO曹友盛博士在演講
IDC數(shù)據(jù)存在的難題與挑戰(zhàn)
Volume(海量):目前的感知設(shè)備不夠多,智能化還只是剛剛開始,對(duì)于數(shù)據(jù)采集的密度不夠,視頻數(shù)據(jù)的采集也相對(duì)缺乏,數(shù)據(jù)流能力的設(shè)計(jì)存在瓶頸。
Velocity(高速):對(duì)于百億級(jí)數(shù)據(jù)查詢的速度,報(bào)表分析的深度,統(tǒng)計(jì)的維度,在線分析的缺乏,3D組態(tài)的呈現(xiàn)速度。
Variety(多樣):缺乏多維數(shù)據(jù)間的相關(guān)性分析,數(shù)據(jù)呈現(xiàn)孤島性,溫濕度、電壓、電流、影像、GIS、氣體、時(shí)間之間的聯(lián)系和相關(guān)性缺乏。
Value(價(jià)值):IDC數(shù)據(jù)對(duì)于IDC經(jīng)營(yíng)者的價(jià)值在哪里?IDC經(jīng)營(yíng)者要改善IDC的運(yùn)營(yíng)成本、設(shè)備的使用率和出租率,如何做到高效、節(jié)能、省心、省錢、安全。
Veracity(真實(shí)性):IDC普遍存在的誤告警、漏告警、事件誤判、報(bào)表的真實(shí)性,對(duì)PUE的誤解。
ZNV中興力維展臺(tái)
什么才是聰明的解決方案
力維認(rèn)為可以提升5個(gè)V在DCIM中的應(yīng)用。Volume(海量):增加感知設(shè)備布點(diǎn),增加數(shù)據(jù)采集密度,關(guān)鍵設(shè)備全生命周期事件記錄SOE,動(dòng)環(huán)數(shù)據(jù)流能力設(shè)計(jì);Velocity(高速):大數(shù)據(jù)引擎Hadoop-Spark,Kafka、HBase、高速讀寫、高速查詢、高速統(tǒng)計(jì);Variety(多樣):歷史數(shù)據(jù)累積,數(shù)據(jù)整理、清洗,對(duì)時(shí)、多維數(shù)據(jù)相關(guān)性分析;Value(價(jià)值):IDC數(shù)據(jù)的價(jià)值在于讓IDC經(jīng)營(yíng)者能高效、安全、省心、省錢;Veracity(真實(shí)性):真實(shí)性是IDC數(shù)據(jù)需要通過時(shí)間來考考核的,Google通過了兩年的時(shí)間,證明了DeepMind能為它的IDC省下40%能耗。
針對(duì)數(shù)據(jù)流能力設(shè)計(jì)方面,力維的DCIM整體架構(gòu)可以分為數(shù)據(jù)呈現(xiàn)、數(shù)據(jù)引擎、數(shù)據(jù)接入層、數(shù)據(jù)匯聚層。力維的“維統(tǒng)管”不僅能實(shí)現(xiàn)數(shù)據(jù)的處理、分析、挖掘、共享、深度學(xué)習(xí),還能夠接入?yún)R聚各種協(xié)議、海量數(shù)據(jù)(百億條數(shù)據(jù)),即便每天100萬(wàn)個(gè)檢測(cè)點(diǎn)產(chǎn)生6TB的數(shù)據(jù)、168億條數(shù)據(jù)。值得一提的是,維統(tǒng)管還可以實(shí)現(xiàn)高密度采集數(shù)據(jù),100萬(wàn)個(gè)測(cè)點(diǎn),每5秒采集一次,一條測(cè)點(diǎn)數(shù)據(jù)是200B來計(jì)算,每天產(chǎn)生采集數(shù)據(jù)168億條。
現(xiàn)場(chǎng)觀眾與力維展臺(tái)工作人員交流中
力維的大數(shù)據(jù)規(guī)劃
第一層是做到響應(yīng)型分析:收集數(shù)據(jù),報(bào)表統(tǒng)計(jì),高速查詢。即一個(gè)百萬(wàn)測(cè)點(diǎn)的IDC,每天可產(chǎn)生6TB的數(shù)據(jù),需要一個(gè)NoSQL的高速數(shù)據(jù)存儲(chǔ),年統(tǒng)計(jì)報(bào)表的變量可以在百萬(wàn)個(gè)以上,用SQL數(shù)據(jù)庫(kù)是無法統(tǒng)計(jì)出來的。NoSQL技術(shù)可以實(shí)現(xiàn)百萬(wàn)變量統(tǒng)計(jì)報(bào)表 2秒。
第二層是診斷型分析趨勢(shì):產(chǎn)生的根源是什么?通過多維數(shù)據(jù)的時(shí)間關(guān)系深度分析,才能找到根源。趨勢(shì)分析:在溫度上升過程中的趨勢(shì)可以是線性、拋物、冪函數(shù)、指數(shù)型的。
第三層是預(yù)測(cè)模型:預(yù)測(cè)型分析已經(jīng)進(jìn)入到下一代數(shù)據(jù)分析的頂尖層次,很多時(shí)候是需要人工智能給我們一些真正的建議,利用存儲(chǔ)Alluxio上的預(yù)測(cè)模型作為參考,對(duì)采集數(shù)據(jù)做快速在線分析和預(yù)測(cè),而這些模型來自力維云計(jì)算中的深度細(xì)化、深度學(xué)習(xí)。
第四層是認(rèn)知轉(zhuǎn)換:認(rèn)知計(jì)算是大數(shù)據(jù)的最高層次??赏ㄟ^提取來自工作流程、事件背景和環(huán)境的實(shí)時(shí)信息,幫助IDC經(jīng)營(yíng)者增強(qiáng)預(yù)測(cè)和決策能力,給業(yè)務(wù)帶來更大的確定性,從而持續(xù)改進(jìn)自身的業(yè)務(wù)流程,使IDC運(yùn)營(yíng)更加穩(wěn)健。另外,認(rèn)知計(jì)算可以幫助IDC從大量數(shù)據(jù)中發(fā)掘洞察,揭示以往傳統(tǒng)方法無法發(fā)現(xiàn)的模式和機(jī)會(huì),來提高重要研究的成功機(jī)率。
責(zé)任編輯:鐘娟娟