12月20-22日,第十二屆中國IDC產(chǎn)業(yè)年度大典(IDCC2017)在北京國家會議中心隆重召開。本次大會由工業(yè)和信息化部通信發(fā)展司、中國信息通信研究院、云計算發(fā)展與政策論壇、數(shù)據(jù)中心聯(lián)盟指導,中國 IDC 產(chǎn)業(yè)年度大典組委會主辦,中國 IDC 圈、CloudBest承辦,并受到多家媒體大力支持。
中國IDC產(chǎn)業(yè)年度大典作為國內(nèi)云計算和數(shù)據(jù)中心領域規(guī)模最大、最具影響力的標志性盛會,華為中國區(qū)網(wǎng)絡能源總工 張廣河出席此次會議,并發(fā)表《數(shù)字新時代 智能新DC-數(shù)據(jù)中心的智能化演進》主題演講。

演講實錄如下:
張廣河:我先澄清一下我今天給大家匯報的范圍,我的范圍是數(shù)據(jù)中心的機房,就是一個狹義的數(shù)據(jù)中心的范圍,為什么要匯報這個議題,因為我認為剛才微軟、IBM、萬國、華云的專家都講了云計算、大數(shù)據(jù)的發(fā)展速度很快,但是支撐云計算、大數(shù)據(jù)的關鍵基礎設施的腳步發(fā)展是趕不上云計算、大數(shù)據(jù)這個時代,所以說我???????數(shù)據(jù)中心L1的設備急需要智能化的演進。
先看一下行業(yè)的機遇,現(xiàn)在行業(yè)發(fā)展到什么程度。在致辭的時候李書記講了很多具體的數(shù)字,我這兒可以再說一下,因為這可能是屬于L1的增長量。為了要講這件事情,因為有很多人,現(xiàn)在行業(yè)里有很多專家逐漸覺得我們的數(shù)據(jù)中心建設得有點過熱,但是我不這樣認為,為什么?因為我們現(xiàn)在在座的恩有很多的專家,或者是行業(yè)的老總,有可能會受到負面因素的???????響,我認為這個因素是不對的,為什么?因為習總書記有指示,國家大數(shù)據(jù)戰(zhàn)略,這是政策的支持。第二,摩爾定律一直有效,它持續(xù)在翻倍,后面有剛性的需求。一個是政策的支持,一個是需求的拉動,雙輪驅(qū)動,所以我們這個行業(yè)的前景非常的廣泛,所以給大家吃一個定心丸。
但是在這里面我們有很多的痛點,是不是遇到這種情況?我建好數(shù)據(jù)中心,或者說我有一個非常好的伙伴說我有快速地上線,就要三個月,這事怎么辦?我永遠不知道明天會冒出來這么一個大的需求,還是后天冒出來這么大的需求,因為中國是互聯(lián)網(wǎng)最熱的區(qū)域,在全球來看,你永遠想不到明天摩拜冒出來,還是后天滴滴冒出來,毛出來以后就有急遽的需求,這是業(yè)務上線。
大家經(jīng)常聽到這邊著火了,那邊宕機了,可靠性很重要。行業(yè)發(fā)展到現(xiàn)在,數(shù)據(jù)中心已經(jīng)很多了,華為將近有百個數(shù)據(jù)中心,分布在全球,這個行業(yè)的發(fā)展速度超過了人才的儲備速度,這時候運維又成為我們的痛點。靠人工管理嗎?數(shù)量不夠怎么辦?素質(zhì)不夠怎么辦?運維又是我們的痛點。
大家看今天北京的天很藍,近期很長一段時間北京的天都很藍,為什么?因為我們的能源要改革,所以說節(jié)能必然會成為政府推動非常強大的高壓線,所以說節(jié)能只是說說,現(xiàn)在除了節(jié)錢物還有壓力,當一個區(qū)域的能源使用到一個程度,可能就停止供應了,這時候節(jié)能成為一個非常強的驅(qū)動力,也是一個非常大的痛點。
基于這些痛點我們怎么思考?華為公司的團隊構(gòu)建了一個I立方,智能化電源、智能化制冷、智能化管理這三個I組成了I立方,保證它的可靠性運營。在這個架構(gòu)下面,左邊是數(shù)據(jù)中心的架構(gòu),右邊是價值,左邊的架構(gòu)會產(chǎn)生右邊的數(shù)字化、網(wǎng)絡化、智能化的價值。當然模塊化一直以來大家講得比較多,模塊化可以解決快速業(yè)務上線的痛點和標準化品質(zhì)保障的痛點。數(shù)字化可以讓我的數(shù)據(jù)中心所有的狀態(tài)非常精確地被發(fā)現(xiàn)、被感知。網(wǎng)絡化就是我有非常多的數(shù)據(jù)中心豐富在各個區(qū)域的時候,這時候我需要一張網(wǎng)把它給連起來,進行中心的管控。智能化就是通過大數(shù)據(jù)的分析,我長時間運營經(jīng)驗的積累,積累到一定程度以后,我要產(chǎn)生判斷,這時候要指導人,我將來經(jīng)營的方向往哪里走,這時候需要系統(tǒng)對我提出建議來。這是我們的架構(gòu)、理念???????及依托的價值。
當然我們用望遠鏡看我們的理想,看我們的未來,但是我們要用顯微鏡看我們的實現(xiàn),一定要體察入微,保證我們具體的實現(xiàn)能支撐我們未來的理想和遠大的前景。
下面我講我們的三個I在解決方案上的實現(xiàn),智能化持續(xù)的創(chuàng)新實踐,給我們的客戶帶來的什么樣的價值。這里只是講一些例子。
第一iPower,大家知道電源是數(shù)據(jù)中心最危險的因素之一,有可能起火,所以我們有一個iPower的供電系統(tǒng),從被動的事后處理,已經(jīng)燃燒了,已經(jīng)出現(xiàn)問題再去處理,變成主動預防,趨勢甚至我有一種預測型的處理,這里就有三個方面:第一,早發(fā)現(xiàn)。早發(fā)現(xiàn)用什么來支撐?這就用數(shù)字化,我把所有的能量危險的部分,用數(shù)字化的傳感器給提取出來,讓我能看到。比如說能量危險的部件,要爆炸的電容,要燃燒的電池,要起火的開關,導致過熱的風扇,這些部件都通過數(shù)字化的信號報上來,把它注入數(shù)字化的信息,這樣我就可以提前發(fā)現(xiàn),發(fā)現(xiàn)以后通過告警信號的分析和整理,實現(xiàn)精確的定位,為什么說早定位,因為在告警里,往往一個告警源可能觸發(fā)一系列的告警,因為告警可能會有關聯(lián),這時候就需要我們智能化的系統(tǒng)對它進行去相關的???????析,精確定位到我的故障源,盡早隔離,進行處理,保證我系統(tǒng)的可靠性運行。
除了數(shù)字化,iPower進行可靠性的加固,在其他基礎設施方面我們也有其他的方面,比如說制冷方面,就是說我制冷的空調(diào)設備可能性能已經(jīng)下降得很多,馬上到了你的宕機的臨界點,我還不知道,等到過熱以后再去處理,這時候就會帶來問題,所以我通過智能化提前預知它,比如說有泄露了,它泄露到80%的時候我就知道這個泄露很危險,我要做及時的處理,這時候我有一個處理問題的個解決方案,這就是智能化帶來的可靠性的加固,因為可靠性有基本的可靠性,我把它叫加固的可靠性,由智能化帶來加固的可靠性。
下面再講另外一個創(chuàng)新。在數(shù)據(jù)中心領域創(chuàng)新花樣最多的就在于制冷和節(jié)能,但是我們看看在前些年,我們(英文),中國在西南、內(nèi)蒙古、寧夏,這些自然能源比較豐富的區(qū)域,大家布置了很多的數(shù)據(jù)中心,但是有一個問題,這種自然的冷源和低廉的電價是可遇不可求的及因為我們繞不過去一個坎,就是我靠近客戶的這種最強烈的需求,就是說北上廣深一線城市,剛才萬國的專家講,他們的節(jié)點就在北上深成,靠近客戶是非常高興的需求,這是繞不過去的,自然冷源可遇不可求,在北上廣深這些地方?jīng)]有自然冷源,這時候我們該怎么辦,制冷沒了,我們就要從制冷變成智冷。第一個制冷是制造冷,第二是,智能的控制冷源。
大家知道現(xiàn)在國內(nèi)很多數(shù)據(jù)中心的制冷控制都是有BAM這些系統(tǒng)來控制它在里面的算法經(jīng)常是恒定不變的,或者過了一段時間由我們的運維人員進行臨時的調(diào)優(yōu),但是它一直都是一種半固定式的算法,固定在當中的。但是我們應用的環(huán)境是千差萬別,能調(diào)優(yōu)的專家也是可遇不可求,能號脈的老中醫(yī)總是非常稀缺的資源,這時候需要我們的智能系統(tǒng)對我們的氣流管理、液體流管理、冷源的管理,對室內(nèi)、室外,以及跟IT之間產(chǎn)生一種互動,產(chǎn)生化學反應,然后進一步產(chǎn)生節(jié)能。
我們有一個實踐,大家可以看一下,在廊坊的企業(yè)數(shù)據(jù)中心,我們由于采用了iCooling的智能算法,在我們進行手動調(diào)優(yōu)以后,又進一步下降了節(jié)能了100%以上,這個數(shù)據(jù)是非常嚇人的,為什么?因為我們對于數(shù)據(jù)中心而言,節(jié)省下來的錢是純利潤,這會讓您的企業(yè)財務狀況得到極大的優(yōu)化,我們已經(jīng)實現(xiàn)了。講故事的人很多,但是實踐必須得有人先去實踐,華為公司也講概念、理念,但是我們更注重踐行這些理念,在我們自己企業(yè)的數(shù)據(jù)中心踐行這些理念,在我的客戶當中也采用了這些最先進的控制理念,iCooling,能夠帶來實實在在的收益。
還有一點,華為公司除了能做機電的這部分,我這個業(yè)務是比較小的業(yè)務,更大的業(yè)務是我們的IT,跟微軟還有戰(zhàn)略合作,我們懂IT,數(shù)據(jù)中心里有一個指標叫PUE,PUE永遠是大于1的,1.X,我們所有的采用的可能是降了后面的X,但是我們可能會在講PUE,漏掉E,就是我們服務器和IT的能耗,我們有一個2012實驗室,我們進行深度的研究,我們發(fā)現(xiàn)你在服務器處理業(yè)務????強比較低的時候可以把頻率調(diào)下來,而頻率調(diào)下來以后功率會下來,這樣我就可以實現(xiàn)我的IT負載,跟我的能源設備之間的互動,這樣更進一步,在PUE里面除了降PUE后面的X,還降前面的1,這些直接反映在我們的財務報表里。
最后講一下我們數(shù)據(jù)中心的智能的大腦。以前一直有有人和無人之爭,我覺得現(xiàn)在可以把這個擱置下來,因為人工智能都已經(jīng)來了,不可能我們的數(shù)據(jù)機房還靠賣人的方式來經(jīng)營和運作,所以我們未來發(fā)展的趨勢必然是人工智能逐步地代替很多的人類重復的工作。首先就是替代人,第二個層面是指導人,第三個層面就是超越人。這三方面我們都做了一些實踐。
替代人:其實我在剛開始也講了,我們在發(fā)現(xiàn)問題,或者是巡檢的過程當中靠人去,人的感知就是眼、耳、口、鼻、身,它感知不了紅外發(fā)熱的東西,但是我的數(shù)字傳感器可以發(fā)現(xiàn),它不但替代它,還超越它,發(fā)現(xiàn)了更多。當然現(xiàn)在嗅覺替代不了,但是觸覺可以替代。這是我們在替代人方面的實踐。
指導人:什么叫指導人?今年有一個故事,數(shù)據(jù)中心宕機了,宕機的原因是巡檢人員有一個巡檢任務,說要巡檢某個設備,它有工作單,他自己簽了字沒有去,所以說你是不可控制的,人總是有不可控的,但是對于指導人的系統(tǒng)而言,我對我的數(shù)據(jù)中心有一個全盤的規(guī)劃,對我的巡檢路徑有一個明確的指導,我在每一個點上有電子大卡、拍照上傳,確保我巡檢人員被我的系統(tǒng)所管理,是可控的。
超越人:這里面主要講一下資產(chǎn)管理,華為公司如果有一千臺機柜的資產(chǎn)盤點的話,我們可能要盤點十幾天,要很多人盤點十幾天,而且資產(chǎn)盤點有個問題,因為IT的資產(chǎn)總是動態(tài)的,會變化,會變更,會替代,你可能前天盤點完到底哪個時間點作為你資產(chǎn)管理的一個時間呢?這時候我們管理系統(tǒng)提供了這種功能,它可以一鍵式對我的所有資產(chǎn)進行盤點,在庫的???????在運行的,或者是馬上過保的,可以一目了然幫助我們經(jīng)營。
當然我們在智能化的過程當中遇到一個最大的問題就是安全問題,剛才李書記也講,可能會受到外來的威脅,當然有幾個案例,這個案例沒有時間展開了,但是就是說對智能系統(tǒng)進行加強的控制,加強的管理。
最后我們實踐的成果。所有的這些細節(jié)加起來,就是我們實現(xiàn)了PUE下降,人均運維從每個人維護140個到210個,投資回收期下降到4.5年,SpUE就是空間利用率節(jié)省了10%,預測試和預配置建設時間下降了50%,就是快速上線,能讓我們的業(yè)務快速進入狀態(tài)。
我今天的分享到這兒,這些只是我們初步的圍殲,未來我們會走得很遠,華為公司會持續(xù)地投下去,帶來產(chǎn)業(yè)的升級。謝謝大家!

