數據中心承載著大量的應用業務,每逢重大節日或者訪問洪峰的到來都需要做各種保障,以防出現突發事件,對應用造成影響。比如:互聯網電商的雙11大促銷,高中考網站的報名,APEC等重要事件等等,這些事件有的是時間節點特別重要,盡量不要出問題,有的是訪問數據中心流量壓力特別大,盡量不要出問題。所以一年時間下來,數據中心需要保障的大大小小事件的確不少,而且每次服務保障任務側重點也有不同,如何做好這些保障工作,考驗著數據中心的運維服務能力水平。本文著重介紹做數據中心服務保障工作需要依據五個原則,下面將逐條講述一些原則,通過這些原則將服務保障工作做好。
首先,數據中心要對每次需要保障的業務弄得清清楚楚,抓住痛點,解決痛點。如果是大型的節假日,這時考驗的是數據中心整體業務的穩定性,尤其是節假日哪些應用訪問量會增大,要提前做預案,根據往年積累的經驗積極應對。如果往年系統出現了這樣那樣的問題,一定在這次的服務保障之前消除掉隱患。如果是電商促銷,就要關注集中時間內訪問用戶的數量,模擬大規模數量的訪問用戶,看系統是否可以承受,這時就要關注計算、帶寬這些資源是否足夠,可能不足的地方要及時補全。一個數據中心可能承載了數百個甚至上千各種應用,要明確哪些是需要服務故障的,哪些是重要的,哪些是次要的,應用的重要性要有分級。在不同的活動中,不同的應用重要性是有變化的,要及時進行調整,將重要力量投入到關鍵節點的保障上來。
其次,數據中心的設計和運維的人員要坐到一起,共同討論保障事宜。業務運維的人要深入理解數據中心的系統架構,從全局的視角去對待服務保障工作。數據中心的規模和應用有大有小,投入上必要有差異。如果一個數據中心僅有數十臺的服務器和小型網絡設備,沒有必要對整體服務保障大動干戈,準備一些備用端口和設備,萬一關鍵時刻出了問題,及時恢復業務就可以了,不需要將過多的資源和精力投入到服務保障上來。數據中心做服務保障也要綜合考慮,資金和人力也是需要衡量的重要方便,要用最少的投入得到最好的效果。掌握整體架構,對服務保障非常重要,避免各種應急方案在關鍵時刻失效,要盡可能將可能的突發情況考慮完全。數據中心要建立實時的監控體系,建設服務依賴的降級系統,建設具有冗余能力的架構體系,從整體架構層面做服務保障,這樣可以避免將精力投入到某個特定環節中,而忽略了整體,而且架構層面一定具有冗余性,以便在出現突發情況時,有備份方案可選,將應用切割到備用系統上來,避免出現應用中斷的情況。如果在服務保障期間,仍出現了較嚴重的應用中斷事件,那服務保障工作就是徹底的失敗。
第三,要豐富服務保障工具,現在的數據中心應用業務越來越復雜,簡單地靠PING、TRACERT等命令有時也很難判斷問題,尤其是應用層面的問題,所以有必要引入一些排查和監控的工具。正所謂“巧婦難為無米之炊”,工欲做其事,必先利其器,手上需要有一些獨門“暗器”,在關鍵時候能發揮效用。現在工具已經從純手工,經歷工具化、系統化,直至容器化和彈性調度上,什么Scribe、Wtool等免費監控的管理工具都可以派上用場,要善于使用這些工具,通過這些工具對數據中心運行各種數據參數進行分析,服務保障才更有效。
第四,要關注新技術。每一次的服務保障都是發現數據中心隱患和弱點的最好時機,有時甚至要在服務保障之前做演練,以便能提前暴露隱患,及時進行糾正。當遇到一些困難時,要看是否有些新技術可以很好解決。現在數據中心的技術更新換代很快,這些新技術都是應對數據中心發展過程中遇到的新情況,當自己的數據中心也遇到這些問題時不妨考慮引入一些新技術解決問題。數據中心是當今信息技術發展的寫照,不能墨守陳規,需改變的時候就是要做出改變。引進新的技術,不僅讓自己的數據中心有耳目一新的感覺,也可以提升數據中心的應用處理能力。當然,引入這些新技術時也要保留謹慎,特別新的不成熟的技術要充分考慮引入風險,是否適得其反。在引入新技術的道路上,不能一下子步子邁得太大,要小碎步地快速向前跑,最終利用新技術的優勢解決數據中心面臨的各種問題。
最后,數據中心要做服務保障需要投入大量人力,有時單靠數據中心自己有些力不從心,畢竟有很多系統和設備都不是數據中心運維的人員所能掌握的,這時可以按照事情的重要性,請一些專門提供第三方服務的專業公司人員來數據中心做服務保障。這些服務公司有著豐富的服務保障經驗,將任務交由這些公司來做,花錢省心,而且萬一出了什么差錯,還可以獲得一些補償。數據中心還可以將系統或設備廠商的人請來做服務保障,數據中心每年采購大量的設備,有時還會購買原廠人員服務,這些在服務保障時都可以用上。所做這些雖然投入的資金和人力會多一些,但在應對突發事情的處理能力上將大為提高。數據中心應該將各種內外部資源都充分利用上,做好服務保障工作。
以上介紹的是數據中心服務保障的五個原則,依據這五個原則指導服務保障的實際工作,將大大提升服務保障的質量。數據中心上的應用在特定時段特別重要,關鍵時刻不能掉鏈子,必須依仗這五個原則,切實做好服務保障工作。
所有的金融機構都進行資金的搬運。數千億美元的各國貨幣每天每時每刻都在通過網絡流動于各個商業銀行、投資公司、證券公司和保險公司之間。銀行只要掉線幾秒鐘,數百萬就能因為丟失的交易從您的資產負債表中消失。由此可見,數據中心對金融行業尤為重要。
一般金融行業數據中心承載金融機構的核心業務,不允許任何原因的中斷,一般按照國標A級標準建設,以保證即使在異常故障情況下,數據中心也能正常工作,核心業務不受影響。
數據中心機房基礎設施建設是一個系統工程,主要包括以下幾大系統:建筑裝修系統、動力配電系統、空調新風系統、防雷接地系統、監控管理系統、機柜微環境系統、消防報警系統、綜合布線系統等八大部分。
一、建筑裝修系統
是整個機房的基礎,它主要起著功能區劃分的作用。根據用戶的需求和設備特點,一般可以將機房區域分隔為主機房區域和輔助工作間區域,主機房為放置機架、服務器等設備預留空間,輔助工作間包括光纖室、電源室、控制室、空調室、操作間等,為主機房提供服務的空間。此外,數據中心機房裝修需要鋪抗靜電地板、安裝微孔回風吊頂等,確保機房氣密性好、不起塵、消防、防靜電、保溫等,為工作人員提供良好的工作條件,同時也為機房設備提供維護保障功能。
二、供配電系統
愛譜華頓微模塊數據中心采用雙路市電接入和專用柴油發電機系統作為備用電源系統,通過ATS自動切換開關進行切換,為數據中心內UPS、機房空調、照明等設備提供高冗余供電。供配電系統采用雙母線供電系統,配置兩套獨立UPS供電系統及后端配電系統,在任一套供電母線需要維護或故障等無法正常供電的情況下,另一套供電母線仍能承擔所有負載,保證機房正常供電。
機房內部配電采用PDM-PDU的分布式配電方式,從UPS輸出分配只各機柜池的列頭配電模塊,再有列配電模塊分配給池級內的各臺機柜供電,提高配電系統的擴展性和易管理性。
此外,機房內的電氣施工應選擇優質電纜、線槽和插座。插座應分為市電、UPS及主要設備專用的防水插座,并注明易區別的標志。照明應選擇機房專用的無眩光高級燈具。
三、空調制冷系統
由于數據中心機房里高密度存放著大量網絡和計算機設備,不僅產生大量的集中熱量,這就對空調系統提出了更高的要求。
愛譜華頓微模塊數據中心采用密閉冷/熱通道技術,隔離冷熱氣流,消除局部熱點,大幅降低能耗;針對高密場景,采用行式空調實現近端制冷,顯著提升制冷效率;與傳統數據中心相比減少30%~50%的能耗,模塊級PUE最低可達1.4。
保證設備的可靠運行,需要機房保持一定的溫度和濕度。機房密閉后光有空調是不夠的,還必須補充新風,形成內部循環。此外,它還必須控制整個機房里塵埃的數量,對新風進行過濾,使之達到一定的凈化要求。
四、防雷接地系統
機房雷電分為直擊雷和感應雷,對直擊雷的防護主要由建筑物所裝的避雷針完成,機房的防雷(包括機房電源系統和弱電信息系統防雷)工作主要是防感應雷引起的雷電浪涌和其它原因引起的過電壓。機房接地系統是否良好是衡量一個機房建設質量的關鍵性問題之一,機房一般具有交流工作地、安全保護地、直流工作地和防雷保護地四種接地方式,機房接地采用綜合接地方案,綜合接地電阻應小于1歐姆。
五、監控管理系統
機房控制室,要求以最少的維護人員,運用最優化的運營維護手段,來實時監控每一個機房中設備所處的物理環境。數據中心需要對電源、空調等設備運行狀態進行管理,同時還需要對機柜微環境,如溫濕度、漏水、煙感等參量進行監控,確保數據中心工作在一個正常的范圍之內。
愛譜華頓模塊化數據中心可監控機柜池級的溫度、濕度、漏水、煙感、潔凈度等各種環境參數,對數據中心設備運行參數和環境量實時監控和管理,同時配有功能強大的管理軟件,具有設備生命周期管理、設備故障預警、故障應急響應等功能,實現遠程監控和管理。可以統一集成到IT系統管理軟件平臺下監控,實現機房基礎設施與IT系統的智能化綜合控制管理。
六、機柜微環境系統
機柜微環境是IT設備真正的運行環境。機房建設中要充分考慮為每一個機架設置最優化的電源、配電、溫度監測制、線纜管理,將機架、制冷、電源、管理與維護集成為一個整體解決方案,為機柜中的IT設備提供可靠運行的微環境。
以機柜群組為單位分區建設。將機柜面對面、背對背布置,機柜排之間做通道封閉處理,在機房內形成冷熱隔離的風道,將水平送風的行間空調穿插在機柜排中布置,實現機房的高效制冷、節能降耗。
七、消防報警系統
愛譜華頓微模塊數據中心具有超強環境適應力,寬電壓、寬溫度、寬負載條件下穩定運行電池溫度檢測預警,防起火,負載斷電率降低50%;支持云告警、交互式語音告警、監控軟件告警、微信告警等,讓您第一時間收到安全告警。
本系統自帶消防系統解決方案,采用七氟丙烷火探式直接滅火系統,無人值守、無電啟動、精確滅火、節省空間。
八、綜合布線系統
按照現行的國際最高標準要求,我們建議金融機構數據中心采用六類UTP雙絞線和多模光纜布線系統,使傳輸速度可達到千兆。在機房重地應該較多采用阻燃線纜、屏蔽線纜等。
為保證機房整體美觀清潔,采用隱蔽的下走線方式,同時也考慮到后期維護的方便性,采用網絡列頭柜到每一臺設備機柜配線架管理。同時色彩化、模塊化、標簽化管理,跳線、模塊的顏色種類能滿足需求,以方便管理、維護。 |