華為助力某大學超算云計算中心解決方案
一、 客戶背景
某大學云計算產(chǎn)業(yè)園依托學校科研力量,整合校內(nèi)學科資源,建設技術開發(fā)平臺,引導科研資源向大數(shù)據(jù)應用方向傾斜,云計算產(chǎn)業(yè)園運營的業(yè)務范圍覆蓋云計算、超級計算、空間信息、移動互聯(lián)網(wǎng)等領域,將為政府部門及企業(yè)用戶提供廣泛的數(shù)據(jù)與基礎設施服務。
其中,云計算中心依托高速互聯(lián)網(wǎng)接入和大規(guī)模網(wǎng)絡互聯(lián),采用最新的云計算技術,依托超級計算中心的強大基礎設施,為云應用的發(fā)布、托管和云服務支撐提供前后端一體化的支持,通過對計算機硬件資源的虛擬化和靈活調(diào)度,面向企事業(yè)單位提供彈性云計算服務,根據(jù)不同用戶的個性化需求定制解決方案及服務模式。超級計算中心的計算能力高達1170萬億次/秒,是某地區(qū)最大的超算中心,在全國區(qū)域超算中心中僅次于上海超算中心,能夠滿足海量數(shù)據(jù)處理需求,為科研和高端裝備制造、生物制藥、動漫與影視渲染、高分辨率遙感應用等用戶提供快捷、優(yōu)質的計算服務。空間信息中心將為現(xiàn)代農(nóng)業(yè)、防災減災、資源環(huán)境、公共安全、城市精細化管理等關系國計民生的領域提供數(shù)據(jù)服務、數(shù)據(jù)加工、咨詢報告以及解決方案等。移動互聯(lián)網(wǎng)借助一站式運營支撐系統(tǒng),使開發(fā)者與行業(yè)用戶得到移動應用的運營支持,實現(xiàn)電子商務的精準營銷以及移動政務、商務信息的聚合、分析和服務等目標。與此同時,云計算產(chǎn)業(yè)園還具備國家級數(shù)據(jù)基礎設施,提供高強度的網(wǎng)絡安全環(huán)境,安全設施符合國家信息安全等級保護五級標準,能夠提供專業(yè)的網(wǎng)絡安全、信息安全與數(shù)據(jù)安全保障體系,并提供全方位的基礎設施服務,可以實現(xiàn)主機托管、主機租賃以及帶寬租賃服務。
二、解決方案
方案按照“一個云數(shù)據(jù)中心,多個業(yè)務集群資源復用”的架構原則建設,統(tǒng)一設計基礎設施資源,數(shù)據(jù)中心按照綠色模塊化架構設計。項目一期建設擬先建設統(tǒng)一的云計算平臺以及數(shù)據(jù)中心網(wǎng)絡、存儲等部分。
總體方案的核心設計思路為:“融合”、“分層”、“分區(qū)”:
融合:為了簡化運維,真正地實現(xiàn)統(tǒng)一、高效、靈活地使用超算及云計算中心的IT基礎設施資源,方案中采用“一個云管理平臺”的方式,利用華為RH2288 V2和RH5885服務器承載超算業(yè)務以及云計算業(yè)務,整個數(shù)據(jù)中心可以實現(xiàn)平滑擴容,靈活地對物理資源與云計算虛擬資源實現(xiàn)統(tǒng)一管理與調(diào)度。
分層:在IT基礎設施實現(xiàn)融合的基礎上,分層架構云計算服務平臺,超算服務平臺,作為其上各種業(yè)務應用構建的支撐。網(wǎng)絡上,將數(shù)據(jù)中心網(wǎng)絡設計中分為核心層與接入層,實現(xiàn)扁平的二層網(wǎng)絡架構。
分區(qū):根據(jù)數(shù)據(jù)中心不同業(yè)務功能區(qū)域的隔離需求,將數(shù)據(jù)中心網(wǎng)絡分成多個業(yè)務區(qū)域,各業(yè)務區(qū)域之間通過相應技術實現(xiàn)網(wǎng)絡邏輯隔離;根據(jù)數(shù)據(jù)中心網(wǎng)絡高效交換的需求,將數(shù)據(jù)中心存儲網(wǎng)絡和業(yè)務網(wǎng)絡分離,保證業(yè)務數(shù)據(jù)與存儲數(shù)據(jù)之間互不影響。
采用了虛擬化技術,云平臺的管理系統(tǒng)與計算資源和存儲資源需要在內(nèi)交換大量的管理和監(jiān)控數(shù)據(jù);虛擬機需要掛載存儲池的存儲資源,也需要海量的數(shù)據(jù)在數(shù)據(jù)中心網(wǎng)內(nèi)傳輸;同時,網(wǎng)內(nèi)還要傳輸虛擬機的業(yè)務數(shù)據(jù),為了更好地支持這三類業(yè)務數(shù)據(jù)的傳輸,在數(shù)據(jù)中心內(nèi)部將網(wǎng)絡劃分管理、業(yè)務、存儲三個平面,三個網(wǎng)絡平面相互隔離,互不影響。
業(yè)務平面:用來承載用戶端到數(shù)據(jù)中心各個業(yè)務應用系統(tǒng)的流量以及數(shù)據(jù)中心內(nèi)部云主機之間的流量,業(yè)務平面按照業(yè)務類別的需求進一步劃分為不同的業(yè)務服務區(qū)。
管理平面:用來承載數(shù)據(jù)中心網(wǎng)絡、服務器、存儲及安全等設備之間的管理數(shù)據(jù)、指令操作數(shù)據(jù)以及云計算系統(tǒng)的維護和監(jiān)控數(shù)據(jù)。管理平面與業(yè)務平面共用核心層交換劑,通過VLAN實現(xiàn)兩個平面的隔離。
存儲平面:用來承載計算子系統(tǒng)和存儲子系統(tǒng)之間的存儲流量。存儲平面網(wǎng)絡是一個獨立的隔離網(wǎng)絡,保證存儲網(wǎng)絡的服務質量和安全。
根據(jù)上述設計思路,將數(shù)據(jù)中心網(wǎng)絡內(nèi)部交換網(wǎng)絡劃分為核心與接入2個層次,按照網(wǎng)絡功能的不同劃分為外聯(lián)區(qū)、網(wǎng)絡服務區(qū)、業(yè)務服務區(qū)等多個功能區(qū)。同時,為更好的支持云計算在數(shù)據(jù)中心的運行管理,將網(wǎng)絡分為管理、存儲、業(yè)務3個網(wǎng)絡平面。
本項目建議的整體網(wǎng)絡結構可分為:外聯(lián)層、核心網(wǎng)絡區(qū)、接入網(wǎng)絡區(qū)、云計算業(yè)務區(qū)、管理區(qū)、超算業(yè)務區(qū),以及存儲區(qū)。
方案優(yōu)點:
一個數(shù)據(jù)中心、支持多種業(yè)務平臺;
數(shù)據(jù)中心統(tǒng)一運維:數(shù)據(jù)中心的設備進行統(tǒng)一管理、統(tǒng)一運維;
虛擬化:架構開放、先進,支持高性能CPU/內(nèi)存/存儲/網(wǎng)絡虛擬化,Qos保證,高安全性和高穩(wěn)定性;
標準化:接口標準化,支持計費、維護管理、設備集成、運營支撐、能力API;流程標準化,支持IT管理、維護管理、業(yè)務管理、安全管理、網(wǎng)絡管理的標準流程;
自動化:支持端到端的自動化部署;支持自動化管理維護;支持自助運營服務;
智能化:支持彈性資源調(diào)度與分配,支持靈活系統(tǒng)與業(yè)務部署,支持實時環(huán)境監(jiān)控與報警,持動態(tài)負載均衡與節(jié)能;
超算中心:支持多種類型的并行任務、支持靈活多樣的調(diào)度策略、支持靈活方便的節(jié)點管理、支持自定義的應用業(yè)務流程、提供通用的作業(yè)管理和調(diào)度平臺、高可用性、高并發(fā)性;
SLA: 創(chuàng)新、智能的服務建模,可提供面向基礎架構、應用程序性能管理、工作負荷、安全、合規(guī)和服務臺管理,提供高可靠性SLA;
網(wǎng)絡設備:采用數(shù)據(jù)中心級交換機,保障數(shù)據(jù)中心網(wǎng)絡高可靠性;
數(shù)據(jù)高可靠性:存儲采用高端NAS集群,支持多節(jié)點負載均衡,保證存儲高IO、高帶寬,同時保證業(yè)務連續(xù)性,高可用性;
高安全性:華為云解決方案采用端管云協(xié)同,從接入側安全、網(wǎng)絡安全、云平臺安全、數(shù)據(jù)安全到管理安全,多層次安全保障設計,以預防為主,監(jiān)控與審計為輔,全方位保障數(shù)據(jù)中心安全;
易于管理:提供方便的UI管理界面,具備較強的自發(fā)現(xiàn)、自部署、自服務、自管理、自恢復、自優(yōu)化能力;
可運營:云計算資源可運營,提供客戶自助服務、自助管理;
靈活擴展:華為云計算的系統(tǒng)能力支持超大規(guī)模的用戶容量需求,完全能夠滿足未來云數(shù)據(jù)中心發(fā)展需求。后續(xù)根據(jù)業(yè)務需要實現(xiàn)彈性擴容、按需擴容,不影響已有業(yè)務的連續(xù)性;
高效的維護能力:系統(tǒng)支持高效的問題定位能力,縮短問題恢復時間;
網(wǎng)絡平面隔離:在數(shù)據(jù)中心內(nèi)部將網(wǎng)絡劃分管理、業(yè)務、存儲三個平面,三個網(wǎng)絡平面相互隔離,互不影響。
網(wǎng)絡高可靠性:網(wǎng)絡設備均采用集群或堆疊,網(wǎng)絡鏈路全部冗余鏈路或負荷分擔,存儲采用多路徑方式訪問,保證網(wǎng)絡鏈路高可用性;
開放性:提供開放的APIs,可供與第三方系統(tǒng)進行對接;
高可交付性:華為具有大規(guī)模批量項目交付經(jīng)驗,可以幫助企業(yè)快速部署云業(yè)務、超算以及數(shù)據(jù)中心解決方案;
成本效益與性能:動態(tài)計算能力調(diào)整,可以根據(jù)管理策略對應用進行監(jiān)控及伸縮,降低維護成本,節(jié)能減排;
定制開發(fā):完全自主知識產(chǎn)品,掌握核心技術,定制開發(fā)能力強,可以快速響應客戶需求。

拓撲說明:
外聯(lián)層
外聯(lián)層主要用于數(shù)據(jù)中心與多個互聯(lián)網(wǎng)運營商和專網(wǎng)網(wǎng)絡互聯(lián),為數(shù)據(jù)中心提供高速的互聯(lián)出口鏈路,實現(xiàn)數(shù)據(jù)中心與互聯(lián)網(wǎng)及專網(wǎng)之間的互通。出口路由器通過運營商鏈路接入多家的運營商網(wǎng)絡,以及專網(wǎng)網(wǎng)絡,提高鏈路的可靠性保護。同時,在該層部署高端防火墻,防火墻建議同時具備流量清洗功能,可以在數(shù)據(jù)中心遭受到DDoS攻擊時候提供防護,為數(shù)據(jù)中心整體提供第一層的安全防護。
核心網(wǎng)絡區(qū)
核心網(wǎng)絡層是連接整個數(shù)據(jù)中心各區(qū)域的橋梁樞紐,承擔著內(nèi)部數(shù)據(jù)流量和對外數(shù)據(jù)流量的轉發(fā)。
由于本項目為云計算及超算,則該核心網(wǎng)絡設備必須支持IETF標準協(xié)議TRILL(Transparent Interconnection of Lots of Links),支持10GE的核心交換組網(wǎng);構建超過500個節(jié)點的超大規(guī)模二層網(wǎng)絡,支持用戶業(yè)務靈活部署,支持云計算虛擬機大范圍遷移。
由于是大二層網(wǎng)絡結構,該區(qū)域是各個應用業(yè)務網(wǎng)關節(jié)點,且是各業(yè)務數(shù)據(jù)內(nèi)部外部的交換節(jié)點,該區(qū)域部署安全檢測、分析、防護設備有天然優(yōu)勢,對各業(yè)務應用起到第二層的安全防護。
運維區(qū)
該區(qū)域部署大部分的安全設備,如遠程安全接入、漏洞掃描、入侵檢測、審計系統(tǒng)等,為整網(wǎng)的業(yè)務提供安全的檢測、分析、防護與遠程安全接入功能。
接入網(wǎng)絡區(qū)
接入網(wǎng)絡區(qū)提供是為各種設備提供網(wǎng)絡接入服務,各種設備通過接入網(wǎng)絡設備提供大量的網(wǎng)絡接口,進行數(shù)據(jù)的通信。接入網(wǎng)絡設備與核心網(wǎng)絡設備間通過一定收斂比的鏈路進行互聯(lián),為計算、存儲等設備提供更大范圍的數(shù)據(jù)交換服務。
云計算業(yè)務區(qū)
云計算業(yè)務區(qū)采用華為RH2288 V2和RH5885服務器,該區(qū)域通過FusionSphere云化(虛擬化)技術進行資源池化,形成計算資源池。
云計算資源池按需生成的虛擬化主機。云主機可象傳統(tǒng)主機一樣工作,同時具備更高的彈性資源使用能力、擴展能力、遷移能力,具備更靈活配置和快速部署能力。
管理區(qū)
管理區(qū)包括運維管理和安全管理兩部分,管理區(qū)的這兩部分通過VLAN進行安全隔離,三層互通。
運維管理區(qū)主要職責是對數(shù)據(jù)中心中包括路由器、交換機、防火墻、服務器、存儲、云計算資源,以及各種應用軟件等系統(tǒng)進行統(tǒng)一管理與監(jiān)控。運維管理區(qū)部署與運維管理、監(jiān)控等相關的服務器、控制主機、運維客戶端等運維設備,以及ManageOne統(tǒng)一運營運維管理軟件; 連接操作、管理數(shù)據(jù)中心內(nèi)部所有主機、服務器、網(wǎng)絡設備、存儲設備等控制臺、監(jiān)控機等。
安全管理區(qū)主要職責是對數(shù)據(jù)中心內(nèi)部的網(wǎng)絡、主機、系統(tǒng)、云計算資源和應用等設施進行統(tǒng)一管理與監(jiān)控。安全管理區(qū)部署安全管理系統(tǒng)的服務器和系統(tǒng),如補丁分發(fā)系統(tǒng)、網(wǎng)絡防病毒系統(tǒng)、網(wǎng)頁防篡改系統(tǒng)、主機防護系統(tǒng),以及安全設備的監(jiān)控臺等。實現(xiàn)對網(wǎng)絡、安全、設備、系統(tǒng)、應用、數(shù)據(jù)等的管理維護。
超算區(qū)(暫不建設)
以物理基礎設施的方式為超算服務平臺提供計算資源,采用多個10GE光纖到CE12800核心交換區(qū),管理納入到數(shù)據(jù)中統(tǒng)一管理平臺ManageOne。
存儲區(qū)
數(shù)據(jù)中心的存儲資源主要包括DSware分布式存儲資源池和NAS存儲。DSware分布式存儲資源池、NAS存儲主要為數(shù)據(jù)中心內(nèi)部的業(yè)務應用以及數(shù)據(jù)備份提供存儲資源。
DSware分布式存儲資源池使用數(shù)據(jù)中心內(nèi)部的存儲網(wǎng)絡平面?zhèn)魉痛鎯?shù)據(jù),網(wǎng)絡的存儲平面與業(yè)務平面物理隔離,保證存儲數(shù)據(jù)傳送的質量。NAS存儲使用數(shù)據(jù)中心內(nèi)部的業(yè)務平面網(wǎng)絡傳送存儲數(shù)據(jù),通過CIFS、NFS標準協(xié)議向數(shù)據(jù)中心內(nèi)部服務器提供存儲資源。
三、 客戶價值
某大學超算云計算中心的的建成將對遼沈地區(qū)科技基礎設施建設、戰(zhàn)略新興產(chǎn)業(yè)培育、高科技產(chǎn)業(yè)集群發(fā)展發(fā)揮帶動、引領作用,為沈陽市建設“兩化融合” 實驗區(qū)、走以信息化帶動工業(yè)化的新型工業(yè)化道路作出貢獻。