在進行網絡機房改造方案之前,很多地方都需要考慮到,首先要考慮到機房里的布線,防靜電地板,空調,機柜間距,建議LZ可以去了解下網絡機房方案,下面是機房建設和改造方案上都有詳細的介紹。
隨著IT技術的不斷發展,IT設備的運行環境要求越來越高,更新換代的速率也越來越快。其中作為IT系統運行的載體——數據中心,需要持續適應不斷提升的運行環境要求。
由于數據中心作為一個建筑,生命周期遠遠大于IT設備,因此許多數據中心在投產8-10年后,就需要進行改造以適應新一代IT設備的運行環境。本文主要對投產中數據中心機房在線改造類項目的建設難點進行了研究,并針對該類項目的特點,提出在項目實施過程中的解決要點。
一、在線機房改造類項目的基本特點
1.1什么是在線機房改造
在線機房改造,指的是對已投入生產運行的機房進行改造,通常改造期間IT系統仍需要繼續提供服務,或者僅能在極短的關機時間內進行。改造目標一般包括機房環境優化、機房容量擴容,機房基礎環境設備更新等。
1.2在線機房改造項目的特點
工程建設,是一種將實物進行加工排列成交付物的項目,其特點是各子系統在現場物理縱橫交錯,由于在設計階段各子系統分頭設計,所以經常會導致現場子系統之間施工沖突,需要現場協調調整。而機房建設工程是一個綜合了電氣、暖通、綜合布線、裝飾裝修、環境監控、安防、消防等子系統的復雜工程項目,子系統繁多,現場施工環境復雜,各系統之間往往牽一發而動全身,某個子系統的調整將會涉及多個系統響應調整。一般來說,對新建機房工程,項目工期較為寬松,施工空間也較為寬裕,即使發生沖突,只需協調各系統建設方進行調整改道,大多都能夠解決沖突問題。
而在線機房改造項目則有其獨特的特點:
1)時間短:一般在實施在線機房改造工程時,機房內服務器往往都處于運行狀態,施工工期需要安排的盡可能緊湊,以改造對機房運行影響最小。而部分工程必須要進行停機改造的,也只能在極其有限的關機時間內進行。
2)勘查難:由于在線機房改造是在已建成的現有機房基礎上進行施工改造的,需要保留的管線與需要更新的管線縱橫交錯,更有許多管線藏在隱蔽工程中,無法勘查。許多工程在動工后破開裝修后卻又發現由于走線受到阻礙,無法按照原有方案進行實施,重新設計方案。
3)難回退:許多改造工程需要將原有工程設備及管線拆除用以讓出空間供新工程設備放置。大部分設備與管線一旦開始拆除,將無法再接回原系統使用。所以改造工程難以回退,只有用尋找其他后備方法以保證施工發生預期外的情況下,業務能夠持續運行。
4)風險大:改造工程通常施工區域緊靠機房,周邊布滿了生產和改造的線纜設備,施工過程中若出現操作不當、野蠻施工、保護措施不充分等,都將影響到正在運行的設備,甚至導致宕機,實施風險巨大。
由于在線機房改造項目難點繁多、風險極大,任意一個環節出問題都有可能導致施工無法順利完成,或是延期、或是影響業務開展。所以,企業在進行在線機房改造工程時,不僅要考慮施工安全,更因該從業務連續性的角度,為施工做好應急準備。
二、項目方案的規劃與設計
2.1項目需求分析
在線機房改造項目通常是由機房優化或擴容的需求觸發的項目,項目目標明確。但由于在投產中的機房進行改造,并非所有改造需求都具備可行性。需求分析需要從幾個角度展開:
1)施工窗口是否滿足:
從對服務影響的角度分,機房改造又分為三類,第一類是能夠完全形成與生產環境隔離的封閉施工區的改造工程,這類改造項目對生產運行影響相對較小,關注重點主要在施工本身;第二類是在生產環境現場進行改造,無法形成封閉施工區,但施工過程無需停機切換,對于這類工程在制定工程計劃安排時,應盡可能安排在業務空閑期進行;而第三類,則是切換類工程,這類工程在完工后必須安排系統切換,切換的過程機房必須停機,這類工程則必須詳細評估切換時間與關機窗口是否匹配。
2)物理資源是否滿足:
機房改造的物理資源包括:物理空間、運輸通道、電力資源、制冷資源、弱電資源、承重等級、消防要求、安防級別等。由于機房改造具體內容有各種各樣,但無論哪些改造都應該全面的評估物理資源的匹配性,這些評估應該直接深入細節,特別是新老更換類的改造,對于所有接口處,必須要詳細評估。
在許多改造中,線纜長度不足都會成為改造無法順利完成的罪魁禍首,或延長工期、或進行強行施工生拉硬拽,使得工藝不合規范,最后導致風險或事故。
3)經過改造后整體系統是否匹配:
由于機房的各子系統是整體設計的,在擴容類機房改造過程中,可能會出現新設備容量增加但配套資源卻無法匹配的現象。例如對UPS設備擴容后,上級開關及線纜不匹配,不能滿足設備滿載運行,或對冷凍水型空調增加了UPS供電,卻發現水泵和冷凍機無法增加后備電源等問題。因此,改造前必須考慮整體匹配性,并對相應周邊系統一同規劃,盡可能保證匹配性,否則改造效果事倍功半。
4)業務連續性預案是否滿足:
沒有一個項目能夠保證100%的成功率,尤其是在有限的時間內要完成風險極大的機房改造類項目。機房改造類項目作為一個計劃內的重大變更,必須要從業務連續性上做好相應的應急預案。當發生機房無法在如期完工或因為施工管理不慎導致設備宕機時,必須盡快啟用業務連續性應急預案,以保證業務服務不受到影響。這點往往需要整個公司IT部門乃至整個公司的一同配合,往往需要高層協調。因此,啟動在線機房改造工程時,必須要將可能的施工風險如實的向上級揭示,并做好充分的應急預案,這樣才能保證機房改造工程對于企業業務沒有影響。
2.2項目方案設計
在對項目可行性和需求進行了充分論證后,即可以開始對項目具體實施方案進行設計。對于在線機房改造項目來說,盡管改造具體的內容多種多樣,但由于均可能涉及機房安全運行,故在項目方案設計時,盡可能尊崇以下原則進行設計:
1)合理切分各子系統改造界面
在機房改造類項目中,項目邊界的切分對項目的成敗起著較為關鍵的作用。由于項目現場環境復雜,在圖紙上規劃的工作界面極有可能因施工條件惡劣,白白延長了施工工期,甚至在施工現場出現既定方案無法繼續實施,導致措手不及的情況。因此,在機房改造的項目工程中,決不能紙上談兵,必須圖紙結合現場制定改造方案,將各子系統的界面合理切分,使改造工作即能較為獨立快速進行,由能恰當的與原有系統對接。
2)項目方案選材等需因地制宜
對于不同的機房,由于現場情況不一樣,工期要求不一樣,改造難度不一樣,盡管可能改造目標相同,但最終選擇的方案、使用的材料、消耗的人工等,均會產生不同。機房改造施工最忌拿以往的施工經歷來生搬硬套制定新的項目方案。有些時候,為了提高施工的安全性和一次成功率,需要采用價格更為昂貴的工藝,例如銅管的風焊相對無縫鋼管的電焊一次成功率就較高,但使用銅管會大大增加改造成本。
3)盡可能縮短高風險的工作工期
在改造工程中,涉及在機房內進行動火、金屬切割,或新老系統接駁等工程內容,都屬于風險較高的工程內容。這些工程工期越長,對生產運行風險越大,因此,應該盡可能將這些工作工期縮短,并安排在業務低峰期進行,以確保對業務生產的影響盡可能最小化。
4)平衡改造效果與施工風險
很多時候,受到場地、施工窗口、施工風險等因素的制約,改造項目是無法選擇改造效果最優的方案,往往為了保證項目實施順利,需要作出一定妥協。因此,在改造方案設計時,要盡可能平衡施工風險與改造效果,在施工風險可控的范圍下,盡可能選擇改造效果較好的工程方案。如一味的選擇優質的改造效果,當實際施工發生風險時就難以挽回了。
2.3項目組織設計
與一般工程不同,在線機房改造工程由于可能造成企業業務影響,因此,項目在組織架構設計時,需要從工程實施、業務保障兩方面考慮。
1)工程實施團隊
工程實施團隊主要包括了核心工程團隊和工程配合團隊。
核心工程團隊是改造工程的主要實施團隊,對整個工程的質量、工期、工藝負責,一般由總包單位及建設方項目經理擔任負責人。部分涉及多家供應商的工程,則由建設方項目負責人直接負責。有些工程在建設方內部也涉及多個部門,那就需要更高級別的協調人統籌協調,以便在各團隊發生沖突時牽頭解決。
施工團隊往往涉及多個專業團隊,一般由總包統一安排各專業技術負責人。對于總包安排的各專業的負責人,需要精通技術,又能協調。由于工程項目的成敗大多在細節問題上,而建設方和總包又管理范疇過大,無法及時對施工細節進行掌控,因此對工程質量的把控,主要是由各技術負責人把控。
當建設方發現某個專業團隊的技術負責人技術能力不足、或者協調能力不夠時,應及時加強該團隊技術力量,確保施工質量。工程配合團隊是周邊工程配合的團隊,往往是因為改造工程在施工過程中需要對各類探頭臨時拆除、移位,或者在施工過程中對大樓中其他使用者產生影響,因此需要所有牽扯到的工程維護團隊配合。工程配合團隊雖然人員數量不多,但由于有些工程界面復雜,需要協調的配合工作極多,如果沒有把工程配合團隊配備齊整,經常會在施工現場出現碰到無法解決,需要等待協調人員趕赴現場的情況,嚴重浪費了工期。工程配合團隊能夠對施工阻礙提前清除,極大利于縮短工期,提高施工效率。
2)業務保障團隊
業務保障團隊主要包括了技術保障團隊和業務保障團隊。
技術保障團隊主要由負責主機、存儲、網絡、軟件的成員組成,主要任務是配合工程接駁進行機房服務器關機并為施工可能造成的設備損壞做好應急處理工作。技術保障團隊需要協調相應的硬件服務商,向相關維保單位通知甲方的機房改造工作,并要求相關維保單位做好調配備品配件的準備工作。
業務保障團隊一般在重大在線機房改造項目中組建,主要任務是當機房改造項目無法按期完成或發生重大施工事故時,必須啟用災備機房進行業務處理,則業務保障團隊負責維持則需要在技術保障團隊的配合下,啟用備份系統,確保業務開展。
上述內容是“「標準機房整治方案」機房改造施工方案!”的介紹,小編后續會陸續為大家帶來相關知識,希望對你有所幫助,更多知識,請關注企盾分響。