機房監控新理念有哪些:對設備內部進行監控
機房監控的目的在于保護機房內IT系統的正常、有效運行,在事故發生之前偵測出潛在危機,并通過各種方式將警情信息發送給相關人員及時進行處理。因此,機房監控的核心應該是對IT系統運行狀態的監控,而最直接有效的監控應該是直接對IT設備運行狀態進行監控。
IT設備內部的運行環境,例如服務器內風扇轉速與CPU溫度等是最直接、最迅速影響IT設備正常運行的因素。有時候即使機房內空調運轉正常,機房整體環境參數值也在預設范圍內,但某服務器卻因為某種原因出現服務器內風扇的轉速不正常、CPU過熱。如果只監控機房整體環境,此時機房的管理人員是不會得到這種危險信息的,整個系統就會因為該服務器潛在危機沒有得到及時處理而意外癱瘓。
機房監控新理念有哪些:多層次的機房監控
完善的機房監控系統應該是能夠實現對從設備運行情況到
機柜微環境再到機房整體環境這樣多層次的監控,并能重點實現對設備內部的監控。
我們都知道,機柜內的微環境是設備正常運行所需要的物理環境。機柜微環境參數最能體現設備所處的實際運行物理環境的情況,所以實現對機柜內微環境的監控也相當重要。
機房各個點的環境參數值是不同的,因此機房內整體環境監測的參數不能體現各機柜微環境參數,更不能體現重要設備內部的環境。也就是說,即使機房整體環境參數正常,IT設備所在處的環境也不一定正常。所以說機房的整體環境監控的重要性次于對設備的監控和對機柜內微環境的監控。
空調機的運行是為了降低機房內的溫度,使機房內的整體溫濕度保持在一個合適的范圍內,機房各個點的溫度參數值是不同的。空調機出風口的溫度值不能說明機房的整體溫度和機柜微環境溫度,空調的正常運行不能說明設備就能正常運行。因此對空調的監控不能代表甚至取代對設備的監控。
漏水監測系統是為了監測機房內是否有漏水,以防止因漏水影響設備的正常運行。線式探測器是成線型布置在機房可能漏水的最低處,而實際上點式漏水探測器同樣可以反映機房的漏水情況且比線式探測器經濟實惠、安裝方便、維護簡單。
機房內設備由于非常重要,一般都是采用UPS供電,并且
UPS是雙供電,只要對UPS進行監控就能確保設備正常供電并且能反映市電的情況。因此,對電源的有效監控是在不增加任何投資的情況下通過協議實現對UPS的監控,通過監控其電壓、電流、電池使用情況、市電情況來確保設備的正常運行。
機房監控新理念有哪些:機房監控的預警功能
報警(alarm)是報告事件的發生,是在故障或危害發生之后向管理人員發送警訊,及時地發送警訊可以縮短故障修復時間(MTTR),最大程度地保障系統運行。但故障還是不可避免地發生了,影響了系統的正常運行。
預警(alert)則是在故障或危害發生之前向管理人員報告潛在危機,提示相關人員進行處理,是事前的,可以防止事故的發生。有效的預警可以增加系統平均無故障工作時間(MTBF),并可以根據危機情況自動延伸到報警。
預警與報警的區別就在于它是事前預防性報警,機房監控系統只有具有良好的預警功能才能偵測出潛在危機并分層次逐步擴大警訊發送范圍,有效地防止事故的發生,將損失降低到最小。越來越多的機房管理人員也開始意識到預警的重要性,因此機房監控系統必須有預警功能。
那么,機房監控該如何實現預警功能呢?首先,可以通過靈活的閾值設置多種偵測方式,確保能及時地發現潛在危機;其次,通過設置多種預警的方式,確保所有相關人員無論在何時何地都能收到警訊;再次,設置多個預警流程,確保不同的相關人員在不同時間接收到不同程度的警訊。
這樣,一旦有危機出現,立刻將信息發送給相關人員直至危機得到有效處理,實現真正意義的預警功能,最大程度地保護系統的運行。
來源:
機房監控 http://www.99yxj.com.cn