中間件系統
監控范圍:Weblogic\Websphere\JBOSS\MT\MQ\TUXEDO監控方式:SNMP\AGENT\HTTP\JMX監控說明:SNMP式監控為企業IT系統管理服務器系統定期主動輪訓方式 ,AGENT和JMX監控的指標更豐富,支持對中間件簡單操作。
注:AGENT程序是經過嚴格測試,對目標系統源占用很少,也可限定對內存的占用大小,不會影響目標系統常運行。
指標分析:(個例僅供參考)
Weblogic
監控項 | 指標名 | 描述 | 報警范圍與報警方式 |
整體監控 | AppEventErrCount | 監控應用事件錯誤 | 一般報警:1-5嚴重報警:6-10 |
AppSvcAvgElapsedTime | 監控所有應用服務平均消耗時間 | 一般報警:4000-6000嚴重報警:6000-8000 | |
LongestEJBAvgRespTime | 監控應用的最大的EJB平均響應時間 | 一般報警:4000-6000ms嚴重報警:6000-8000 | |
Dead消息監控 | NumTotalDeadMsg | 監控所有通道的不可達消息 | 一般報警:1 |
SQL監控 | AvgResponseTime | 執行的所有SQL的平均響應時間 | 一般報警:4000-6000ms嚴重報警:6000-8000 |
LongestSQLAvgRespTime | 運行SQL的平均最慢的響應時間 | 一般報警:4000-6000ms嚴重報警:6000-8000 | |
LongestSQLTotalRespTime | 運行SQL的總的最慢響應時間 | 一般報警:8000-10000嚴重報警:10000-16000 | |
監控Bean Pool | BeanAccessCount | 監控試圖從free pool中獲取bean的總次數 | 通知:0-100 |
BeanMissCount | 監控試圖從free pool中獲取bean的失敗的總次數 | 一般報警:0-100 | |
CacheMissRatio | 監控BeanMissCount對CacheAccessCount的百分比 | 一般報警:0-100% | |
EJB監控 | LongestEJBAvgRespTime | 監控針對特定EJB執行的任何method的最長的平均響應時間 | 一般報警:800-900ms嚴重報警:900-1000 |
服務器可用性 | AvailableConnections | 監控JDBC連接池中可用的連接數 | 嚴重報警:0 |
HealthStatus | 監控JMS service狀態 | 嚴重報警:1-3 | |
ClusteredServerStatus | 監控clustered server的可用性 | 嚴重報警:0 | |
Heap監控 | FreeHeap | 分配的JVM heap space當前可用的百分比 | 一般報警:5-10嚴重報警:0-5 |
HeapUsed | 監控Java heap space當前使用的百分比 | 一般報警: 90% ~ 95%嚴重報警: 95% ~ 100% | |
性能 | AvgConnTime | 監控從客戶端通過Weblogic Server連接應用的平均連接時間 | 一般報警:9500-9999ms嚴重報警:9999-10000 |
ExecutionTimeAverage | 監控servlet的平均執行時間 | 一般報警:800-900ms嚴重報警:900-1000 | |
報告 | JNDI Naming | 報告JNDI列表 | 文本顯示 |
License information | 報告許可證信息 | 文本顯示 | |
JTA Information | 報告JTA信息 | 文本顯示 | |
Server Performance | 報告Server性能信息 | 文本顯示 | |
Server Configuration | 報告Server配置信息 | 文本顯示 | |
Server Connections | 報告Server連接信息 | 文本顯示 | |
JMS Server Components | 報告JMS Server組件 | 文本顯示 | |
Weblogic MBean Information | 報告MBean信息 | 文本顯示 |
WEBsphere
監控類別 | 重要程度 | 監控指標名稱 | 描述 | 閾值設置 |
系統信息 | 低 | 服務啟動后CPU使用率 | Was所駐留的主機平臺的指標 | |
系統信息 | 低 | 上次測量CPU使用率 | Was所駐留的主機平臺的指標 | |
系統信息 | 低 | 空閑內存 | Was所駐留的主機平臺的指標 | |
事務 | 高 | 本地事務提交百分比 | 提交的本地事務占全部本地事務的百分比 | |
事務 | 高 | 全局事務提交百分比 | 提交的全局事務占全部全局事務的百分比 | |
事務 | 高 | 本地事務持續時間 | 事務時間,反映系統的性能 | |
事務 | 高 | 全局事務持續時間 | 事務時間,反映系統的性能 | |
虛擬機 | 高 | 內存使用百分比 | 反映Was運行最基本和關鍵的指標,如果百分比過高,需調高Jvm參數 | 大于80發告警警告,大于90發嚴重警告 |
JDBC連接池 | 高 | 使用連接的平均時間 | 根據系統的實際使用情況,設定閾值 |