出任何線(xiàn)上事故,先不說(shuō)其他地方有問(wèn)題,監控部分是有問(wèn)題的。聽(tīng)著(zhù)很甩鍋的一句話(huà),仔細思考好像有道理。
這里,我對常用的監控對象以及監控指標分類(lèi)整理,供大家參考:
①硬件監控
包括:電源狀態(tài)、CPU 狀態(tài)、機器溫度、風(fēng)扇狀態(tài)、物理磁盤(pán)、raid 狀態(tài)、內存狀態(tài)、網(wǎng)卡狀態(tài)。
②服務(wù)器基礎監控
包括:
CPU:?jiǎn)蝹€(gè) CPU 以及整體的使用情況。
內存:已用內存、可用內存。
磁盤(pán):磁盤(pán)使用率、磁盤(pán)讀寫(xiě)的吞吐量。
網(wǎng)絡(luò ):出口流量、入口流量、TCP 連接狀態(tài)。
④中間件監控
包括:
Nginx:活躍連接數、等待連接數、丟棄連接數、請求量、耗時(shí)、5XX 錯誤率。
Tomcat:線(xiàn)程數、當前線(xiàn)程數、請求量、耗時(shí)、錯誤量、堆內存使用情況、GC 次數和耗時(shí)。
緩存:成功連接數、阻塞連接數、已使用內存、內存碎片率、請求量、耗時(shí)、緩存命中率。
消息隊列:連接數、隊列數、生產(chǎn)速率、消費速率、消息堆積量。
⑤應用監控系統
包括:
HTTP 接口:URL 存活、請求量、耗時(shí)、異常量。
RPC 接口:請求量、耗時(shí)、超時(shí)量、拒絕量。
JVM:GC 次數、GC 耗時(shí)、各個(gè)內存區域的大小、當前線(xiàn)程數、死鎖線(xiàn)程數。
線(xiàn)程池:活躍線(xiàn)程數、任務(wù)隊列大小、任務(wù)執行耗時(shí)、拒絕任務(wù)數。
連接池:總連接數、活躍連接數。
日志監控:訪(fǎng)問(wèn)日志、錯誤日志。
業(yè)務(wù)指標:視業(yè)務(wù)來(lái)定,比如 PV、訂單量等。
小編此次分享就此結束,咱們下期再見(jiàn)。
聯(lián)系人:王經(jīng)理
手機電話(huà):13609365179
聯(lián)系電話(huà):0931-5135562
聯(lián)系電話(huà):0931-8266869
郵箱:1181093560@qq.com
網(wǎng)址:qqltcx.com
地址:甘肅省蘭州市城關(guān)區碧桂園金城云鼎8號樓1807室