Progress Flowmon 是一項核心網路監控和安全性工具。確認它是否已經開始運作,可能會導致應對資料外洩或忽略此類嚴重事件之間的差異。如同任何的其他關鍵系統,最好的做法是在 IT 基礎架構監控 (ITIM) 儀表板(例如 Progress WhatsUp Gold)中納入 Flowmon 正常運作時間、資源消耗和健康狀態監控。
如同許多的其他 ITIM 工具,WhatsUp Gold 提供了各種遠端監控功能,例如以 SNMP、SSH 或 REST API 為基礎的「主動式」(WhatsUp Gold 發起)監控或「被動式」(Flowmon 發起)系統紀錄監控。
視環境規模而定,WhatsUp Gold 免費版(適用於小型部署)或商業授權版(適用於大型環境)已足夠。
如果 SNMP 伺服器是在 Flowmon 裝置上啟用,並在 WhatsUp Gold 探索中設定正確的憑證,則有許多實用的 SNMP 監控工具適用於 Flowmon 監控:
若想要深入探索,有許多其他實用的資訊和效能指標可能有助於收集,以獲得 Flowmon 裝置健康狀態的整體概覽。但是,使用 SNMP 無法取得某些指標。使用其他方式也可以在 WhatsUp Gold 中存取受監控的裝置,例如 REST API 或 SSH。
SSH 指令碼自然提供了所有必要的靈活性。但是,最重要的是考量監控效能。監控不應屬於侵入性,所以不應影響受監控機器的配置、功能或效能。
需要觀察以下重要指標:
每秒處理的網路流量。這是最重要的指標。如果發生非預期下降,則表示流量是在到達 Flowmon Collector 之前遺失,或因為 Flowmon Collector 本身的效能問題導致下降。
此數量僅會在裝置上偵測到新的流量來源時增加 — 例如,為基礎架構新增探測器或路由器,並啟用將流量匯出至裝置。數量僅會在使用者於裝置上移除流量來源時減少。
設定檔和通道的數量直接反映了組態。如果沒有組態變更,將是穩定的數量。數量大幅增加是配置大幅改變的結果 — 例如匯入多個組態預設。
設定檔、通道的數量與 CPU/記憶體利用率之間也具有相關性。如果設定檔或通道的數量增加,則 CPU/記憶體利用率將會上升。
歷史資料可以儲存在所有來源設定檔中的天數。取決於磁碟配額設定和傳入流量資料量。
在輪詢時主動執行的 nfdump 查詢數量(例如從 Flowmon 分析頁面觸發)。同時發生的活動過多,可能會對 Flowmon Collector 效能產生負面影響。
所有主動執行之 nfdump 查詢的總持續時間。值偏高可能是由長時間執行的查詢造成,可能會對 Flowmon Collector 效能產生負面影響。
探測器每秒處理的平均位元數。此指標的值應反映出監控介面擷取的流量。
探測器每秒處理的平均封包數。
流量快取中的流量數。如果數字增加,則表示進入 Flowmon Collector 的唯一流量比平常多 — 可能是分散式阻斷服務 (DDoS) 攻擊造成。
每秒從 IPv4 分段流量產生的平均流量數。值偏高可能表示存有大量的分段 IPv4 流量。
探測器每秒匯出的平均流量數。
每秒流量快取中的平均衝突數應為 0。如果太高,則可能表示存有效能問題,可能必須調整快取。
您可以使用匯入角色功能輕鬆匯入上述監控工具:
Subscribe to get all the news, info and tutorials you need to build better business apps and sites