從零到卓越:規劃構建高效告警平臺的實戰路徑

0 評論 451 瀏覽 1 收藏 15 分鐘

在現代社會中,告警系統的重要性日益凸顯,它通過實時監控和及時通知,幫助各個領域預防風險和應對異常情況,確保安全和穩定運行。

告警系統在現代社會中扮演著越來越重要的角色。

告警系統是一個復雜而關鍵的系統,它主要用于監控、發現和通告潛在的風險或異常情況,以便及時采取措施進行應對。

通過不斷優化和提升告警系統的功能、性能、穩定、精準性,可以更好地保障各個領域的安全和穩定運行。

01 告警平臺價值

提高生產效率,降低維護成本

告警平臺能夠實時監控生產設備的運行狀態,包括溫度、壓力、振動、電流、電壓等關鍵參數。

一旦這些參數超出預設的安全范圍或達到故障閾值,系統能立即發出告警,通知相關人員及時處理,從而避免設備損壞或生產中斷,確保生產線的高效運行。

告警平臺能夠及時發現設備故障,從而減少因設備停機導致的生產延誤和損失。這有助于降低因停機造成的直接和間接成本。

提升安全管理水平,優化資源配置

在涉及高溫、高壓、易燃易爆等危險因素的生產環境中,告警平臺對于保障人員和設備安全至關重要。通過實時監控和及時告警,系統能迅速識別并處理潛在的安全隱患,防止事故的發生。

告警平臺能夠根據告警信息的緊急程度和重要性,智能調度維護人員,確保資源得到最優配置。這有助于提高維護工作的效率和質量。

推動技術進步,帶動產業升級

告警平臺的建設和發展,促進了傳感器技術、物聯網技術、大數據分析、人工智能算法等技術的不斷創新和應用。這些技術的融合和應用,為預警系統的智能化、精準化提供了有力支持。

隨著預警系統在各個領域的廣泛應用,相關產業鏈也得到了快速發展。從傳感器制造、數據分析軟件開發到系統集成服務等領域,都迎來了新的發展機遇。

提升企業競爭力

通過實時監控和數據分析,企業可以及時發現生產過程中的問題并進行改進,從而提高產品質量。

告警平臺能夠縮短故障處理時間,提高生產線的穩定性和靈活性,使企業能夠更快地響應市場需求變化。

02 告警平臺產品設計

1、角色用例

▲ 用例圖

告警平臺要正常運轉,服務于實際業務,需要四類角色,設備管理員、系統管理員、告警處理員、領導。

設備管理員:負責設備接入,提供設備信息采集,獲取告警的數據源;

系統管理員:負責系統的配置,尤其是告警規則、通知規則等基礎數據的配置;

告警處理員:負責告警的全生命周期管理,包含處理、驗證、關閉;當部分告警不能直接處理是,需要上報領導知曉;

領導:負責升級告警管理,包含處理、驗證、關閉;同時,也需要肩負起監督告警處理員對告警的及時處理;

角色用例的分析,是明白有哪些人員角色參與系統操作、業務執行,為深度業務分析提供突破口。

2、用戶故事

▲ 用戶故事

講清楚用戶故事,可以串聯完完整的業務流程,梳理清楚所有的分支流程,也為后續測試時提供全部檢驗條件。

什么事物 在什么時間 在什么環境 下觸發了哪些告警條件,以怎樣的值來報警。

  1. 實驗室3樓 – 302實驗室 – 溫度超過37度 – 橙色告警 – 通知實驗室管理員
  2. 豬舍3棟 氨氣濃度超過36 / m3  且 二氧化碳濃度超過 83 /m3  – 紅色告警 – 通知養殖場廠長
  3. 2樓206小會議室 – 火警 – 紅色告警誤報
  4. 實驗室3樓 – 302實驗室 – 溫度超過43度 – 紅色告警 – 通知樓長【告警級別升級】
  5. 實驗室3樓 – 302實驗室 – 溫度超過43度 – 紅色告警 – 通知樓長【之前還未處理,又有告警,告警升級】
  6. 綜合樓4樓 – 過道 – 風速偏大 – 藍色告警 – 通知保安室  – 忽略告警

在告警用戶故事這一塊,用戶故事1和5,梳理清楚同一個規則生成告警,前告警已處理、未處理的兩個不同流程。當前告警還未處理時,再次生成更高級別的告警,就是告警的升級。

在實際處理時,高級別告警處理后,前置的告警將再無處理必要。

3、告警業務流程

▲ 業務流程

設備接入為前置性條件,設備數據采集為告警提供數據源。告警業務擴寬,需要支持統計數據等作為數據源。

告警平臺系統管理員進行告警配置,包含告警規則、通知規則配置。告警規則主要配置哪個設備的哪個屬性值,在什么情況下生成告警;通知規則主要配置告警生成后通過哪些途徑通知哪些人。

告警處理流程包含處理、驗證、關閉;處理是針對出現的這個情況,有什么解決方案,可以確定誤報、忽略;

驗證是確認該告警的處理方案實際落地,比如溫度過高報警,通過打開空調的方式處理,驗證空調已打開,且溫度設置23度,是有效的處理方式。然后可以關閉報警,當前事項處理完成。

告警處理需要考慮,當前告警處理員處理不了這個告警的情況,支持告警升級。

業務流程中,為了提升便捷度,特別增加當告警被處理時,直接修改對應消息的狀態,減少信息干擾。

4、ER圖設計

▲ ER圖

基于以上業務流程分析,拆解出來:告警規則、告警、告警消息規則、告警消息信息實體,也是告警平臺的主要庫表。告警的處理、升級、驗證、關閉都作為告警子表來進行設計。

拆解到ER圖的層級,是為了很好的跟前后端開發溝通。也便于從數據的角度理解系統中數據的存儲、查詢、更新。同時也明確主要信息,產品心中做到有數。

5、狀態機管理

▲ 狀態機

基于ER圖拆解,告警、告警消息的狀態進行詳細的拆分。

狀態機明確了告警、告警信息有哪些狀態,各狀態下可執行哪些操作,各狀態對應通過哪些操作進行狀態切換。

其中,告警消息有一個“待下發”狀態,這個在業務上實際是不需要,只是為便捷信息溯源,確保數據生成到數據消失,全部都在可控范圍內。

03 升級告警平臺

系統建設、方案設計、產品設計,都可以遵循:路走通,路好走,路擴寬。

大道至簡,但中間的路途并非一馬平川的。

▲ 大道至簡

功能完善優化

基于以上,完成了告警平臺核心功能的梳理和搭建。要提高一個產品的易用性,擴展產品的影響面,在交互細節上還需要更細致、更強化,需要盡可能補全所有的業務流程。

也可以預留一部分運維功能(如強制修改狀態,可以讓業務流重新流轉)。

在告警平臺上,優先補充“支持多條件組合告警”,實現更復雜、更有效的、更符合業務現狀的配置條件。

其次是補充“人工告警”,支持異常情況的手動告警路徑,確保在數據同步、規則判斷出現異常時,能夠有快速業務執行的通道。

消息系統是個很好的輔助,通過消息來告知用戶是否需要關注。但若是消息過多、準確性不高,消息系統就容易成為雞肋。

在實際執行中,要支持設置消息的忽略與靜默,在不恰當、不關鍵的場景中,不提示消息。另外,當業務已經處理,最好將相關的消息置為已讀,不再吸引用戶的注意力,從而減少用戶的處理,減少系統對用戶的干擾。

擴展告警業務范圍、擴展告警信息源

當庫存低于安全閾值時,預警平臺可以自動提醒庫管進行補貨;當應收賬款逾期時,可以提醒財務人員關注并跟進。

在安全領域,預警告警平臺可以實時監控網絡流量、系統日志等關鍵信息,一旦發現異常行為或潛在威脅,立即發出警報,有助于企業迅速響應并采取措施,保障系統安全穩定運行。

告警對象分級分組管理

將告警信息按照重要性、緊急程度或影響范圍進行分層分類。例如,將告警分為事故類(1級)、異常類(2級)、越限類(3級)、變位類(4級)和告知類(5級)等不同級別。

對于不同級別的告警,制定相應的管理要求和處理流程。高級別的告警需要由專門的團隊或人員立即處理,而低級別的告警則可以由相對寬松的團隊或人員在規定時間內處理。

根據響應人員的專業技能、經驗和職責范圍,將其分為不同的響應小組。每個小組負責處理特定類型或級別的告警。

例如,設立專門的網絡安全小組負責處理網絡安全相關的告警,而數據中心運維小組則負責處理服務器和存儲設備的告警。

告警系統通過實時監控與分析、智能化告警處理、合理的資源分配算法以及響應人員的分組分級等策略,可以優化資源配置并提高響應效率。

這些措施有助于企業更好地應對各種潛在風險和挑戰,保障業務的連續性和高效性。

AI告警

隨著大數據、區塊鏈、虛擬幣等新技術新業態的不斷發展,新型電信網絡詐騙案件日益增加,嚴重影響網絡空間穩定和人民群眾財產安全?;ヂ摼W預警勸阻平臺通過精準識別詐騙信息并提示潛在受害人,有效遏制了詐騙行為的蔓延。

利用人工智能和機器學習算法,實現告警的智能化處理。例如,采用動態閾值(區間檢測功能),根據歷史數據預測指標上下邊界,自動調整閾值,從而避免資源在靜態閾值下的浪費或不足。

引入趨勢性預測功能,根據歷史數據預測未來告警數量,以便企業提前準備資源,應對可能的問題。

告警平臺對于提高生產效率、降低維護成本、優化資源配置、提升安全管理水平和提升企業競爭力等方面都具有重要意義。

新技術不斷發展,新業務需求不斷擴展,告警平臺也將在實際應用中完善、優化、升級、進化。

本文由人人都是產品經理作者【壹叁零壹】,微信公眾號:【壹叁零壹】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!