電網行業,如何應用自然語言理解技術?

1 評論 4984 瀏覽 25 收藏 11 分鐘

本文分享了智能電網的發展現狀與未來趨勢,并且具體講解了自然語言理解技術在電網行業中的應用。

電力網(電網)是高效快捷的能源輸送通道和優化配置平臺,是能源電力可持續發展的關鍵環節。在現代能源供應體系中,電網發揮著重要的樞紐作用,關系國家能源安全。2010年以來,國家電網的規模增長近一倍,保障了經濟社會發展對能源電力的需求。

隨著人工智能技術的快速發展,機器智能的優勢正逐漸深入各行各業。本文將聚焦中國市場,談談自然語言理解技術在電網行業當中的應用現狀與發展前景。

自然語言處理(NLP)技術旨在研究通過計算機設備理解,處理,應用人類的語言文本信息內容,是人工智能研究領域中最為典型也最具挑戰的一個部分。

目前,國家電網正在試圖將NLP技術運用到電網相關的服務工作當中,通過技術的力量,加速電網行業的發展。

智能電網泛指借助人工智能技術實現的智能化電網。它基于集成的高速雙向通信網絡,通過先進的控制方法和先進決策支持系統技術的應用,以可實現更可靠,更安全,更高效,為目的的電網服務。從而保障了廣大用戶額電能質量,推動電力市場的發展。

通過文本閱讀理解,文本相似度計算,知識圖譜等技術,在項目招標,檢測預警,維護修理,以及渠道客戶等電網業務的應用場景當中落地。提升電網業務的工作效率,造福廣大人民群眾。

01 市場規模與發展趨勢

2005年以來,智能電網的關注度不斷提升,這是現代電力系統日益復雜的體現。智能電網的概念是科研技術、解決方案,以及政策和監管機制的合集。未來幾年,新能源裝機和發電量占比的提升將是一個必然的趨勢,電網將圍繞著清潔能源,進行系統化的投資升級。另一方面,中東部地區興起的大量間歇性分布式電源并網也需要智能配電網絡的支撐。

我國智能電網市場的需求方主要是國家電網,南方電網,以及地方供電局和一些地方電力公司。目前,市場上有能力提供較為全面的智能電網解決方案的供應商還十分有限,但是,我們也看到絕大多數企業都已經開始在某個或多個細分領域逐步展開智能化的戰略部署。

數據來源:國家電網 前瞻產業研究院

02 相關技術介紹

文本信息抽取

文本信息抽取主要是結合機器閱讀理解,通過訓練Word2vec模型,將文本數據中有效的信息識別出來,實現自動從文本數據中識別并提取關鍵信息內容的功能。

文本信息抽取的技術可以應用于電網招標文檔數據的結構化存儲,便于招標文檔的聚類和整理。同時也適用于電網企業說明文檔的檢測警報等任務。

文檔相似度分析

文檔相似度分析是依賴文字內容語義相似度計算的技術實現的一種典型NLP任務,一般用于信息檢索和知識問答的模糊匹配。

這項技術正嘗試被運用于電網維修行業,維修人員可以通過提問,或關鍵字/詞搜索的方式對信息量龐大的電網維修說明文檔進行快速的檢索,系統可以找到精準的相關內容,并生成說明內容返回給為維修人員。

知識圖譜

知識圖譜是指包含不同實體之間的信息和語義關聯的知識庫,能夠有效的將系統當中的知識類信息進行整理與關聯,從而實現信息數據的相互聯結與溝通。

針對包含專業技術和知識類文本數據組建圖數據庫,從而實現復雜的檢索功能和智能輔助決策的功能。

通過圖數據庫提升文本信息的檢索質量,可有效的運用于電網管理監控,電網知識類智能問答客服等場景。

情感識別

感情識別技術指的是通過對工作業務當中對話內容信息的聚類和理解,識別用戶在對話內容中所表達的情感信息的技術。

感情識別技術主要依靠長期短期記憶(LSTM)算法,對相關業務對話語料的上下文信息進行深層理解,結合對話當中的語境信息,判斷對話內容中所表達的情緒正負極,進而理解對話內容的話題與意圖。

03 應用分布與產品案例

電網檢測警報

(江蘇電網與河海大學)傳統的電網檢測警報無法對在短時間內對發生的警報事件做出準確的判斷。鑒于目前監測報警信息效率低的現狀,人工智能技術為電網業務提供了有效的解決方案。

首先,通過NLP技術對報警信息文本的特征進行分析和整理,并做好預處理工作。

之后,基于Word2vec模型對監視警報信息進行矢量化。

最后,針對報警信息的特點,建立了基于LSTM和CNN組合的監控報警事件識別模型。該模型可以通過與多種識別模型的比較,以驗證本文方法的可行性和有效性。

智能電網檢修問答系統

(南方電網與薄言科技)通過機器閱讀理解技術將電網安規的文檔進行讀取和分析,然后為文檔中的段落創建索引。

當電網維修人員向系統提問后,系統會先在索引里搜索相關段落,再從找到的段落中讀出問題答案系統依賴bert 模型預測出來文章當中哪一段能回答這個問題的概率最高。(學術的閱讀理解數據集上,人能做到86.8, 最好的模型做到88.6了)。

搜索返回的是段落,系統將段落內容轉精煉成回答短語,也就是說,系統會先理解文本內容,之后再抽取原文的一部分內容作為答案輸出,返回給維修人員。

電網維修人員可以通過自然語言交互的方式快速查閱電網維修文檔,從而有效提升電網維修任務的工作效率。

智能電網招標資料查重系統

(國網江蘇省電力公司電力科學研究院)電網公司在項目招標采購過程中, 一般要對招標資料進行查重工作,在歷史項目資料庫中查找是否存在類似項目,以防止項目重復招標的情況發生,避免資金浪費。

使用潛在語義索引的方法, 對文檔中的語義進行分析。使用NLP領域的中文分詞、詞向量轉換、詞權重計算、主題建模等技術構建一套文檔相似度分析系統。該系統可在海量歷史項目資料庫中快速找出與目標文檔相似的項目,并計算出文檔相似度百分比,輔助招標采購專職工作人員判斷招標資料是否合規。系統的研究與應用,對規范電網公司項目招標采購管理具有重要的實用價值。

局限性與發展趨勢

NLP技術在電網行業當中的應用才剛剛起步,大多數案例還處于實驗和探索階段。當前,真正在實際場景中落地的項目非常有限,相關的進展主要來自科研高校以及科技公司的POC項目當中。這些項目當中的數據多為實驗數據,缺乏一定的客觀性和普適性。從目前的發展現狀來看,電網行業中數據的獲取和整理將會是一個較大的挑戰。

電網領域的內容具有一定的專業性,且需要進行大量有效的人工標注才能訓練出一個有效的模型。

此外,電網公司是比較傳統的能源類企業,其工作方式以及工作系統已經形成體系。因此,相對于其他行業來說,電網業務智能化的成本更大,門檻更高。短期之內,NLP技術在電網行業中的應用依然是以協助人類工作為目的,而這同樣需要相關從業人員接受并掌握新的工作形式與模式。

事實上,中國國家電網和南方電網等行業領頭者已經在積極的與多家科技公司和院校實驗室進行合作,共同探索人工智能技術在電網電力領域的應用,旨在推動電網電力智能化的戰略方針,更好的服務于百姓。未來,將會有更多電網業務相關的數據被挖掘和記錄,NLP技術的主要應用場景將不再僅僅是輔助業務的智能客服中心。屆時,智能技術將會進一步的深入到電網相關業務具體的管理檢測和維護當中。

 

本文由 @單師傅?原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash ,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 電科院還是算了吧~

    來自天津 回復