利用AI+RPA設(shè)計(jì)智能合同審閱系統(tǒng)
隨著企業(yè)規(guī)模的擴(kuò)大,涉及文檔材料的審核工作也會(huì)越來越多,任務(wù)就會(huì)越來越繁重,與此同時(shí),人工智能也在不斷發(fā)展,為了降本增效,將人工智能技術(shù)賦予審核工作,輔助辦公將會(huì)大大提高效率。本文講述如何利用人工智能技術(shù)實(shí)現(xiàn)文檔智能審閱,并打造智能文檔審閱系統(tǒng)。
概述
隨著企業(yè)規(guī)模的不斷擴(kuò)大,越來越多的文檔材料等需要人工進(jìn)行審核,尤其銀行、金融機(jī)構(gòu)、審計(jì)機(jī)構(gòu)等文本相關(guān)崗位審核工作尤為繁重。隨著人工智能技術(shù)不斷積累及成熟,越來越多的人工智能技術(shù)被落地賦能于各行業(yè)的智能化系統(tǒng)設(shè)計(jì),智能輔助人類辦公,其中OCR(光學(xué)字符識(shí)別)、NLP(自然語(yǔ)言處理)等技術(shù)應(yīng)用的尤為廣泛。
接下來本文以之前所做的合同審核項(xiàng)目為例,講述如何利用人工智能技術(shù)實(shí)現(xiàn)文檔智能審閱,同時(shí)利用RPA技術(shù)實(shí)現(xiàn)文檔審閱智能化、批量化,從而打造智能文檔審閱系統(tǒng)。
一、合同審核中存在的問題
合同作為一類審核項(xiàng)繁多、審核困難且容易帶來較大風(fēng)險(xiǎn)的文檔,對(duì)于一家企業(yè)來說需要花費(fèi)極大的時(shí)間、精力進(jìn)行審核和校對(duì),尤其是對(duì)于集團(tuán)性企業(yè)來說,需要耗費(fèi)大量的財(cái)務(wù)、法務(wù)人員的時(shí)間精力。合同審核主要存下如下問題:
1)合同數(shù)量龐大,人工審核工作量巨大。
2)審核細(xì)節(jié)多,審核速度較慢,工作內(nèi)容較為重復(fù)且枯燥。
3)失誤無法避免,會(huì)帶來巨大風(fēng)險(xiǎn)點(diǎn)。
4)可能涉及到各類掃描件、證照等,難以至于獲取信息。
二、構(gòu)建智能合同審閱系統(tǒng)改變傳統(tǒng)工作方式
智能合同審核系統(tǒng)是主要基于NLP、OCR、機(jī)器學(xué)習(xí)等技術(shù)完成對(duì)各類合同文檔的關(guān)鍵要素抽取,例如合同甲方、乙方、金額,幣種、標(biāo)的物、地點(diǎn)、時(shí)間等結(jié)構(gòu)化的信息,并基于一定的規(guī)則設(shè)置幫助合同審計(jì)人員完成自動(dòng)審核工作的一體化解決方案。下面我們來講講智能合同審閱系統(tǒng)的幾大核心步驟或功能模塊:
1. 合同附件OCR識(shí)別
隨著合同審核的階段或業(yè)務(wù)流程的不同,不同階段可能有不同格式的文件,如WORD、PDF、JPG等。對(duì)于電子版的Word、PDF等格式我們可以采用一些第三方的庫(kù)或者轉(zhuǎn)Htm等方式直接提取其中的文本及結(jié)構(gòu)信息。
對(duì)于掃描件或者照片等格式的附件我們需要利用OCR技術(shù)將其轉(zhuǎn)化成電子文本,在這里我們可以直接使用一些第三方的OCR能力(例如阿里云、百度、騰訊優(yōu)圖等),我們可以根據(jù)具體的樣本或者文本需要選擇不同的OCR服務(wù)。當(dāng)然并非所有的OCR需求均可以使用通用能力完成,部門特殊樣本或證照的識(shí)別可能需要根據(jù)具體需求及樣本進(jìn)行模型。
阿里讀光
2. 合同信息智能抽取
將合同各類附件從紙質(zhì)文件轉(zhuǎn)化成可以進(jìn)行處理的電子化文本之后,我們需要根據(jù)不同的審核需求進(jìn)行識(shí)項(xiàng)的抽取。比如對(duì)于合同整本我們可能需要抽取其中的甲方、乙方、標(biāo)的物、金額、時(shí)間、地點(diǎn)、重要條款等。
我們可以基于規(guī)則+模型結(jié)合的方式實(shí)現(xiàn)問文本信息智能抽取。對(duì)于合同模板十分固定或者上下文明確的合同模板,我們可以直接通過規(guī)則提取:對(duì)于并非十分固定的合同模板我們則需要利用NLP的一些算法訓(xùn)練抽取模型。
(1)模型提取
利用NLP技術(shù)中的分詞、命名實(shí)體識(shí)別等技術(shù)直接抽取合同中涉及到甲方、乙方、地名、金額、標(biāo)的物、實(shí)體信息。但是對(duì)于一些比較特殊的實(shí)體,比如具體的標(biāo)的物、付款方式、違約條款等我們需要根據(jù)實(shí)際需求進(jìn)行數(shù)據(jù)標(biāo)注及模型訓(xùn)練。開始中文檔上傳輸出熟機(jī)質(zhì)核規(guī)則制定模型訓(xùn)驗(yàn)化模型.
(2)規(guī)則提取
可以通過正則表達(dá)式或者通過系統(tǒng)前段實(shí)現(xiàn)一些文本錨點(diǎn)配置工具,便于使用者快速的進(jìn)行提取。
(3)基于位置信息的模板抽
對(duì)于合同審核中所涉及到的格式規(guī)范的文件,例如表格或者營(yíng)業(yè)執(zhí)照、資質(zhì)附件等結(jié)構(gòu)化的文件,我們可以直接采用在附件中的相對(duì)位置或者基于某一參照點(diǎn)的相對(duì)位置來獲取具體信息。
3. 合同智能審核
我們可以在通過系統(tǒng)中通過模型或者配置各類審核規(guī)則去進(jìn)行智能審核,審核包括以下維度:
(1)要素審核
主要對(duì)合同中的甲方、乙方、風(fēng)險(xiǎn)條款、違約條款等要素是否存在進(jìn)行審核。
(2)一致性審核
主要審核合同中的關(guān)鍵信息是否正確,例如甲方、乙方等信息與營(yíng)業(yè)執(zhí)照、各類資質(zhì)證書上的名稱是否一致。
(3)風(fēng)險(xiǎn)審核
比如金額、利息、合同標(biāo)的物、付款方式等是否滿足企業(yè)的法務(wù)、財(cái)務(wù)等規(guī)定。
(4)文檔智能糾錯(cuò)
自動(dòng)糾正合同中的文字錯(cuò)誤及與語(yǔ)法錯(cuò)誤,目前我們常見的各類輸入法以及文本辦公軟件都具有文本糾錯(cuò)功能或服務(wù),但是其大多是針對(duì)通用場(chǎng)景,如果我們需要其針對(duì)某一特殊領(lǐng)域的合同進(jìn)行智能糾錯(cuò),還需要根據(jù)特定的合同預(yù)料進(jìn)行訓(xùn)練。
(5)版本智能對(duì)比
在合同審核的過程中,往往涉及到版本的不斷修改,那么如果避免某次修改內(nèi)容未被發(fā)現(xiàn)而帶來的風(fēng)險(xiǎn)呢,通過版本智能對(duì)比功能,我們可以輕松發(fā)現(xiàn)合同前后變化。
三 、通過RPA實(shí)現(xiàn)文檔審核自動(dòng)化
RPA主要指機(jī)器人流程自動(dòng)化,通過模擬人工鍵盤、鼠標(biāo)操作實(shí)現(xiàn)點(diǎn)擊、輸入、復(fù)制、粘貼等操作。通過預(yù)設(shè)固定規(guī)則及流程,可以協(xié)助人工完成大量固定及重復(fù)性較高的工作。
在合同等文檔進(jìn)行審閱的過程中,可能存在巨大數(shù)量的合同進(jìn)行審閱,及時(shí)利用A技術(shù)也需要耗費(fèi)極大的人力成本。
那么利用RPA技術(shù)我們可以很好與文檔智能審閱系統(tǒng)或現(xiàn)有的合同、ERP系統(tǒng)很好的結(jié)合起來比如我們利用PA技術(shù)實(shí)現(xiàn)文檔的批量下載、上傳、識(shí)別以及對(duì)識(shí)別結(jié)果進(jìn)行導(dǎo)出,也可以利用RPA技術(shù)定期去將所有審核異常的結(jié)果進(jìn)行匯總,發(fā)送給相關(guān)人員進(jìn)行校驗(yàn)。
前國(guó)外比較知名PRA服務(wù)上例如Uipath、Automation Anywhere等,國(guó)內(nèi)則有云擴(kuò)、來也、弘璣等。
未來展望
隨著人工智能技術(shù)的不斷成熟,以及日益增長(zhǎng)的文檔信息抽取、審核、流轉(zhuǎn)的相關(guān)需求,我相信會(huì)有更多的AI技術(shù)會(huì)進(jìn)行落地,尤其是隨著PRA技術(shù)的廣泛落地,RPA+AI將會(huì)具有更廣闊的應(yīng)用場(chǎng)景。
本文由 @淡寫 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!