AI-大模型的可行性驗證

0 評論 111 瀏覽 0 收藏 9 分鐘

大模型作為當前的前沿技術,有著強大的計算能力和復雜的數據處理能力,但是,面對大規模數據和高復雜度任務,模型的可行性如何?本文希望為大家提供了一個全面的視角,揭示了AI大模型在理論和實踐中的潛力。

隨著信息技術的飛速發展,人工智能(AI)逐漸從科幻走向現實,成為驅動現代社會變革的核心力量。

AI大模型作為這一領域的前沿技術,憑借其強大的計算能力和復雜的數據處理能力,正引領著技術創新的潮流。

然而,面對大規模數據和高復雜度任務,這些模型的可行性和有效性究竟如何?

本文希望為大家提供了一個全面的視角,揭示了AI大模型在理論和實踐中的潛力。

那么今天我們要做的是基于大模型進行證件過期,來進行實現思路構思和選型。

一、目標

基于身份證圖片判斷其是否過期。

二、OCR技術

OCR(Optical Character Recognition,光學字符識別)技術可以將各種票據、報刊、書籍、文稿及其他印刷品的文字通過掃描轉化為圖像信息,并利用文字識別技術將圖像信息轉化為可使用的文本。這項技術可以幫助我們從身份證圖片中提取出有效的文字信息,用于后續的過期判斷。

OCR:OCR技術是光學字符識別的縮寫(Optical Character Recognition),是通過掃描等光學輸入方式將各種票據、報刊、書籍、文稿及其他印刷品的文字轉化為圖像信息,再利用文字識別技術將圖像信息轉化為可以使用的文本的計算機輸入技術—–掃描圖片轉文字。

第一步:數據集準備

數據集準備-日常生活中首先我們收集身邊人員。

#手機內容:身份證、居住證等符合場景要求的身份信息:例如身份證、駕駛證、護照、居住證、港澳通行證等。

#收集數量:10-30張

“在收集到足夠的數據后,接下來我們要進行數據匯總,以便后續的處理和分析?!?/p>

第二步:數據匯總

數據匯總方便我們后續對數據質量評價和應用,制作一個Excel表格,格式如下

首先我們可以將圖片上傳到云盤,獲取圖片鏈接。第二列為OCR結果復制粘貼

進去。

第三步:OCR提取

OCR 內容提取可行性驗證,并不需要開發代碼有界面,可操作交互的 OCR 產品即可騰訊 OCR:https://cloud.tencent.com/product/ocr

第四步:大預言模型能力提取所需的關鍵信息

OpenAI 的 platform 平臺舉例:https://platform.openai.com/playground?mode=chat可選擇其他大語言模型,要求可以設置prompt,可以調整模型、參數。

注釋:“Prompt工程是一種設計和改進AI提示的方法,以提高AI的表現?!?/strong>

Prompt Engineering 是一種人工智能(AI)技術,它通過設計和改進 AI 的 prompt來提高 AI 的表現。Prompt Engineering的目標是創建高度有效和可控的 AI 系統,使其能夠準確、可靠地執行特定任務。

因為人類的語言從根本上說是不精確的,目前機器還沒法很好地理解人類說的話,所以才會出現 Prompt 工程這個技術。

·如果你是產品設計師,或者研發人員,你可以通過它來設計和改進AI系統的提示,從而提高AI系統的性能和準確性,為用戶帶來更好的AI體驗。

第五步:迭代調優

輸入OCR內容—查看結果—-調整Prompt—調整模型/參數—最后統一輸出所有。

第六步:完善數據

把第三列輸出結果補充進去,人工判斷第四列是True正確還是False錯誤

第七步:整體效果評估

匯總樣本統計 :樣本數20

1. 精確率:95%

2. 召回率:100

精確率:對預測結果為正的樣本中實際正確的個數

召回率:實際正樣本中有多少被預測了回來

例如:面前有很多只狗和貓,扔一只骨頭出去希望狗能跑過來精確率就是所有跑回來的動物中有多少只是狗,10只跑回來,其中有8只狗,精確率80%在所有的動物中有20只狗,召回率就是8/20.

綜上所述,通過《AI-大模型的可行性驗證》,我們深入探討了如何利用AI大模型和OCR技術來判斷身份證是否過期。整個過程包括數據收集、OCR提取、模型應用及結果評估,展示了AI大模型在處理復雜數據任務中的優異表現。

在實際應用中,我們成功實現了高精度的身份證過期判斷。在測試的20個樣本中,我們達到了95%的精確率和100%的召回率,充分證明了AI大模型的潛力。例如,通過OCR技術,我們準確提取了身份證上的有效期信息,并通過大語言模型的分析,準確判斷出身份證是否過期。

然而,在這個過程中也遇到了一些挑戰。例如,部分OCR結果存在誤識別問題,特別是在處理模糊或低質量圖片時。此外,Prompt工程的設置和模型參數的調優也需要不斷嘗試和優化,以獲得最佳的判斷結果。面對這些挑戰,我們通過不斷迭代和改進,逐步提高了系統的準確性和可靠性。

盡管如此,我們仍需繼續優化技術,解決在圖像質量和識別準確性方面的不足,并加強對AI模型的道德審查和安全性測試。未來,隨著技術的進一步發展,AI大模型有望在更多領域實現突破,帶來更多創新和便利。

本文由 @李雪亮 投稿發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!