+AI場景,3步懂圖像識別產品

4 評論 14285 瀏覽 38 收藏 9 分鐘

本文重點講述基于成熟的第三方AI平臺阿里、某度、騰訊、谷歌等等中選擇一個可供使用的SDK基于Python語言實現圖像識別功能的GUI界面,從而一觀圖像識別車型、圖像識別文本產品的實現過程。

我們正處于各種圖像識別的場景里,你去某些生鮮超市不用手機可以實現刷臉支付,去銀行ATM機不用卡片可以刷臉取現,在很多城市的許多十字路口沒有交警但是你如果違規駕駛你的車輛被AI攝像頭識別的清清楚楚等等場景里均有機器視覺的應用圖像識別的產品應用。

本文不復述圖像識別在安防、金融、旅游等方面的產品應用過程,本文僅僅用AI子任務圖像識別技術來看AI產品實現的過程,為啥AI產品要懂實現過程?

因為目前的AI處于快速發展時期,無論是對AI產品、AI技術還是AI從業相關的AI愛好者,在AI快速發展的時期跟隨AI技術懂AI產品的實現過程是非常有意義的事情。

因此本文重點講述基于成熟的第三方AI平臺阿里、某度、騰訊、谷歌等等中選擇一個可供使用的SDK基于Python語言實現圖像識別功能的GUI界面,從而一觀圖像識別車型、圖像識別文本產品的實現過程。

一、首先實現工具介紹

語言:Python

產品開發工具平臺:下載某度AI項目下的SDK

產品開發設計工具:Tkinker,Python的GUI設計工具有Tkinter,Wxpython,PyQt?等各有優缺點。Tkinter是?Python自帶的標準GUI?庫,安裝Python?后直接使用?Tkinter,不需額外安裝,使用前用?from tkinter import*導入?tkinter。第三方?GUI界面設計后經過轉換成Python語言才可使用。

產品開發的關鍵技術:

設計產品是,利用Tkinter技術開發GUI界面,基于某度AI提供的開源技術,實現5個功能:人臉檢測、動物識別、植物識別、車型識別、文字識別。用戶選擇圖片后,單擊對應的按鈕,獲得識別結果,其中文字識別的結果以?txt形式保存在硬盤上,其余結果顯示在窗體上。

某度AI結果抓?。?/strong>

某度AI提供的結果信息量大,用戶需要對其中數據進行抓取。下列代碼對某度人臉檢測功能顏值結果進行抓取,結果存放在變量,詳情知識點見鏈接??http://996.pm/MeANw

resul=result[‘result’]

resul=resul[‘face_list’]

res=resu[0]

linelian=res[‘beauty’]

二、其次功能實現過程

1. 產品界面設計實現過程

程序運行后,首先顯示歡迎界面(核心代碼是,tkinter、messagebox、showinfo(?歡’迎’,”某度AI人工智能”+”\n”+”2018年11月出品”))。

界面設計,在界面上設置3個標簽,5?個按鈕等控件。3?個標簽分別顯示圖片,某度AI結果,運行時間等。7個按鈕有“選擇圖片”,“結束”以及五個實現某度圖像功能按鈕。

采用place函數設置各個控件的位置,以下代碼分別實現標簽和按鈕的位置:

btn=button(root,text=”選擇圖片”,command=xz)。place(x=120,y=20)

label=Label(root,width=23,height=6,bg=’blue’,fg=’white’)。

place(x=450,y=150)

2. 選擇圖片功能實現過程

選擇圖片,按鈕打開選擇文件對話框,并將其顯示在界面的標簽Label上,其核心代碼是:

pilImage=tkinter。filedialog。askopenfilename()

pil=Image。open(pilImage)

tkImage=ImageTk。PhotoImage(image=pilImage)

label=Label(root,image=tkImage,width=ww,height=hh)

3. 識別按鈕功能設計實現過程

采用def函數功能將按鈕與某度AI結果進行定義。以下代碼實現,動物檢測,按鈕與某度AI結果的鏈接。

def dongwujiance

client=AipImageClassify(APP_ID,API_KEY,SECRET_KEY)

def?get?_file_content(filePath):

with?open(filePath,’rb’)?as?fp:

return fp.read()

byn=Button(root,text=”動物識別”,command=dongwujiance)

4. 菜單設計實現過程

菜單設計的代碼是:

smenul=Menu(fmenul,tearoff=0)

fmenul.add_cascade(label=’關于’,menu=smenul)

for item in[‘版權信息’]:

smenul.add_command(label=item,command=syu)

root[‘menu’]=fmenul

5. 版權信息的代碼實現過程

defsyu():

tkinter.messagebox.showinfo(‘版權’,’版本號0.5.2’+’\n’+’制作:LineLian的微信號是firstodytm賦能團隊’)

6. 生成可執行文件實現過程

編寫代碼后進行測試。測試后,刪除全部斷點及部分注釋,生成可執行文件,提供給用戶使用。生成可執行文件exe的方法是在DOS中輸入代碼:

>pip install pyinstaller

>pyinstaller?–?F-w?python.py

三、然后實現結果

應用程序執行“車型識別”界面如下圖:

文字識別保存在:“d:\ocr。txt”。

功能結果如下圖:

四、總結+AI產品實現的關鍵要素

  1. ?+AI的場景例如本文用于識別車輛、文字等場景。
  2. ?+AI的產品需要的技術本文是調用用成熟的第三方圖像識別接口,這也是典型的對+AI型產品快速實現的方法,同時也是區別于純AI、AI+的特征。
  3. 對算力的需求,如果公司產生圖像的業務比較穩定發展,可以借用第三方云服務來實現。

最后AI助力圖像識別、文本識別效率比較高,關鍵是商業化應用,有商業意義的地方本文圖像識別技術落地就更更符合產品邏輯,不會像有的AI技術朋友問筆者:“你不是應該更關注產品怎么吸引用戶嗎?為何還要懂技術呢?”

答案是:AI處于快速發展時期,對于從事AI產品和AI領域相關的人非常有必要懂AI實現的過程。因為AI技術和AI的相關都處于快速發展狀態下。不像傳統技術那么死板和已經技術固話,所以很多產品懂AI相關的技術更能創新應用AI。

如果你想系統化入門AI產品經理,掌握AI產品經理的落地工作方法,戳這里>http://996.pm/7bjab

#專欄作家#

連詩路,公眾號:LineLian。人人都是產品經理專欄作家,《產品進化論:AI+時代產品經理的思維方法》一書作者,前阿里產品專家,希望與創業者多多交流。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

專欄作家

連詩路AI產品,公眾號:連詩路AI產品。人人都是產品經理專欄作家,《產品進化論:AI+時代產品經理的思維方法》一書作者,前阿里產品專家,希望與創業者多多交流。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 不好意思,我也走錯片場了

    來自浙江 回復
  2. 不好意思,我也走錯片場了!

    來自上海 回復
  3. 不好意思,走錯片場了!

    來自江蘇 回復
    1. 客官怎么了

      來自上海 回復