AI入門第一課:把模型跑起來

0 評論 1238 瀏覽 10 收藏 9 分鐘

AI大模型發展到現在,國內外都有在線和離線版本,那如何在自己本地部署大模型呢?本文分享了一種簡單的辦法,一起來看看吧。

我們經常能看到某某公司開源了一款AI大模型的新聞。這些模型都有著超強的能力,從生成大段的文字、逼真的圖像,到理解和翻譯不同語言,再到創造出令人嘆為觀止的音樂和藝術作品。

對于我們普通人來說,這些高科技聽起來不僅遙不可及,而且似乎與我們的日常生活無關,他們像是只有那些天才和大神們才能操作和使用的。

但是這些強大的AI模型,并不止是大神們才能接觸和使用,實際上,這些模型的使用門檻其實不高。任何對AI感興趣的人都可以輕松獲取和使用這些模型,就像搭樂高積木一樣,將它們組合起來,創造出你心目中的應用。

這一切既不需要深厚的技術背景,也不需要復雜的編程技能。只要你有想法和一丟丟的學習,這些強大的模型就能成為你隨意操作的「樂高」,搭建出你設想的樣子。

下面我們一起來看下,如何把模型跑起來

第一步:找到一個模型

首先,第一步我們得知道去哪里找到這些模型,很簡單,有一個神奇的網站叫:Hugging Face(https://huggingface.co/),這個網站本質就是一個大模型的托管網站,目前這個網站托管的AI模型超過57萬。一些熱門的模型,比如meta的Llama系列模型,google的Gemini等都托管在這個網站上,任何人都可以訪問并使用它們。

假設,我們現在要找一個模型,可以實現讀圖的功能,就是給它一張圖片,它可以告訴我這個圖片里的主要內容是什么。這個模型的邏輯如下圖,非常簡單,輸入一張圖片,輸出一段圖片的文本描述。

這個模型本質上就是一個圖片到文本的模型,我們在Hugging Face里選擇Image-to-Text的分類,然后從得到的結果里看排名第一個的模型,就是下圖紅框圈選的:Salesforce/blip-image-captioning-large,這個就是模型的名字。

點擊模型進行模型的詳情頁,這里有模型的詳細原理介紹,以及在線試用的功能,可以在這里直接體驗模型的效果。

找到了模型之后,我們接下來第二步,如何部署和使用模型。

第二步:模型的部署和使用

模型的使用涉及到模型的加載、預處理、模型推理和后處理步驟等,聽起來似乎很復雜,但是不用擔心,Hugging Face還給我們提供了一套使用的工具,那就是Transformers庫中的pipeline方法,pipeline 將前面提到的模型使用所有步驟封裝成一個簡單的函數調用。我們只需要使用這個函數方法,指定需要完成的任務類型,當然我們也可以指定特定的模型和配置來定制使用。Transformers庫是由Hugging Face公司開發的一個開源Python庫,里面除了pipeline外,還有很多其它的方法和工具,這里就不細說了。

具體的使用其實就是幾行Python代碼就可以搞定,非常簡單。這里額外說下,我們經常在使用寫python的時候,需要安裝編譯器和配置環境,往往這些環境配置就已經消耗了我們的所有激情了。這里,感謝google大大提供的一個在線編程工具colab,直接解決所有安裝和環境問題。

Colaboratory界面如下,就是一個可以在線寫python代碼的「筆記本」。

我們新建一個文件,然后輸入第一行代碼:

pip install transformers

就這樣一行代碼,Transformers庫就安裝好了。后面具體的操作,點擊上傳圖片。

隨后編寫的代碼和解釋如下,懂一點點python和編程的人,應該就能寫出來。寫完后點擊代碼側邊的運行按鈕即可。

輸出的文案是:arafed woman sitting on the ground with a camera and a tripod. (一位戴著頭巾的女性坐在地上,旁邊放著相機和三腳架。)基本識別出來圖片中的主要內容。

到此,我們的第一個模型的選擇和使用的demo就完成了。

這段代碼的地址如下:

https://colab.research.google.com/drive/1NWTircHzljiU2MNCKjA9PpyGJCMcpqmc?usp=sharing

三、最后

如果我們有更復雜的想法,比如我們可以用得到的圖片描述,再用LLM模型,幫助編寫一個故事腳本,再通過一個文生視頻模型,變成圖片或者視頻,具體的流程如下圖所示。

這些都是可以用一個一個模型拼接出來的。至于如何拼接,后續的文章中會繼續介紹。

因此,在AI時代來臨之際,如果你是一個有想法的產品,那么可以自己通過這些多種多樣的模型實現自己的想法。分享一個我看到的有意思的模型實踐,利用codeformer模型,去除圖片的馬賽克,大家可以去huggingface上體驗下,https://huggingface.co/spaces/sczhou/CodeFormer

突然感覺這個應用可能蠻有前景!你覺得呢?哈哈哈。我也是AI入門學習者,對于模型的使用還有很多其它的平臺和方法,我也在摸索中,歡迎大家交流討論~

專欄作家

南村小付,微信公眾號:南村小付,人人都是產品經理專欄作家??焓指呒壆a品經理,曾任職阿里,歡聚時代,7年互聯網產品設計運營經驗。

本文原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!