4類GPT產品模式、4個GPT小項目、4個商業化風險——AI產品經理視角

6 評論 23175 瀏覽 132 收藏 13 分鐘

本文作者從AI產品經理的視角,對最近2個月學習使用ChatGPT的經驗進行了總結,包括4類GPT產品模式、4個自己做的小項目、4個商業化風險。感興趣的小伙伴們一起來看一下吧!

以下是從AI產品經理的視角,對最近2個月學習使用ChatGPT的總結,包含4類GPT產品模式、4個我做的小項目、4個商業化風險。

  • 4類GPT產品模式是:Prompt類、Embedding類、Fine-Tune類、LLM類
  • 4個GPT小項目是:內容生成、做個小程序、Embedding類項目、嘗試Fine-Tune自己的GPT
  • 4個商業化風險是:GPT迭代速度太快了、數據安全問題、內容審核、OpenAI政策問題

一、4類GPT產品模式

結合這段時間的項目經驗,我把目前chatGPT類的產品化模式分為四類,由簡單到復雜介紹一下。

1. Prompt類

僅使用chatGPT,這一類是最常見,也是商業化做得最多的。

核心是利用Prompt引導去生成內容,比如日報生成器、小紅書標題生成器、英語學習等,上面這個圖片是我發現整理比較好的,另外也推薦下【外語易學堂】小程序,可以學習52種外語

2. Embedding類

向量數據庫 + 搜索 + chatGPT。強烈推薦大家重點看這個方向!無論是私人助理,還是智能客服,只要是結合自有知識生成回答的項目,都繞不開這個方案,產品化空間很大,我自己也是花了最多時間在這個方向。

截圖是鼎鼎大名的chatPDF項目,技術方案大致如下:

  • 文本切割: 將自有的文檔或知識,切割成一小塊一小塊的,每一塊都向量化(可以用OpenAI的Embedding接口),返回這段文本的 embedding 的向量數據。存儲這些數據,并且保存好對應關系。
  • 用戶提問: 將用戶提的問題也向量化,拿到問題的向量數據。
  • 搜索向量: 計算相似度。用問題的向量,在之前切割的所有向量數據里,計算和問題向量相似度最高的幾個文本,可以直接使用余弦定理。
  • 調用 ChatGPT: 將搜索到的知識和用戶提問拼在一起,加上一段準備特殊的 prompt(例如:使用以上內容回答以下問題 ),去調用ChatGPT接口,生成回復。
  1. 技術方案看起來簡單明了,但在實現過程中也有非常非常多的細節,后面會結合我自己實際操作講一下注意事項。

3. Fine-Tune類

不斷微調,去訓練一個專屬自己的GPT模型。比如你想做一個銷售機器人,和客戶聊天的語氣盡可能模擬金牌銷售的樣子,這個機器又能掌握公司所有產品的知識,那你就最好自己Fine-Tune一個自己的專屬模型,因為現有的chatGPT不能做到如此的擬合你的語氣。

但這里有很大的成本問題,GPT-3的Davinci訓練100M數據大概需要5萬塊人民幣(記不太清楚了),部署也要另外收費,成本很高,此外GPT3.5是不支持Fine-Tune的。不過Fine-Tune時候也不一定非要用Davinci,根據和Azure的溝通,他們在某些項目上使用Ada做分類模型的效果也很好。我們也嘗試過Fine-Tune,過程感人,后面再說。

4. LLM類

自己從頭做一個GPT類的完全屬于自己的預訓練大模型。這個是大公司專屬,參考百度文心一言、王慧文大佬的創業項目。不過其實考慮到Meta已經將LLaMA開源了,小團隊做一些非商業化的項目還是可以的(參考斯坦福發布的Alpaca),但是難度依然很大,不建議大家直接沖,另外就是要注意版權問題,因為我也沒做過,不詳細展開了。

二、4個我做的小項目

1. 內容生成

最簡單最容易上手的,當然是直接生產內容啦。為了驗證GPT的生成能力,設計了一個小實驗:利用GPT生成文案,再用剪映一鍵成片,從而實現批量生成視頻內容。經過2天的熟悉后,很快可以15分鐘內穩定輸出40s視頻。一周時間我制作了40條視頻,收獲xx點贊,x個粉絲,后面就懶得搞了,囧。

2. 自己做了一個學外語的小程序

瘋狂使用GPT嘗試不同的應用場景后,我發現教育是非常適合GPT特性的,也特別適合個人開發者。因為開發比較簡單,我就自己順手做了一個學習52種外語的小程序——外語易學堂,能糾正語法錯誤,可以模擬一個私人教練一樣和你展開溝通,特別適合社恐星人,再也不用去英語角了。

3. Embedding類的項目

這個是我們參考chatPDF做的一個嘗試,在在實際使用時候,效果也確實很好,怎么提問都能生成合適的回答。步驟簡介在上面說過了,下面我結合業務實際使用情況,分享下當前存在的問題,包括且不限于:

  • 富文本處理:這個是最大的問題,目前公開的GPT3.5是不支持富文本識別的,比如客戶上傳一個圖片詢問如何處理,這種答案就無法回答,15日公開的GPT4暫時也沒開放圖片輸入的能力,等OpenAI發布新版本后我們會再次修改產品。
  • 多輪對話:這個是第二大的問題,GPT3.5支持的最大token數是4096,實際應用中4輪左右的對話就會觸及上限了,繼續提問就會出現“遺漏記憶”的情況。這部分我們也和Azure的同學專題溝通過,他們也沒有什么特別好的辦法,不過好消息是GPT4的token長度增大了不少,但是價格也太貴了,用不起用不起。
  • 其他:知識的時效性、知識權重、內容過濾、Embedding的工程化問題等,細節其實很多,大家想看下次單獨起一個文章。

    4. 嘗試訓練自己的GPT

    因為GPT3沒開源(我們也微調不起),就想著是不是可以利用GPT2 + RLHF試著做一個特定小領域的chatGPT,經過近20余人連續1周幾千次的標記,結論是xxxx(回頭再說吧,都是辛酸淚,單標注平臺的設計就很麻煩了)

    三、4個商業化問題

    回頭看這2個月以來的產品化路徑,心情是跌宕起伏的。最開始激動不已,感覺AGI終于要到來了,但當從商業化、產品化角度去考驗GPT時候,又發現一堆的問題,有些沮喪,再到后來OpenAI不斷釋放最新的接口,商業化似乎又可以期待了,類似情況循環往返,現在終于到了比較平靜的狀態,總而言之吧,前途是光明的。這里列舉一下我碰到的商業化問題。

    1. GPT迭代速度太快了

    這看起來是一個好事,但其實也是一個頭疼又幸福的煩惱。經常是你一個商業模式剛開始做,GPT就出了新版本了,以前的東西就要重新思考。比如一開始沒有發布GPT-3.5-Turbo模型,做產品時候要用session的方案去模擬請求,后來發布了GPT3.5的API后,產品又要重新開發。

    又比如多模態問題,這個GPT4發布后看起來解決了一部分(要測試一下才知道),但注定又要重新設計產品。快速迭代的模型是好事,但至少現階段來看,是不利于發展成熟的商業模式的,大家不太敢大規模投入,可以參考jasperAI和Grammarly的情況

    2. 數據安全問題

    經過和微軟Azure的反復確認,目前OpenAI是沒有在國內部署服務器的,也就是說你所有的請求內容都要出國,送到美國的服務器處理。這個大公司尤其敏感,也就注定了百度文心一言會有市場,如果你在大公司,就要仔細考慮下了。

    3. 內容審核

    如果要做商業化,對輸出內容的zz審核及敏感內容過濾是一定要注意的,建議GPT生成的內容再過一遍審核服務,避免別人爆破你的服務,輸出一些不安全的內容。

    4. OpenAI政策問題

    3月初開始,OpenAI的API地址就被墻了,需要自己想辦法。另外上周開始,OpenAI封禁了一批“非法請求”的賬號,從國內/香港等OpenAI不支持地區的訪問,將會被封禁賬號,具體自己看OpenAI的政策。我當時收到的郵件如下:

    四、有趣產品分享

    下面是幾個非常有趣的產品推薦,他山之石可以攻玉,朋友們看一下:

    五、參考資料

    1. 如何體驗chatGPT

    最小白的問題其實也很重要,如果你已經會使用GPT了,直接跳過。

    • 國內直接用: 推薦【阿旺機器人】小程序,這個是BaixingAI公眾號開發的,使用最簡單,國內就能用。
    • OpenAI官方直接點這里,用起來比較麻煩。
    • API訪問: 注冊賬號,拿到API key,使用https://chatx.me、OpenCat等訪問,注冊方法自己搜索吧。

    2. GPT原理學習

    有點基礎的可以直接看以下內容,再次說明,這個是產品經理視角的,算法工程師們請直接看論文:

    3. 幾個好的開源項目/論文

    • ChatGPT 中文調教指南:大量的中文調教prompt,很實用。
    • 微軟的Visual ChatGPT:連接 ChatGPT 和一系列視覺模型,以實現在 ChatGPT 的聊天過程中發送和接收圖像。
    • Meta推出的Toolformer:讓LLM自己學會使用工具,在實際業務中,很多場景是需要機器人自己調用外部工具的,期待早日成熟。

本文由 @FakeFelix 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 您好,Embedding類 小白,求指導

    來自廣東 回復
  2. 您好,我搜索了很多相關信息,但是并沒有找到關于chatPDF原理的描述,請問您能給出一些來源嗎?根據文中的意思,應該是chatPDF做了問題和知識庫的embedding,然后使用算法進行匹配,最后僅僅是使用chatGPT生成符合語言邏輯的回答,是這樣嗎?

    來自美國 回復
    1. 是這樣的,GPT只是用來生成更人性化的語言。(之前的回復被站長吞了)

      來自廣東 回復
  3. 111111111

    來自上海 回復
  4. 體驗了一下外語易學堂,真心覺得爛,加載慢而且還只是文字對話而已,還以為是語音對話

    回復
    1. 啊這,我自己一個人順手做的小程序,給你免費玩的,和氣和氣

      來自廣東 回復