騰訊終究還是出了大模型,測了下感覺還行
就在昨天,騰訊也發布了自己的通用大模型——騰訊混元大模型,具體其表現如何?作者對其進行了體驗,并總結了相關體驗感受,與你分享。
今天,騰訊官宣亮相了混元大模型。
6 月中旬,騰訊曾推出了自己面向 B 端行業的 MaaS( Model-as-a-service,模型即服務 )解決方案,方案中包含了很多行業大模型,但沒有通用大模型。
現在,騰訊終究還是忍不住了。
這次,知危編輯部也想辦法獲得了混元大模型的體驗資格,下面就帶大家看看混元的能力。
首先是常規的對話,我們先看看多輪對話:
以上內容僅能展示連續對話,內容真實性無法驗證。
正常的問題是可以一直聊下去的( 與其他同行相同,混元也有最大連續對話數的限制 ),回答的內容也尚可,并且它會知道哪些信息可以說、哪些信息不可以說。
下面我們看看它提供方案的能力:
策略上沒有什么太大的問題,考慮得相對周到,還是有一定參考價值的。
再讓它生成一個演講稿:
覺得有些太正式官方了,讓他調整了一下:
混元的表現尚可,還是可以起到啟發或者生產力工具的作用的。
下面我們再看看它的語義理解能力:
當我們要求進一步解釋時,混元應對的也比較好:
除了常規的對話,混元還給出了比較豐富的 “ 特調 ” 應用,叫作 “ 靈感發現 ”,囊括了各個場景下的諸多功能:
我們測試了一下社群營銷文案,剛好最近中秋節要到了,看到一些社群在發月餅團購文案,就讓混元也試了一下。
作為對比,我們先找了一下盒馬社群關于月餅的社群營銷文案看看大概什么樣:
混元的表現如下:
感覺味兒還是對的,隨便修修改改就能用。
除此之外,還有專門的代碼模式和代碼解釋器。
我們先讓混元生成了一段 2048 游戲的代碼:
然后再把它生成的代碼扔進它的代碼解釋器功能里,它解釋的還行:
好了,編輯部的測試大概就是這么多,總地感覺下來,混元的水平跟國內一線大廠持平,說不上驚艷,但也沒掉隊,執行各種不同領域任務時的表現在 GPT-3.5 水平上下浮動。
自打 8 月 15 日《 生成式人工智能服務管理暫行辦法 》開始施行后,行業開始有了明晰的規范,已經有一批大廠的大模型獲得了全量面向公眾開放的資格。
這意味著行業迎來了一個成熟的時機:數量不設限的用戶可以更好地給大模型提供訓練資料,讓大模型更快成長。
所以,騰訊大模型的發布,極有可能是看中了這一點。
如此一來,最后一個一線大廠也加入了通用大模型的 “ 大亂斗 ” 中。
希望未來某一天,它們能卷出點讓人眼前一亮的東西。
作者:二筒;編輯:大餅
來源公眾號:知危(ID:BusinessAlert),提供敏銳、獨到的商業信息與參考,重點關注TMT、出海、新消費、新能源。
本文由人人都是產品經理合作媒體 @知危 授權發布,未經許可,禁止轉載。
題圖來自騰訊混元大模型官網
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
哈哈,8月20-22怎么會是周末