AV无码电影一区二区三区,国产亚洲欧美在线专区,中文人妻精品一区久久

中文字幕无码av不卡一区,亚洲综合AV永久无码精品一区二区,黑人巨大白妞出浆,黄色高清无码免费看,久久久久免费精品国产,久久无码人妻丰满熟妇区毛片,欧美日韩国产综合草草,久久福利网站,亚洲一区二区三区中文字幕在线,av国内精品久久久久影院

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

大模型「混亂期」：誰能在混亂期中突出重圍？

藍洞商業

2023-12-12

0 評論 1248 瀏覽 2 收藏

19 分鐘

隨著ChatGPT的爆火，對百度、騰訊、阿里和字節為代表的國內互聯網大廠來說都不想錯過這個機會。如何在底層模型能力上跑出一大批落地的 AI 應用，抓住這個混亂期成功突圍？國產大模型什么時候能跟 ChatGPT 一樣好用？

ChatGPT 爆火一年，大模型的競爭走到哪一步了?

從微信指數的數據，可以管中窺豹到各家大模型的感知度，ChatGPT 遙遙領先，依然是國內大模型們追趕的對象。

而國內互聯網大廠的大模型梯隊中，百度的文心一言和阿里的通義千問，依賴于發布時間較早，是產品感知度比較高的存在，尤其是文心一言3 月率先發布、 8月全面開放，已經進化到 4.0 版本。

而老對手騰訊和字節，分別在今年 8 月和 9 月亮相了自家的大模型產品，在時間線上屬于跟進 ChatGPT 較晚的梯隊，姿態也都相對低調。

先看字節的大模型戰略，是先在 8 月上線了 AI 聊天機器人「豆包」，隨后自研的大模型產品云雀在 9 月浮出水面，而「豆包」正是云雀大模型在垂直場景中的應用產品。

最新的動作是，在海外上線 AI 產品「ChitChop」，應用場景比「豆包」的海外版本「 Cici 」更豐富，如此密集的產品布局，被外界認為是字節從「 APP 工廠」朝「 AI工廠」邁進。

再看騰訊的混元大模型，正式發布于 9 月，屬于國內互聯網大廠中最晚入場的玩家，也是至今沒有單獨發布獨立大模型 APP 的互聯網大廠。混元大模型最直接的使用場景還是在微信小程序內，發布后最大的變化是， 10 月底開放了文生圖功能。

不做獨立 APP ，而是利用微信豐沛的流量做大模型小程序，優先迭代基礎能力，是騰訊混元大模型的現狀；而同樣流量豐沛的字節，則選擇布局多款 AI 大模型垂直產品，在國內外市場同時押注。

至此，字節和騰訊這對老冤家，正在大模型的賽道背道而馳。

OpenAI上線一年，其自身團隊的變動成了大模型混亂期的轉折點；而當國內「百模大戰」告一段落，誰能在混亂期中突出重圍？

一、騰訊，依然「不著急」？

關于大模型能力的測試有很多，各家大模型的產品能力也各有千秋。

騰訊方面曾宣稱，在信通院測評主流大模型測試中，混元的模型開發和模型能力均獲得了當前的最高分數。

相較之下，第三方個人測評更直觀，在科技公司研究員Yuri自發研究的測評中，騰訊混元大模型在國產大模型的同題測試中排名靠后。

Yuri通過一套考公的行政職業能力筆試測驗題，對百度文心一言、字節豆包、阿里通義千問和騰訊混元大模型進行了測試，一共 99 道題目。結果顯示，混元大模型在常識判斷、言語理解與表達和推理判斷等方面都差強人意，總體上的正確率為 34.3%，排在 12 個國產大模型末尾。

「混元是此次測試讓我大跌眼鏡的模型，沒有之一?！筜uri在測試后點評說，「前十道題連錯是我完全沒想到的，我大概半年前就一直在期待宇宙廠和鵝廠的模型，覺得他們或許會帶來驚喜感，宇宙廠達到了預期，但沒想到鵝廠的模型居然是醬紫。」

Yuri也在測試中說明，「本測試結果沒有任何地緣和公司立場，單從一個用戶體驗角度評論，僅表示模型在所測試題目及同類題目的任務表現，并不能完全代表模型在其他任務上的能力和表現?！?/strong>

這次測試的時間為 11 月中旬，而 GPT-4 的測試結果為正確率 73.7%，Yuri最后總結，「Open AI 在燈塔尖，我們在長城內，大家都有光明的前途吶」。

他同時提到，混元的回答生成速度跟通義千問差不多，但測試中共用了 7 輪對話完成這次測試，單次對話的上限是 30 次，多了之后就會出現「會話過長，請開始新會話」的提示。

第三方個人測試一定程度上反映出了混元大模型的問題。此前就有騰訊內部人士稱，混元大模型在公司內部受到了批評。相關測試者透露，「不好用」是騰訊內部一部分人的共識。

「不著急」是今年9月份，騰訊混元大模型對自己的定調。雖然后續一直在更新迭代，但版本更迭速度相比國內同行的確稍慢。

截至 12 月 7 日，混元大模型對外使用的版本為V1.5.5，距離混元大模型正式發布已經過去了整整三個月，而百度文心一言已經在 10 月份開啟了4.0 收費版本，同期阿里通義千問也進化到了 2.0 版本。

不跟同行比，或許可以說是混元大模型一大特色。其發布后一直低調前行，最初只限于邀請測試，10 月開始逐漸放開，最新的動作是在 10 月 26 日官宣開放「文生圖」功能，并稱升級后的騰訊混元中文能力整體超過GPT3.5，代碼能力大幅提升20%。

最能展現騰訊混元大模型升級進化的案例是，不同進化階段對同一問題的回答。

同一個問題，混元大模型在 10 月和 12 月給出的不同答案「藍洞商業」在 10 月中旬的測試中發現，混元大模型對未知的問題會給出幻覺性的答案。其實，幻覺問題一直是大模型的通病，簡而言之就是杜撰甚至是一本正經的胡說八道。而升級之后，12 月的表現明顯更智能，對未知的問題會給出帶有可解釋和可說明性的答案。

早在 9 月份，騰訊混元大模型發布時，其就稱在解決「大模型幻覺」問題上能力突出，主要方法是不依賴外掛，在預訓練階段通過「探真」算法進行事實修正，讓混元大模型的幻覺相比主流開源大模型降低了 30 %至 50 %。

騰訊旗下 AI Lab 也曾就大模型的幻覺問題做出論文研究，題目為《AI 海洋中的海妖之歌：大語言模型中的幻覺調查》?？梢哉f，騰訊在「大模型幻覺」問題上早已有所準備。

聚焦自身大模型技術和能力的升級，而不是像百度、字節一樣廣泛拓展 C 端應用場景，可以看作目前騰訊混元大模型的重要戰略之一。

同時存在的問題是，混元大模型仍局限在騰訊流量范圍內，尚未與對手產生正面競爭。

二、字節從「APP工廠」到「AI工廠」

退中有進，是字節 11 月的關鍵詞。

就在 PICO 和朝夕光年大幅度裁員縮減團隊規模后，字節成立了一個新 AI 部門Flow，技術負責人為字節跳動技術副總裁洪定坤，業務帶頭人為字節大模型團隊的負責人朱文佳。此舉被解讀為字節押注大模型，減少游戲和 XR 相關的投入。

Flow 聚焦的是 AI 應用層，也就是大模型廠商最渴望得到的能落地的應用產品。字節在 AI 相關應用層最新發布的產品「ChitChop」，由新加坡公司 POLIGON 開發，在海外上線運營。

此前，字節曾在國內和國際上推出了豆包和Cici，這兩款初級階段的產品都是提供知識問答、續寫、內容生成等服務。

而 ChitChop 的主打功能遠比此前的 Cici 和豆包更全能，200 多款智能應用遍布AI創作、AI 繪圖、休閑娛樂、學習提升、工作效率提升和生活助手六大方面，號稱「旨在提供創造性靈感和提升效率」。

至此，新加坡成了字節在 AI 戰略中的重心所在，POLIGON 是字節海外的重要運營公司之一，2020年在新加坡注冊成立，主營業務是軟件和應用程序的開發，其次是電腦游戲的開發。

更關鍵的是團隊核心所在。2021 年，原今日頭條 CEO 朱文佳調任新加坡，負責 Tiktok 的技術研發，外界猜測新加坡將成為 Tiktok 海外新總部駐地。另據《中國企業家》報道，張一鳴目前身處新加坡，他招聘了數名 OpenAI 的員工來組建團隊，學習 AI，探索一些新玩法。

海外上線的 ChitChop，目前下載量等數據并不亮眼，但可以看作是字節在大模型 C 端應用層面的一次探路。但潛在問題是，海外版的ChitChop，Logo的標識也是簡寫的 CC，這與此前發布的 CiCi 在名稱上有很大的雷同，極容易被混淆。

ChitChop背后的支持是字節的云雀大語言模型，如果說 ChitChop 是做好的商品，云雀大模型就是背后的提供商品的大商場。ChitChop 借助云雀大語言模型的能力，能夠提供更加智能和個性化的服務。

而云雀大語言模型只是字節 AI 戰略的一部分，其還通過火山引擎做大模型的平臺服務。也就是說，B 端模型層和 C 端應用層，兩手都要抓。

火山引擎智能算法負責人、火山方舟負責人吳迪曾公開表示，「火山方舟平臺上面有眾多優質的、精選的國內的高質量商用模型，像智譜 AI 的 ChatGLM 的商用版本，像 MiniMax 的 MiniMax-ABAB 5.5 以及字節的云雀模型等等。我們有很多客戶基于方舟平臺，在這些優質的商用模型上去開發自己的應用?！?/p>
而依賴于抖音和 TikTok 的影響力，多個 AI 相關產品將借勢推出。

據公開報道，字節將推出一個名為「機器人開發平臺」的開放平臺，允許用戶自主創建自己的聊天機器人。此外，抖音還計劃在主APP內推出多個 AI 聊天機器人，近期已經上線的「抖音心晴」定位情緒關懷機器人。

既做商品，又做商場，萬箭齊發、廣泛布局的策略，自然很容易被理解為字節從「APP 工廠」變成「AI 工廠」。

問題在于，在底層大模型技術和能力完全落后于 ChatGPT 的狀態下，應用場景是否真的有競爭力？曾經在移動互聯網時代成功的打法，能否在 AI 大模型成功復用？都是留給字節的拷問。

大模型的基礎能力，決定了應用場景的上限，尤其是 ChatGPT4.5 版本即將到來，字節的 ChitChop 尚且稚嫩，在海外市場能否正面競爭？也是一個未知數。

三、誰能抓住 OpenAI 的混亂期？

就在山姆·奧爾特曼被戲劇性趕下臺，又在微軟的支持下重回 OpenAI 的 CEO 之位，各方 AI 勢力都在蠢蠢欲動，試圖在這個混亂期，重新找回屬于自己的人工智能機會點。

以谷歌為代表，12 月 7 日發布的 AI 大模型 Gemini，就號稱比包括 ChatGPT 在內的目前市場上任何產品都要強大，其發布了高中低三個版本的大模型，分別是適用于高度復雜任務的 Gemini Ultra 、適用于各種任務的最佳模型 Gemini Pro 以及適用于端側設備的 Gemini Nano 。

其中 Gemini Pro 對標的是免費版 ChatGPT，而最高版本的 Gemini Pro 將于明年年初開始給開發人員廣泛使用。

而同樣是大模型加應用層的策略，谷歌的 Bard 聊天機器人遠遠落后于 ChatGPT，而發布大模型之后，谷歌將把Gemini 大模型的能力賦加在 Bard 聊天機器人上，明年還將發布一款名為 Bard Advanced 的聊天機器人，而適用于端側設備的 Gemini Nano 大模型則會引入安卓手機中。

在谷歌最吸引人的 6 分多鐘演示視頻中，Gemini 大模型的能力得以展示，它可以根據人在紙上隨意畫出的形象，實時給出人一樣的判斷和推理回答，并且能夠檢查物理作業問題，診斷預先寫好的解決方案，并給出正確答案。

但僅僅兩天后，谷歌就被「打臉」了，谷歌大模型并沒有外界傳說的那么驚艷。

事實上，那段演示視頻并非是實時進行的，也不是通過語音對話完成的，Gemini 并不能達到視頻中的效果，谷歌方面后來承認，「為了本次演示，我們縮短了延遲并精簡了 Gemini 的輸出?！?/p>

而根據谷歌自己發布的數據對比圖，Gemini Ultra 僅以微弱優勢領先于 OpenAI 的 GPT-4 模型，換句話說，谷歌最新的 AI 模型，水平僅僅比 OpenAI 一年前的基礎高一點而已，并非有巨大的優勢，況且目前真正代表 OpenAI 實力的，是下一代的 GPT-4.5或 GPT-5。

可以說，即便是巨頭谷歌，當下 AI 發展的狀態也是追趕 OpenAI，其急于通過產品展示和證明自己的 AI 發展速度，本身是一種利用 OpenAI 混亂期的營銷策略。

OpenAI 的混亂期，是 AI 行業滾滾浪潮中的一個插曲，尤其是「 GPT 商店」推遲到 2024 年發布，這無疑是 OpenAI 商業化前進中的一個減速動作，對OpenAI來說是一個坎坷，但對行業競爭者來說，可能就是一個突圍時機。

「百模大戰」已經告一段落，謹慎如騰訊，激進如字節。這對昔日的老冤家，如今都在大模型戰略上不遺余力，走上了截然不同的發展路徑，背道而馳：一個極力擴充 AI 大模型的使用場景，找到下一個超級流量入口；另外一個則是不斷打磨大模型的技術和能力，把使用場景局限在小程序范圍內。

AI 大模型之戰是互聯網巨頭不能丟掉的陣地，而對百度、騰訊、阿里和字節為代表的國內互聯網大廠來說，各家的底層大模型產品雖然數據能力各有差異，但基礎設施已經有了。

下一個競爭焦點，就是如何在底層模型能力上跑出一大批落地的 AI 應用，抓住這個混亂期成功突圍。最本質的問題依舊是：國產大模型什么時候能跟 ChatGPT 一樣好用？

作者：趙衛衛

來源公眾號：藍洞商業（ID：value_creation），深度、原創、有趣的商業人物和故事。

原文標題：大模型「混亂期」：謹慎如騰訊，激進如字節

本文由人人都是產品經理合作媒體 @藍洞商業授權發布，未經許可，禁止轉載。

題圖來自 Unsplash，基于 CC0 協議

該文觀點僅代表作者本人，人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App

產品能力大模型字節混亂期騰訊

藍洞商業

深度、原創、有趣的商業人物和故事

29篇作品 103110總閱讀量

為你推薦

2023年，誰還“信”主播？

09-191372 瀏覽

如何擺脫工作中的「撕扯感」？

11-16848 瀏覽

數字化時代，你了解大客戶銷售嗎（上）

06-026875 瀏覽

營銷人如何駕馭AI，適應到來的挑戰？

07-122489 瀏覽

如何通過運營突破在線教育的轉化瓶頸，這個方法你一定要懂

01-1111051 瀏覽

評論

評論請登錄

目前還沒評論，等你發揮！

為你推薦

淘寶開始測試“甄選直播間”

01-113644 瀏覽

To B軟件產品設計三原則

04-133787 瀏覽

打假成為流量密碼，“B太們”名利雙收

05-063728 瀏覽

快訊
查看更多

熱門文章

拼多多穩賺不賠的起店思路

12-03

服務型數字人：銀行的降本增效還是面子工程

12-24

銷售組織目標達成的驅動力及影響因素——銷售管理中的溝通技巧「7」

12-10

游戲主播環游世界，一條視頻漲粉百萬

12-10

用戶體驗設計能給播音主持藝術帶來什么（一）：理念的融入

12-24

爺爺奶奶“殺”入Vlog賽道，為何要搶年輕人的這杯羹？

12-04

文章導航

一、騰訊，依然「不著急」？

二、字節從「APP工廠」到「AI工廠」

三、誰能抓住 OpenAI 的混亂期？

關于
人人都是產品經理（woshipm.com）是以產品經理、運營為核心的學習、交流、分享平臺，集媒體、培訓、社群為一體，全方位服務產品人和運營人，成立12年舉辦在線講座1000+期，線下分享會500+場，產品經理大會、運營大會50+場，覆蓋北上廣深杭成都等20個城市，在行業有較高的影響力和知名度。平臺聚集了眾多BAT美團京東滴滴360小米網易等知名互聯網公司產品總監和運營總監，他們在這里與你一起成長。

合作伙伴

鏈接

隱私政策

投稿須知

意見反饋

幫助中心

公眾號

視頻號

友情鏈接

PM265

產品經理導航

起點課堂

豬八戒網

人才熱線

伙伴云表格

網易易盾

個推

友盟+

糧倉

創業邦

每日報告

鳥哥筆記

慕課網

旗下品牌: 起點課堂 | 運營派 | 糧倉企微管家
?2010-2024 - 人人都是產品經理 - 粵ICP備14037330號-粵公網安備 44030502001309號
 廣播電視節目制作經營許可證（粵）字第03109號增值電信業務經營許可證粵B2-20190788 版權所有 ? 深圳聚力創想信息科技有限公司

大模型「混亂期」：誰能在混亂期中突出重圍？

一、騰訊，依然「不著急」？

二、字節從「APP工廠」到「AI工廠」

三、誰能抓住 OpenAI 的混亂期？

大模型「混亂期」：誰能在混亂期中突出重圍？

一、騰訊，依然「不著急」？

二、字節從「APP工廠」到「AI工廠」

三、誰能抓住 OpenAI 的混亂期？