百度“文心一言”,就這?
3月16日下午,百度舉行文心一言發布會,盡管發布會引發了眾多吐槽,但是作為國內第一款對標ChatGPT的產品,百度也算是邁出了第一步。百度“文心一言”到底怎么樣呢?本文作者親測了“文心一言”后,分享了他的看法,一起來看一下吧。
“沖刺”一個多月后,百度文心一言終于來了,但剛出道就遭到群嘲。
3月16日下午,百度舉行文心一言發布會,被寄予厚望的發布會居然沒有產品現場演示,而是采用“Demo演示”的形式,用提前準備好的問題和答案做展示,瞬間引發眾多吐槽。或許百度是吸取了谷歌的教訓,看到其因Bard產品在演示中“翻車”導致市值一下子蒸發了1000億美金后,才變得謹慎。
不僅如此,很多對新產品躍躍欲試的用戶們,被“邀請碼”阻擋在了門外。直到晚間,才有極少部分用戶真正“嘗鮮”。
深燃拿到邀請碼后,第一時間實測了文心一言的“五大能力”,整體感受是,文心一言的大多數回答,還算流暢自然,產品達到可用水平,但對于部分基礎問題,不能正確理解題意,更不要說給出準確答案,而且多輪對話能力也有所欠缺。
就在前一天,國內外還沉浸在對3月14日OpenAI新上線的GPT-4的討論中。GPT-4比上一代準確性更高,解決問題能力更強,可以處理超2.5萬字的文本,并支持圖像輸入,盡管現在圖像輸入還未對外開放,但這款產品已經拔高了用戶對產品的標準。
在文心一言發布的當晚,微軟再發“重磅炸彈”,舉辦了一場Microsoft 365 Copilot發布會,將GPT-4模型引入Office應用程序,舉個例子,熬夜趕不完的論文Word、看不出數據聯系的Excel表格,都可以找Copilot來幫忙。Copilot也被評價為,要顛覆打工人的工作方式。
自去年12月以來,中外大廠們都紛紛沖刺,試圖追趕ChatGPT,百度被視為是國內比較有希望追趕ChatGPT的選手之一,兩相對比,有部分用戶表示看到文心一言時,覺得被迎頭澆上一盆冷水。資本市場對百度的文心一言似乎也不買賬,發布會進行過程中,百度股價一度下跌10%。截至3月16日收盤,百度股價報125.1港元,跌6.36%。
不可否認,作為國內第一款對標ChatGPT的產品,百度也算是勇敢的邁出了第一步。但此前百度鋪天蓋地的宣傳已經拉高了外界預期,目前看來文心一言有些高開低走,讓外界對其何去何從產生了質疑。
01 親測百度文心一言,不夠AI
從2月初官宣要集中“沖刺”,百度文心一言吊足了外界的胃口。
但在正式發布時,觀眾們的評價都是“文心一言,一言難盡”、“CheatGPT”等不太正面的言辭。
對于這次百度文心一言和ChatGPT的PK,英諾天使基金合伙人王晟對深燃形容道,就像是“China PPT VS ChatGPT”。
百度“文心一言”究竟怎么樣?在發布會現場,百度創始人李彥宏從文學創作、商業文案創作、數理推算、中文理解和多模態生成五個方面舉例展示了文心一言的能力。拿到邀請碼后,深燃也從五大層面對文心一言進行了體驗,并將部分答案與接入GPT-4的微軟New Bing或基于GPT-3.5的ChatGPT進行了對比,試圖得到一些結論。
在文學創作層面,在對于最近爆火電視劇《黑暗榮耀》的劇情總結時,文心一言的答案和劇情不太相符,New Bing的答案更貼近劇情。不過,在深燃提出將電視劇進行喜劇改編時,兩個產品的表現都不算太好,但New Bing對于追問的回答,更加靈活。
圖源 / 文心一言
圖源 / New Bing
在商業文案的創作能力上,我們讓這兩個產品分別給“文心一言”想一句廣告詞,文心一言設計的廣告詞詞句更加優美,而New Bing設計的廣告詞更側重于產品特性。
圖源 / 文心一言
圖源 / New Bing
至于數學推理能力,對于小學奧數題的解答,文心一言給出了一個錯誤答案,New Bing的最終答案是準確的。
圖源 / 文心一言
圖源 / New Bing
對于中文理解能力,讓兩款產品解讀網友對于文心一言邀請碼的調侃,結果是,文心一言和New Bing都沒能精準解讀其中的調侃意味,不過文心一言識別出了KFC是快餐品牌,還提醒不要將該邀請碼和特定品牌關聯。
圖源/文心一言
圖源 / New Bing
在腦筋急轉彎式的對話中,交給文心一言“要電話號碼”的任務后,其在第二輪就忘記了,而ChatGPT還記得上一輪的隱藏任務。
圖源 / 文心一言
圖源 / ChatGPT
在多模態生成方面,目前ChatGPT的識圖功能還沒對外開放。文心一言可以根據文字生成圖片、語言和視頻,但是這并非新功能,此前在百度的其他產品中也已經看到過。而且文字生成圖片有時生成的圖片并不精準。比如,本意是想獲得一只阿拉斯加犬圖片,但由于表述不夠精確,最后得到的是一張動漫圖片。
圖源 / 文心一言
總結下來,從深燃的初步體驗來看,“文心一言”沒有達到驚艷效果,有時更像搜索引擎,回答問題的方式相對模式化,情感色彩流露較少,在回答問題的精準性、靈活性、上下文多輪對話等方面還有待提升。而基于GPT大模型的產品在語言組織和創造能力上更加靈活、流暢,交互性更強一些。
智能客服從業者Allen對深燃表示,僅從個人體驗的主觀感受而言,如果說ChatGPT能夠提供正確答案的比例在90%,那么文心一言只有70%。不過,至少從用戶體驗的便捷度而言,文心一言之于國內用戶,要比ChatGPT更加方便。
02 距離OpenAI,百度差了多少步?
對于“文心一言”的產品表現,百度創始人李彥宏略顯底氣不足,在發布會剛出場不久,就開始主動降低用戶預期。他說道,“要對標ChatGPT、甚至GPT-4,門檻還是很高的”、“自己測試還是感覺有很多不完美的地方”。
產品的背后,國內大廠和OpenAI相比,差在了哪里,差距又有多大?
AI大模型之爭最早是在國外科技巨頭之間,此后國內大廠紛紛跟進。有專家分析稱,在2020年中GPT-3發布后,雙方差距進一步拉大,當時很多人認為不僅是技術的差距,更體現了AI模型的發展新理念。
在GPT-3的基礎上,OpenAI進行了大量的微調和訓練,增強交互性、更加產品化后,有了基于3.5版本的ChatGPT。
值得注意的是,3月14日GPT-4的發布,再次拉大了雙方的距離。和上一代相比,GPT-4有很多跨越式提升,包括邏輯推理能力更強,比做題家更會考試;支持圖像輸入并能理解圖像;能接收超大上下文,支持輸入處理超過25000個單詞的文本;更有創造力,能夠寫代碼、寫小說、編劇。
差距拉大的背后,是人才、資金投入和技術積累的差距。
伴隨著ChatGPT的火熱,從業者們都表示,要做底層AI大模型,資金、頂尖科技人才、技術積累,這些要素缺一不可。
做大模型,前提是有資金的投入。OpenAI在2019年獲得微軟10億美金的投入后,又于今年獲得了微軟100億美金的投資,這讓其有了燒錢的資本。業界測算,GPT-3涉及1750億參數,訓練費用約花費1200萬美元。據國盛證券報告估算,GPT-3訓練一次成本約為140萬美元,每一次訓練任務都耗資巨大。
此外,大模型訓練的三要素包括大算力、大數據和大模型。有從業者指出,影響最后訓練結果的因素有很多,包括清洗、標注、模型結構設計、訓練推理的技術積累等。每一個因素的變化都影響著最后的結果。
過去十幾年里百度一直在AI方面投入,包括2019年推出文心大語言模型。2022年百度核心研發費用達到214.16億元,占百度核心收入比例達22.4%。
但是,百度和OpenAI還有不小差距。李彥宏也表示,無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。因為深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。
王晟曾指出,中國的ChatGPT們即便奮起直追,靜態來講兩三年能追上就已經是樂觀情況。但如果對方一直進化,且進展速度遠比追得速度要快,那么可能永遠都追不上。直到對方遇到瓶頸不得不停下來,或者國內選手找到新的技術路徑,才有可能打平。
03 AI,百度不能輸的一戰
相較于完美,文心一言更加注重“爭第一”,李彥宏強調,“對標ChatGPT,百度是全球大廠中第一個”。
大模型帶來了AI產業的變革,也將是未來十年的主流趨勢,這已經成為了業界共識。
想要入場分羹的選手不少。自去年12月ChatGPT發布之后,無論是一級市場,還是國內外的大廠,都在發力大模型,研發類ChatGPT產品。
在國內一級市場上,投資機構為了投大模型公司,焦慮難安,行業幾乎每天都會有大量認知的迭代。與之相應的是創業熱潮,前美團聯合創始人王慧文、出門問問CEO李志飛、前搜狗CEO王小川、前京東高級副總裁周伯文等一批大佬,都在殺向大模型賽道。
國內大廠們更是如此。除了百度之外,阿里、騰訊、華為、字節、科大訊飛、商湯都沒有放棄大模型之戰。
相較于其余互聯網大廠而言,AI,是百度“不能輸”的一戰。王晟分析道,站在企業角度,騰訊、阿里等大廠,發力AI是給原有業務提供助力,但AI之于百度是生死問題,需要“殊死一搏”,也會用出“破釜沉舟”的力氣來研發新產品。
在百度的營收結構中,廣告是大頭,2022年占六成左右,但近幾年,呈現萎縮局勢,而且被阿里、騰訊等大廠超越。百度需要搜索引擎的變革來使得廣告業務回溫。另一方面,百度近幾年在AI方面投入頗多,而且一直對外強調其AI能力,更是將以AI為特色的百度智能云當作重要增長曲線。
OpenAI在GPT-4發布后,通過ChatGPT Plus付費版以及面向企業開放接口,正從一家小型非營利性實驗室向一家成熟的商業公司轉變。Allen認為,百度作為互聯網大廠,自身體量比較大,有很多業務線可以直接用上文心一言,享受商業化的紅利。
此外,AI大模型時代的到來,也將帶來大量產業機會。李彥宏在發布會上稱,大語言模型帶來三大產業機會:第一類是新型云計算公司,其主流商業模式從IaaS變為MaaS;第二類是進行行業模型精調的公司,這是通用大模型和企業之間的中間層,他們具有行業Konwhow(技術訣竅),調用通用大模型能力,為行業客戶提供解決方案;第三類是基于大模型底座進行應用開發的公司,即應用服務提供商。
盡管“文心一言”和ChatGPT相比或許還有差距,但并不意味著其沒有發展空間。
一方面,能夠發布一款成型產品,百度在國內爭奪的第一,確實領先了其他同行。另一方面,在國內用戶和企業較難順暢使用ChatGPT的情況下,需要一款本土產品來提供服務?!凹疾蝗缛恕钡那闆r下,百度還可以靠本土化取勝。李彥宏也提到,百度在沒有完全準備好的情況下發布“文心一言”,是出于市場的需要。
考慮到信息安全和數據安全等因素,中國必須要有自研的AI大模型。王晟分析,由于AI算力的高投入和高技術門檻,目前中國能做語言類大模型的團隊非常有限,有潛在能力做的只有10來個團隊,最終能成的可能只有2-3家。
也就是說,百度或許并不需要和ChatGPT正面硬剛,只要在國內市場上能夠占據領先位置,就能夠享受中國市場所帶來的紅利和發展空間。
王晟認為,短期內,百度的“文心一言”或許沒有達到市場預期,但從中長期來看,百度還是具備一定的競爭力。
新一輪AI范式變革,才剛剛開始。
作者:王敏;編輯:金玙璠
來源公眾號:深燃(ID:shenrancaijing),聚焦創新經濟,專注深度內容。
本文由人人都是產品經理合作媒體 @深燃 授權發布,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!