火爆全網的ChatGPT,早被資本盯上了,國內有人剛融了10億
ChatGPT,這個由OpenAI開發的大規模預訓練語言模型可謂是火遍全網,用戶數量已突破100萬,免費公測版本的服務器都快就被熱情的測試用戶擠爆了。ChatGPT到底是什么?其背后的大規模預訓練模型是怎樣一條賽道,為何會受到眾多投資機構的追捧?融資熱背后,又離真正大規模商用落地還有多遠?本篇文章就來一探究竟。
這幾天,一個名為ChatGPT的聊天機器人徹底破圈了,火遍全網。
它寫得了代碼,修復得了bug,還能幫你寫工作周報、寫小說、進行高考答題,甚至你還可以誘騙它規劃如何毀滅人類。
盡管市面上已經有了大量的聊天機器人,但馬斯克仍然對此感嘆:“很多人瘋狂地陷入了ChatGPT循環中,我們離強大到危險的人工智能不遠了?!?/p>
這個看似無所不能的ChatGPT是由美國OpenAI開發的大規模預訓練語言模型,馬斯克曾是這家公司的創始人之一。
12月5日,OpenAI首席執行官Sam Altman在社交媒體上發文表示,ChatGPT于上周三推出,截至目前已突破100萬用戶。
甚至免費公測版本的服務器很快就被熱情的測試用戶擠爆了。
聯想集團副總裁、聯想創投集團高級合伙人宋春雨告訴創業邦,AI預訓練大模型的出現,成為了近三年以來AI算法創新最受關注的投資機會。
睿獸分析顯示,2022年以來,國內大規模預訓練模型賽道出現多筆大額融資,單筆融資金額高達10億元,其中不乏聯想創投、君聯資本、啟明創投、創新工場等知名投資機構。
被網友玩壞了的ChatGPT到底是什么?其背后的大規模預訓練模型是怎樣一條賽道,為何會受到眾多投資機構的追捧?融資熱背后,又離真正大規模商用落地還有多遠?
AI如何攻破人類,發人深省的回答
AI教你怎么找男朋友
幫你寫份周報應付老板
試一下python寫個判斷閏年,還有詳細的解釋,不過看上去像是在某個程序網站抄的
AI是如何一本正經地胡說八道的
一、“新晉網紅”ChatGPT到底是什么?
簡單來說,預訓練模型(Pre-trained Model)是前人為了解決問題所創造出來的模型。后人在解決類似問題的時候,無需再從零開始訓練一個新模型,而是可以利用此前在類似問題中訓練過的模型來解決現有問題。
與人們熟悉的語音助手不同,ChatGPT在與人們的對話中可以理解較為復雜的語句內容,比如有多層語法嵌套的句子。同時,ChatGPT擁有一定聯系上下文理解語境的能力,可以針對一個問題不斷深入交流。令人驚訝的是,ChatGPT既能承認錯誤、質疑不正確的前提,還能拒絕不恰當的請求。
這就意味著,ChatGPT已經可以實現圍繞某個話題,與人類展開一段談話討論的可能。
OpenAI官方稱,ChatGPT是在人類的幫助下創建并訓練的,人類訓練師對該AI早期版本回答查詢的方式進行排名和評級。然后,這些信息被反饋到系統中,系統會根據訓練師的偏好來調整答案。這是一種訓練人工智能的標準方法,被稱為強化學習。
據國盛證券研報,ChatGPT有著多達1750億個模型參數,OpenAI主要使用的公共爬蟲數據集是有著超過萬億單詞的人類語言數據集。
該研報指出,ChatGPT在尋找答案、解決問題的效率上已經部分超越了如今的搜索引擎。ChatGPT或許在未來會改變我們獲取信息、輸出內容的方式,AIGC(AI生成內容)有望成為數字經濟時代驅動需求爆發的殺手級應用。
不過,ChatGPT也并非上知天文下知地理的“最強懂哥”。
據官網顯示,ChatGPT目前存在著一些局限性,包括有時會給出看上去正確但荒謬的答案、微調提問的方式會得到完全不同的答案、有時會反復使用某些句子等。
網友也發現,ChatGPT有兩個明顯的缺點:輸入不能有錯,解釋不夠人性化。
所以,這個五天用戶突破百萬的模型突然遭到編程問答社區Stack Overflow的封禁。
目前,ChatGPT的研究團隊也表示將根據用戶反饋持續改進模型,未來還有很長的道路要走。
盡管如此,OpenAI依然被視為全球AI領域的頂級機構。
OpenAI在2020年推出的上一代GPT-3在當時就被稱之為人工智能領域的一個重要里程碑。
在此之后,OpenAI也開始嘗試對GPT-3進行商業化。目前,OpenAI以API的形式向開發者客戶有償提供GPT-3模型,并根據token使用量來收費。目前,基于GPT-3產生的App已經達到300多個。
今年大火的AI繪畫也與OpenAI密不可分。
最早,OpenAI曾推出一款DALL-E低代碼工具,用戶只要提出想法、輸入參數,電腦就會自動生成藝術級別的畫作。在這一波AI繪畫熱潮中,還涌現了Midjourney、Stable AI等初創公司,有些公司已經成為獨角獸。
正是預感到了大模型的巨大價值,在GPT-3推出的前一年,也就是2019年,微軟向OpenAI進行了高達10億美元的投資。
這也為微軟大力推進的云戰略吸引來了不少客戶。
例如,美國最大的汽車零售平臺CarMax利用OpenAI的開發工具把10萬條客戶評論直接進行了分析,根據客戶的表達情緒分類成正面、中性和負面,還提取了關鍵字摘要,對于公司的戰略決策起到了很大的幫助。
CarMax首席技術官甚至表示,如果沒有人工智能,這項工作靠人工編輯團隊需要耗費11年才能完成。
可以說,OpenAI帶給了人們巨大的想象空間。
二、融資火熱背后,離真正大規模商用還有多遠?
實際上,不僅是最近破圈的ChatGPT,近兩年國內也迎來了“大練模型”和“練大模型”的軍備競賽熱潮。
其中,自然少不了行業巨頭和高??蒲袡C構。
百度發布了產業級知識增強大模型“文心”(參數規模達2600億),并基于“文心”模型形成了產業全景圖。同時,華為聯合鵬程實驗室等也發布了“盤古”大模型,阿里巴巴達摩院發布了中文語言模型 PLUG。
此外,由北京智源人工智能研究院牽頭,匯聚清華、北大、人大、中科院和相關企業共同研發的超大規模預訓練模型“悟道”(悟道2.0參數規模達1.75萬億)也于2021年亮相。
“AI預訓練大模型的出現,成為了近三年以來AI算法創新最受關注的投資機會。”聯想集團副總裁、聯想創投集團高級合伙人宋春雨表示,隨著超大規模AI預訓練模型的技術突破,在自然語言理解方面已經展現出超高程度的可用性,簡而言之就是“機器真的懂人了”。
他認為,大規模預訓練模型是AI大數據要走的必然之路。從學術界和產業界的角度來看,AI和大數據技術的變化也會非常大。未來兩年、最多三年,AI將會有很大能力的提升。
回溯歷史,從最早Deep Learning到Alpha go,到Zero 自訓練,到Transformer,再到GPT-3, AI在突飛猛進的發展,并不斷落地在應用場景中,比如 AI制藥、預測化學分子都極大地提高了所在行業的生產力。
啟明創投合伙人周志峰也表示,人工智能過去10年發展集中在感知智能,特別是視覺和語音技術的突破。下一個十年,人工智能將走向認知智能,預訓練大模型是其核心技術推動力和關鍵基礎設施,讓AI吸收更多的知識去理解和思考,最終實現接近人類水平的認知。同時,預訓練大模型使得AI從依賴手工調參建模走向可大規模復制的工業化階段。
大規模預訓練模型被投資人看好,也直接反映在了投融資的熱度上。
睿獸分析顯示,2022年以來,尤其是下半年,大規模預訓練模型領域出現了多筆大額融資。
2月10日,瀾舟科技完成近億元Pre-A輪融資,由聯想創投、斯道資本共同領投,創新工場跟投。9月26日,智譜AI宣布獲得數億元B輪融資,由君聯資本和啟明創投聯合領投。11月7日,小冰公司宣布完成10億元新融資。12月6日,聆心智能完成數千萬元天使+輪融資,由連星資本領投,圖靈創投和智譜AI跟投。
這些企業均將商業落地作為融資后的發力重點,但其落地的側重點各有不同。
瀾舟科技研發的“孟子”模型,用更小的模型規模(10億參數量)實現了比肩超大模型的性能,能夠具備靈活的領域和場景適應能力,在機器翻譯、文本生成、行業搜索等場景更利于快速、低成本地落地。
2021年9月,瀾舟科技和傳神合作的第一個基于孟子預訓練模型的“任度”翻譯引擎正式發布上線,截至目前瀾舟科技已完成了各行業垂直領域20余個翻譯模型的開發,覆蓋新聞、金融、汽車等領域。
聆心智能目前則主要側重于游戲、營銷、情感三個領域。
聆心智能在12月推出了圖靈世界的首個產品“AI烏托邦”,用戶可快速定制 AI 角色,只需要輸入簡單的角色描述,就可以召喚出相應人設的 AI ,與之進行深度對話,還可以命令AI完成相應的任務。
此外,聆心智能還打造了Emohaa情緒療愈機器人,并與精神心理平臺好心情達成合作,落地了國內首款人工智能心理陪伴數字人;還與高端豪華電動車品牌Beyonca合作,打造了新一代智能駕艙助手。
新一輪融資公布當天,小冰公司啟動了對旗下人工智能數字員工(AI Being Employee)產品線的年度升級,其中之一就是加強大模型對話引擎。
據悉,目前小冰框架中運行了30萬名數字員工,包括萬科集團年度優秀員工“崔筱盼”、紅杉中國首位虛擬分析師“Hóng”、虛擬歌手“洛天依”等。由小冰框架生成的“小堂妹”等數名虛擬主播,全網播放量均已破億。
盡管各家的“大煉模型”已經在商業落地上取得了一些成績,但實際應用情況如何、能解決哪些實際問題仍然在遭受著用戶的質疑。
平安科技前沿技術部門負責人王磊就曾公開指出,當前大規模預訓練模型在垂直領域存在“致命”問題。
他認為,大規模預訓練模型在垂直領域性能達不到要求的原因可能是:大規模預訓練模型的訓練語料庫規模很大,既包含了該領域的關鍵信息也包含了其他無關信息,使得模型缺少對關鍵信息的關注。同時,當前大規模預訓練模型的機制改進也很少涉及對關鍵信息的提取。
不同于網友在ChatGPT上的“自娛自樂”,大規模預訓練模型一旦商用,假如出現錯誤,或將會造成難以挽回的實際損失。這也是客戶最大的擔心之處。
特別是金融行業的客戶對上線模型的精度要求很高,不少場景直接使用預加載模型往往很難滿足需求。
有投資人也表示,“盡管可以通過置信度評估方法等方式來提升模型的靠譜程度,但距離商用真正意義上的‘好用’仍有很長一段路要走?!?/p>
作者:巴里;編輯:子鉞
來源公眾號:創業邦(ID:ichuangyebang),創新成長,創業興邦。
本文由人人都是產品經理合作媒體 @創業邦 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!