人美聲甜GPT,數學題哪里不會講哪里

2 評論 1972 瀏覽 4 收藏 12 分鐘

近期,ChatGPT出現了新的趨勢,它開始逐漸向大模型相關的在線教育應用行業發展。這不僅會導致在線教育要面臨重塑,而且整個教育產業都要面臨巨大挑戰。本文作者分析了AI技術在教育領域的發展,感興趣的童鞋不妨來看看。

大模型的顛覆和變革,還只是開始。

ChatGPT一炮而紅,重塑搜索、辦公協同等多個場景和行業后,在線教育,被視為最重要的垂直場景——畢竟大語言模型展示出的能力,正是之前在線教育、AI老師所亟需的。

而且這種趨勢已經開始,背靠大模型相關的在線教育應用,已經率先在海外火爆。

看過來!讓GPT化身二次元美少女AI家教來講數學題的方案,每步都有解法,再不用擔心看見參考答案的“略”字:

人美聲甜GPT,數學題哪里不會講哪里

基礎到某個三角函數的定義,復雜到不同的解題方法與技巧,都能得到答案:

人美聲甜GPT,數學題哪里不會講哪里

這就是最近在海外火爆的AI解題類應用,背后App已經在App store商店教育分類板塊刷榜。

這種火爆在情理之中:背靠LLM,加上二次元畫風頗似《原神》——不得不說,真實拿捏住了流量密碼。

在這之前,在線教育行業的主流“AI家教”,背后的本質只是推薦算法,換句話說,就是推薦錄好的教學視頻或解題方法,但無法針對視頻和方法中的某些細節給出解答

而現在,LLM涌現的解題準確性和語言理解能力,開始對之前可望不可即的技術實現帶來了突破——不是在線教育面臨重塑,是整個教育產業正在面臨重塑。

01 背后技術原理:GPT+在線教育=?

二次元美少女家教身后,就是LLM在AI自動解題方面發揮著作用。

基本思路是在原有流程的一頭一尾,接入LLM,與原有流程中的CLM(可計算語言模型,Computational Language Model)形成Joint Model模式。

CLM,相比其他AI模型展現出不錯的邏輯能力,不過它在語言理解能力和輸出等方面,遇上如今包括GPT-4在內的大語言模型還是相形見絀。

Joint Model模式,就是讓LLM提供NLP能力CLM提供邏輯推理能力。

人美聲甜GPT,數學題哪里不會講哪里

也就是說,現在的整個AI解題的過程是這樣的:

題干輸入——LLM處理文本——CLM解題——LLM形成文本——講解輸出

二者結合,能完成的推理任務比單個模型處理的更復雜,并在必要時收集相關數據。

由是,AI家教能很好地理解題干內容,從而提供講解。

在兩端接入LLM之前,這條AI解題流程也能利用CLM,提供AI家教所需的數理邏輯和推理能力。

主要依靠CLM對文本信息進行數據升維,把一維文字信息進行高維展開,讓機器在同一時間接受文本背后諸如實體、關系、參數、知識等多維度的隱含信息,理解題干背后最終想要求解的東西是什么。

再對CLM進行“部分不召回”設定,即“不能保證100%做對的題,AI不會輸出結果”,從而保證AI家教的講解和最終答案一定正確

人美聲甜GPT,數學題哪里不會講哪里

這也能解釋為什么現在的Joint Model模式中,對LLM的應用重點在NLP領域,而非邏輯和推理能力上——

GPT-3.5起,大模型毫無征兆地涌現出數理邏輯和推理能力,但它們既不穩定,也不絕對可靠,AI家教無法在接入后直接落地使用。

與其執著于糾正LLM的“胡說八道”,不如轉而重點利用它相對穩定發揮的NLP能力。

02 二次元美少女AI家教背后是誰

有意思的是,這位AI家教背后還是一家中國公司。

來自悉之智能,2017年成立,核心創始團隊都來自清北。

創始人兼CEO孫一喬,清華大學電子系2017屆學生,在校期間參與搭建清華XLP超限學習團隊,并深度參與校內某院系課程體系深度改革,帶領數十人搭建了清華大學首個自適應學習引擎。

聯合創始人兼CPO代佩霖,北京大學金融系畢業,曾入選福布斯亞洲30 under30;算法合伙人林東生,也畢業于清華大學電子系,是悉之智能自研CLM背后的發明者之一。

幾位合伙從一開始殺入AI教育行業,就主攻自動解題。

入局之初,還算趕上了個好時候,加上是國內第一家做出多模態解題家教的公司,成立次年就拿下新東方旗下“東方新創” 的1000萬元天使輪融資。等到2020年,公司已完成近億元A輪融資。

直到2021年經歷雙減風暴……

好在雙減來臨的同月,仍然順利拿到2000萬美金的A+輪融資,投資方是啟明、經緯和真格等一線VC。

但是,公司業務重心不得不開始向海外市場轉移。

等到在新的市場站穩腳跟開拓市場,涌現邏輯能力的ChatGPT卻突然現世,突破了業界的傳統認知,也打亂了他們的陣腳:

我們原本以為AI不會這么快出現邏輯能力。

不僅低估了OpenAI在GPT系列上的進度,還低估了GPT涌現出的能力的強度。

早些時候,谷歌用一個36B的LaTeX數據集Fine-tuning PaLM540B,在MATH上取得了50分。同一測試集上選出CLM覆蓋的高中數學部分,悉之智得分在70分左右。

“比谷歌最引以為傲的PaLM得分高,也高于市場上的Photomath等產品,包括ChatGPT3.5最開始的解題能力得分也低于我們。”孫一喬邊笑著復盤邊揮舞胳膊,外化他的興奮。

人美聲甜GPT,數學題哪里不會講哪里

結果GPT-4光速出現,出場即碾壓所有玩家的解題能力。

但他好像并不沮喪,“這一波就是全世界看OpenAI裝逼嘛,驚得谷歌的下巴都掉下來了”。孫一喬的邏輯里,OpenAI虐了全世界,悉之智能的AI又能虐其他人,“沒什么不值得驕傲的?!?/p>

他還笑著補充,自家AI能力也不是為了刷榜好看,主要是能落到教育AI行業應用,這才是“至關重要”。

孫一喬很愛笑,熟悉他的人都這么說,尤其是在談到GPT系列對傳統帶來顛覆性影響和可能性的時候。

3月底,歐盟批準谷歌收購了我們在國際市場上最大的競爭對手,也是傳統解題公司的代表——PhotoMath。

每每提到這點,孫一喬都嘴角上揚,難掩興奮,要埋下頭用雙手捂臉數秒來平復心情。

PhotoMath納入谷歌麾下,有了技術、資金靠山,也代表著PhotoMath的一條快讀通道被封死了——這家數學應用程序公司接入GPT-4及后續GPT系列API的可能性幾乎為零。

但是GPT和CLM的組合,可以讓解題能力繼續突破。

這也是孫一喬“不沮喪”的數據支撐。在一個GPT-4解題率為82%的測試集上,悉之最新fine-tuning GPT的Joint Model最新解題率在92%。

究其原因,他的解釋是Joint Model天然包含大量解耦好的NLP任務,最新工作中,團隊把之前基于Bert的CLM換為fine-tuning后的GPT,將GPT作為預訓練模型,將CLM作為邏輯校驗模型,繼續提高解題上限。

人美聲甜GPT,數學題哪里不會講哪里

孫一喬還表示,LLM不只提升AI家教背后模型的NLP能力,對多模態交互也有不少幫助。

現在的AI家教形象,比以前聲音更好聽,形象也更好看。在接下來的計劃中,對話交互能力也將得到增強,在授課過程中隨時提問,都能得到AI家教的解答。

計劃中,旗下AI家教還會拓展數學之外的學科版圖,也將開啟新一輪的融資。

人美聲甜GPT,數學題哪里不會講哪里

深陷雙減風暴之后,教育底色的公司們都逐漸找到了新的打法。

?改弦更張的,如新東方,在直播領域大殺四方;繼續探索在線教育之路的,悉之智能利用LLM提升解題能力,優化多模態交互,據悉,猿輔導也已經用AIGC在傳統教育領域尋找新的機會。

LLM能力應用在教育領域后,不知道繼續深耕在線教育的這些公司里,誰又是新一輪的最大贏家?

作者:衡宇

來源公眾號:量子位(ID:QbitAI),追蹤人工智能新趨勢,關注科技行業新突破

本文由人人都是產品經理合作媒體 @量子位 授權發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 請問博主,用魔法棒后進入GPT-4即可使用?

    來自廣東 回復
  2. 這樣對接的成本會不會很高?如果一個用戶是學霸他刷了一天的題,花的token豈不是很多

    來自廣東 回復