無論好壞,“推理”人工智能模型已成為一種趨勢
“推理 AI 模型興起,前景機遇挑戰并存?!?在人工智能領域,推理模型成為新趨勢。它們究竟為何備受關注?又面臨著哪些困境與爭議?未來發展之路在何方?
推理模型讓AI走得更遠,但它的成本卻讓人望而卻步。
在OpenAI發布其所謂的推理模型o1之后,來自競爭對手AI實驗室的推理模型如雨后春筍般涌現。
今年11月初,由量化交易員資助的AI研究公司DeepSeek發布了其首個推理算法DeepSeek-R1的預覽。同月,阿里巴巴的Qwen團隊也推出了他們聲稱是首個“開放”版的o1挑戰者。
那么,是什么引發了這一波浪潮呢?其中一個原因,是尋找創新的方法來優化生成型AI技術。正如我的同事Max Zeff最近報道的那樣,“暴力破解”式的技術,雖然曾經幫助模型規?;〉眠M展,但如今已經無法帶來過去那樣的提升。
AI公司面臨著激烈的競爭壓力,必須保持當前創新的步伐。根據估算,全球AI市場在2023年已達到1966.3億美元,預計到2030年將增至1.81萬億美元。
OpenAI表示,推理模型能夠“解決比以前更難的問題”,并代表了生成式AI發展的一個重大進步。但并不是每個人都確信推理模型是未來發展的最佳路徑。
卡內基梅隆大學的機器學習副教授阿米特·塔爾沃卡(Ameet Talwalkar)表示,他對首批推理模型感到“相當印象深刻”。但他也同時提到,他“會質疑那些堅定聲稱知道推理模型會將行業帶向何方的人”。
塔爾沃卡說:“AI公司有財務動機去描繪他們技術未來版本的光明前景。我們面臨的風險是,過于狹隘地關注單一范式,這就是為什么更廣泛的AI研究社區必須避免盲目相信這些公司所宣揚的炒作和市場營銷,而是應該聚焦于切實的結果?!?/p>
推理模型的兩個主要缺點是:一是成本高,二是能耗大。
以OpenAI的API為例,使用其推理模型o1,OpenAI收費每分析約75萬字為15美元,每生成約75萬字為60美元。這是OpenAI最新的“非推理”模型GPT-4o的3到4倍費用。
o1可以在OpenAI的AI驅動聊天平臺ChatGPT上免費使用,但有使用限制。然而,OpenAI本月早些時候推出了一個更高級的o1版本——o1 Pro模式,年費高達2400美元。
加利福尼亞大學洛杉磯分校計算機科學教授蓋伊·范登布羅克(Guy Van Den Broeck)告訴 TechCrunch:“大型語言模型推理的總體成本肯定不會下降?!?/p>
推理模型成本如此高的一個原因是,它們在運行時需要大量的計算資源。與大多數AI不同,o1和其他推理模型在生成內容時會進行自我檢查,這幫助它們避免了通常困擾其他模型的陷阱。然而,這種自我驗證也意味著它們往往需要更長的時間來得出結論。
OpenAI預計,未來的推理模型將“思考”數小時、數天甚至數周。盡管使用成本會更高,OpenAI承認,但這些推理模型可能帶來的突破性成果,從新型電池到新型癌癥藥物很可能是值得的。
然而,今天的推理模型在價值上并不那么顯而易見。非營利組織Ai2的研究員兼機器學習工程師Costa Huang指出,o1并不是一個非??煽康挠嬎闫?。社交媒體上的簡單搜索也能找到許多o1 Pro模式的錯誤。
“這些推理模型是專門化的,可能在一般領域表現不佳,”Costa Huang告訴《TechCrunch》?!耙恍┫拗茣绕渌拗聘绫豢朔??!?/p>
蓋伊·范登布羅克認為,推理模型并沒有真正進行推理,因此它們能成功解決的任務類型也有限。他表示:“真正的推理適用于所有問題,而不僅僅是那些在模型訓練數據中可能出現的問題。這個挑戰仍然是我們必須克服的主要問題。”
考慮到市場上強烈的動力推動推理模型的發展,我們可以合理推測它們會隨著時間的推移不斷改進。畢竟,不僅僅是OpenAI、DeepSeek和阿里巴巴在投資這一新興的AI研究領域,風險投資家和來自相關行業的創始人也在聚集,共同展望一個由推理AI主導的未來。
然而,塔爾沃卡擔心,大型實驗室可能會“把控”這些進展。
“大型實驗室出于競爭原因保持保密是可以理解的,但這種不透明性嚴重妨礙了研究社區與這些想法的互動,”他說?!半S著越來越多的人朝這個方向努力,我預計[推理模型]將迅速發展。不過,雖然有些想法將來自學術界,鑒于此領域的經濟激勵,我預計大多數(如果不是全部)模型將由 OpenAI 等大型工業實驗室提供?!保═echCrunch)
本文由人人都是產品經理作者【AI新智能】,微信公眾號:【AI新智能】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!