中國AI長卷(三):算法生根
從算法模型的萌芽到預訓練模型的興起,再到云智合流的產業變革,本文全景式地展現了中國AI如何在風雨中生根、成長,并在技術浪潮中孕育出豐碩的果實。
“中美AI差距究竟有幾年?”這個問題困擾了不少人,也有很多聲音嘗試將中美AI實力進行比較。其中,算法,一定是評判的首要標準。
中美AI算法究竟是什么水平?我們可以用“第七個燒餅”來理解。
ChatGPT就是AI的“第七個燒餅”。深度學習算法的熱潮持續了十多年,終于在LLM(大語言模型)智能涌現之后,看到了實現通用人工智能的曙光。就像一個饑餓的人,連續吃了六個燒餅都沒吃飽,直到吃完了第七個燒餅,終于覺得飽了。
OpenAI為代表的美國企業,在底層研發和核心算法上占據領先地位,率先吃到了LLM的“第七個燒餅”。隨后,中國也極速跟進了這個領域,很快推出了對標ChatGPT、GPT-4水平的算法模型。
對此,有人欣慰:咱們雖然晚了一步,但也吃到了“第七塊燒餅”(中國沒有錯過大模型的機會)。
有人憤怒:這一次技術突破又是美國公司主導,它們肚子里可比我們多好幾塊燒餅呢(美國領先我們至少十年)。
有人迷惑:早知道吃第七個燒餅就能飽,前面六個都不應該買(大模型之前的智能化探索全都白干了)。
還有人質疑:中國根本沒有能力做燒餅,能吃上是因為別的攤主公開了做燒餅配方(谷歌Transformer、OpenAI GPT-1/GPT-2都是開源的)。
以上不同的情緒,有各自的道理,源于對算法的認知不同。
《終極算法》一書的作者寫道:在農業中,人類進行播種,確保種子有足夠的水分和營養,然后收割成熟的作物,而這也是機器學習的承諾。算法是種子,數據是土壤,程序是成熟的作物。
算法,就是將大規模數據轉換成更合理、更智能決策的復雜程序,模型是它的軟件形態。算法模型,是AI產學界最重要的“收成”。
從這個角度看,簡單對比中美誰先拿下ChatGPT,其實并沒有太大意義。大眾真正關心的,是中國有沒有讓算法這顆“種子”播種、生根、成長、結果的能力,能不能確保中國接下來吃到新算法的第八塊、第九塊……乃至第N塊 “燒餅”,持續滿足各行各業享用AI的需求?
要搞清楚這個問題,我們得回到第三次AI浪潮的肇始,回到深度學習算法這顆“種子”剛剛萌芽的時候,看它是如何在中國落地生根的。
一、萌芽階段:深度學習的中國土壤
今天我們已經知道,深度學習是聯結學派的主算法,主導了第三次AI浪潮。
可問題是,深度學習并不是在2011年才橫空出世的概念。早在20世紀40-60年代,深度學習的雛形就出現在控制論中。訓練多層神經網絡的關鍵技術反向傳播算法,是1986年提出的。聯結學派,在2006年開始復興。
那為什么,深度學習在2011年左右,才正式掀起了AI的新高潮呢?
背后有三個要素,構成了深度學習“種子萌芽”的土壤:
- 越來越多的數據量。深度學習算法的中心思想,就是將大量計算單元連接在一起來實現智能行為,這個多層神經網絡就類似于大腦的神經元,依靠大數據進行學習和訓練,而互聯網、智能手機提供了較好的數據基礎,2011年谷歌大腦成功識別了一只貓,2012年蘋果推出了Siri,成為深度學習算法的先行者。
- 越來越低的錯誤率,或者說越來越好的模型效果。2012年,多層神經網絡Alex Net在ImageNet 大型視覺識別挑戰(ILSVRC)中獲得冠軍,并大幅超越了使用傳統機器學習算法的第二名,此后,深度學習每年都贏,證明了該算法的有效性。
- 越來越多的成功應用,深度學習這逐步成為主導算法,被工業界用來解決很多實際問題,與上一代智能產品和應用相結合,讓一度停滯不前的語音識別、圖像識別、NLP等任務都得到了提高。
大數據、技術能力、智能產品,當時在中國,具備讓深度學習萌芽的條件嗎?有兩股力量可以。一是以BAT為代表的互聯網公司,一是科大訊飛為代表的早期AI公司。
BAT為代表的中國互聯網公司,擁有海量數據以及國際化視野與人才團隊,同時有搜索、語音、電商等數字化業務與應用,擁抱深度學習算法是必然。
2010年,百度成立自然語言處理部,由現任CTO王海峰帶領,開始在語言與知識技術上布局,提出了“自然語言立足中國、面向世界一流水平”的定位。2012年,百度積極關注并接觸深度學習領域的領軍人物Geoffrey Hinton,并于2013年建立了IDL深度學習研究院,2014年又成立了大數據實驗室BDL、硅谷人工智能實驗室SVAIL。除此之外,騰訊也在2012年成立了優圖實驗室,阿里巴巴成立了iDST(數據科學與技術研究院)。
另一支探索路線,則是科大訊飛為代表的早期AI公司。
這些公司大多是中國在智能領域的早期探索者,比如科大訊飛成立于1999年,創始人團隊主要來自中科大電子工程系人機語音通信實驗室。
在2011年之前,科大訊飛就以智能語音技術為核心,進行了一系列技術、產品探索,比如科大訊飛聯合高校開發的復雜語音合成、語音識別引擎,就打破了海外廠商的壟斷,其語音軟件在教育、電信、金融、學習機等領域都有商用。隨著深度學習算法在國際上嶄露鋒芒,科大訊飛有意愿、有能力、有場景,將深度學習與原有的智能語音業務相融合。在2011年上線了中文語音識別DNN系統,2014年啟動了“訊飛超腦計劃”,探索讓“計算機能理解會思考”的感知智能和認知智能。
2023年,面對“中國何時能有類ChatGPT”“中美AI技術代差十年、三十年”的焦慮情緒, BAT、科大訊飛等企業作為中國大模型的第一梯隊,很快帶來了文心、混元、通義、星火等基礎大模型。當然不是靠摘開源的“果子”,而是深度學習算法的“種子”,萌芽之初,就扎根在中國AI的土地上,并持續生長。
二、生長階段:沐浴CV的春風
深度卷積神經網絡(CNN)在圖像識別和其他視覺任務中的突出表現,拉開了AI 1.0階段的帷幕。
具體來說,此前傳統的機器學習算法,雖然識別的精度和準確率也在提升,但始終無法同時保證準確率和識別效率,難以達到應用規模。而卷積神經網絡CNN由于參數共享和稀疏連接,非常適合處理圖像數據,在大規模圖像數據上訓練得到的深度卷積神經網絡模型,可以不斷從底層特征中提取更高層的特征(機器看得懂),最終更好地進行下游任務的處理(機器看得到)。
CNN為核心技術,在圖像識別、目標檢測、圖像分割、圖像生成等算法方面,帶來了極大的進步。2014年,香港中文大學團隊讓機器在人臉識別任務上的表現第一次超越了人類,被認為AI 1.0階段的里程碑事件。
疊加智慧城市、智能安防等概念的興趣,CV計算機視覺飛速發展,成為深度學習最成功的應用領域。
這一階段,沐浴在新算法春風中茁壯成長的,自然就是CV企業。
2014-2017三年間,曠視科技、商湯科技、依圖科技、云從科技相繼成立,依托于領先的計算機視覺技術,成為行業領導者和資本市場的寵兒,估值迅速上升,成為大家熟知的“CV四小龍”。它們的算法模型,被廣泛應用在城市、安防、醫療影像、工業質檢等領域。
當然,除CV之外,我們也不能忽略深度學習算法在NLP、語音、自動駕駛等多個領域中的進展,給許多行業帶來了發展動力。
比如長短期記憶網絡LSTM大幅提高了語音識別的準確性,智能助手在這一時期內得到了顯著的性能提升,海外的蘋果Siri、谷歌Google Assistant、亞馬遜Alexa、微軟Cortana等,國內的百度小度、阿里天貓精靈等,被集成到多種智能終端軟硬件當中,并開啟了以語音交互為核心的智能家居元年。
自然語言處理方面,循環神經網絡(RNN)和LSTM被應用于語言模型、情感分析、機器翻譯等NLP任務。比如,這一階段的機器翻譯,就從統計機器翻譯(SMT)進入到NWT神經機器翻譯時代,可以說是翻天覆地,中國的BAT(百度、阿里、騰訊)、科大訊飛、搜狗等公司,都在各自的產品中部署了NWT,大幅提升了在線翻譯的連貫性、準確性和語感。
同時,深度學習還可以在感知和決策方面,為自動駕駛汽車提供支持,吸引了很多投資基金的興趣,進入了快速發展的黃金時期。百度在2013年啟動了自動駕駛汽車項目,2017年推出了Apollo平臺,并出現了小馬智行等一批面向L4自動駕駛技術的初創公司。
總的來看,AI 1.0階段,深度學習算法取代了傳統機器學習算法,成為這一階段的主算法,為很多領域的AI任務帶來了跨越式發展。
但這一階段的算法模型開發,仍是“手工作坊模式”,坊間戲稱“有多少人工就有多少智能”。依靠對大量數據的依賴,需要組建龐大的標注團隊,模型泛化性不足,專為某個特定任務而設計,需要投入開發人員進行大量重復開發和手工迭代優化等。
從“手工業作坊”到“工業化AI工廠”,算法仍需一場嬗變。
三、新生階段:云智一體的合流
凱文凱利說過,技術帶來的問題,只能靠技術進步來解決,算法也不例外。
從AI開發,從過去的手工作坊式向工業化升級,預訓練模型就是一條可以規?;a高性能AI模型的“工業生產線”。
2017年,谷歌在論文《Attenlion is All You Needs》提出了Transformer架構。沒有使用上一階段流行的卷積神經網絡CNN、循環神經網絡RNN、長短期記憶網絡LSTM、GRU等結構,僅使用了自注意(Self-attention)特性,引入了注意力機制和預訓練模型(PTM)。在機器翻譯、機器閱讀、自動問答、情緒分析、自動摘要、語言建模等場景,顯現出了前所未有的能力。2018年,基于Transformer架構的預訓練語言模型BERT,刷新了11項 NLP任務的最優性能紀錄。同年,OpenAI推出了GPT-1。
基于Transformer架構的預訓練模型,可以通過模型的預先訓練,帶來效果更好、質量更高的算法模型,下游只需要任務微調就能應用。這種“預制菜”一樣的“工業化模式”,一改小模型定制的積弊,讓大規模、可復制的AI應用成為可能,成為AI去往下一個時代的必經之路。
邁向預訓練模型的這條路上,中國幾乎與世界一流水平同步,得益于一個關鍵變化:云智合流。
打造預訓練模型,最困難的一項,就是專用算力不足,有的學校甚至買不起GPU卡,沒有AI算力用。同時,這一階段很多政企用戶加速上云,也希望智能化升級,以更便捷的方式獲取算法能力。
幸好,在這個算法更迭的關鍵窗口期,云+AI的融合基礎設施,已經在建設中。
2017年,將AI技術作為核心能力的華為云誕生。2018年,百度云更名為百度智能云,阿里云升級為阿里云智能。將AI引入公有云的能力版圖,成為主流。
云智合流,讓AI開發從“手工業”邁入到“工業化”,將原本散落在算法全生命周期中的各類需求,進行了“融合”:
- 算力融合。預訓練模型不僅需要龐大規模的異構算力,而且需要高度的靈活性,從訓練到推理的每個步驟,所需要的算力是差異巨大的。通過云廠商的基礎設施,企業可以彈性、靈活、按需取用地接入多樣、充沛的AI算力。獲取算力的方式變得簡單、高效、低門檻了,這就讓更多人參與到AI算法模型的開發中來,進入大規模生產階段。
- 流程融合。借助云廠商提供完整、全棧的AI能力和開發工具,包括預制數據集、模型庫、算子庫等,讓企業和開發者可以在云上完成從訓練-開發-推理-部署的全部環節。比如百度智能云的EasyDLBML平臺、華為云的AI開發生產線ModelArts等。
- 產品融合。時間來到2018年,智慧城市、智慧園區等都開始追求整體智能,希望構建一體化、解決方案式的“AI大腦”,整合算法、芯片、云端算力、框架、網絡、IoT等軟硬件,實現智慧決策能力的質變。這種情況下,云廠商和AI企業都要把自己變成一個“AI超市”,集成并供應豐富的AI技術能力與應用,讓行業用戶和開發者可以體系化、輕松地,獲取到所需要的AI能力。
比如百度智能云率先在業界提出了“云智一體,深入產業”的主張,發布了200多款產品和數十個解決方案,將百度AI技術釋放到金融、物流、工業、農業等多個行業。華為云在2021年啟動盤古大模型,并在2022年聚焦行業應用落地,基于盤古大模型的通用能力,打造了盤古氣象大模型、盤古礦山大模型、盤古電力大模型、盤古藥物分子大模型等。
可以說,云智合流,為中國AI跟上ChatGPT的大模型路線,奠定了基礎。
2023年以來,在海外算力形勢愈發嚴峻的背景下,國產預訓練大模型依然實現了“井噴”,在文本處理、圖像生成、音視頻生成、多模態等各個任務中,都完成了占位。放眼全球,唯有中美這兩棵繁茂的AI“榕樹”。
讓深度學習算法的這顆“種子”,在中國扎根、生長、成熟,這本身就是一種能力的自證。
回顧深度學習的十多年歷程,或許某一種具體的算法會被更新更好的算法所取代,但這個雨打風吹、反復更替的過程,也讓中國AI在時光中變得愈發堅韌,積蓄了經驗、匯聚了人才、釋放了信心。
只要根深蒂固,任爾東西南北風,中國AI都能在每一次技術趨勢中,生長出新的枝丫,結出產業期待的果實?!?/p>
本文由人人都是產品經理作者【腦極體】,微信公眾號:【腦極體】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!