希爾伯特旅館里,住著AI的某種真相

1 評論 1118 瀏覽 3 收藏 12 分鐘

人類在許多領域都會面臨“無窮”這一命題,有時當某件事逼近或者抵達無窮時,這件事可能還會出現反常識、反邏輯的一面。而這一趨向或許可以用于解讀當下大模型、AI人工智能的興起和發展。在本篇文章里,作者便結合希爾伯特旅館悖論、“智能涌現”等概念進行了解讀和分析,一起來看。

“無窮”和“無窮+1”,哪個更大?

已經吸收了不知道多少數據的AI模型,和比他多學習一條數據的模型,哪個更智能?

想聊聊這個問題,出于一個偶然的機會。很早之前我在測試ChatGPT的時候,突然想問他個刁鉆問題,于是就問它:“希爾伯特旅館悖論,對現實世界有什么影響?”

說實話,ChatGPT答的驢唇不對馬嘴,還硬拗出幾點,有他一貫的特色。但其中一段回答值得琢磨。他答:“希爾伯特旅館對于計算機科學是有幫助的,因為當我們處理無限大的數據集時,希爾伯特旅館可以作為我們思考方式?!?/p>

無限大的數據集,這東西顯然不存在。但當大模型訓練用的數據參數達到某種天文數字,當真人反饋機制成為常態,模型在使用過程中會接觸難以估量的數據。這難道不是某種無限嗎?

但人類能控制無限嗎?

今天這個話題,其實更接近某種科幻討論,或者一些關于AI未來的腦洞。可能大家讀完之后也不清楚在說什么。但也無妨,我們就當一起舒展一下大腦,放松一下最近被ChatGPT弄得挺焦躁的心情。

一起去希爾伯特旅館,度個假吧。

一、歡迎來到,悖論旅館

這家旅館坐落在名叫“數學”的熱帶風情度假勝地,有的人來了不想走,有的人一想到它就口干舌燥。

希爾伯特旅館,其實是德國數學家大衛·希爾伯特在討論無窮這個概念時,舉的一個生動例子。它既是一個數學游戲,也經常躋身知名的若干悖論之一。

它的具體意思是說,假設一家旅館有無窮個房間,但是都住滿了。這時候又來了一位旅客要訂房間,酒店主人就可以不慌不忙,讓1號房間客人移到2號,2好移3號……以此類推,反正房間數量是無窮的,這樣新的旅客就可以住1號房間。

而這時,又來了一車旅客。酒店主人依舊如法炮制,讓每個房間的客人都向后移動N個房間,最終把新來的客人安置進去。

以此類推,接下來會發生什么呢?假如新來了無窮個客人。那么酒店老板只需要讓每位客人都移到單號房間。比如2號房間移到3號房間,3號房間移到5號房間,把偶數房間都空出來,那么無窮個客人依舊可以住進去。

即使來了無窮多個旅行團,每個旅行團有無窮多位旅客,希爾伯特酒店依舊有辦法,只需要把非2n(n∈N+)號房間就都空出來就行了。

希爾伯特旅館之所以是個悖論,因為它標明了這樣一件事:無窮是無法比較的。

無窮+1等于無窮;無窮+N等于無窮,無窮加無窮,無窮乘無窮,那還是無窮,無窮是紋絲不動的,又是隨時變化的,無窮是可以包含若干個無窮的。

總之,無窮是難以名狀的。

二、無窮這玩意,會有點怪

聽上去,希爾伯特旅館悖論好像沒啥用。其實不然,人類在很多領域幾乎都必然面對“無窮”這個問題,至少在理論推導和概念驗證環節,面對無窮幾乎是必然的。一個事物可以比另一個更無窮,但它們倆都還是無窮。這樣的思路可以進行很多假設,也可以解釋很多問題。

比如說,在物理學當中,希爾伯特旅館悖論可以來解釋量子物理學中的很多現象,其中最典型的就是量子場論中關于虛粒子的假設。關于虛粒子是否真實存在,抑或是一種純粹的假設工具,這個問題有著非常多的爭論,但它確實可以用來解釋引力、光子、膠子等物理定義,進而為解釋真空中的能量情況,分析宇宙輻射做出幫助。前提在于,我們需要用希爾伯特旅館的思維,來理解存在于無窮中的虛粒子。

在計算機科學中,數據存儲是個基本問題,而在設計數據結構的時候,就需要考慮如果有海量數據需要存儲,結構上究竟如何調動能夠保證效率最優,故障率最低。這時就需要假定數據集是無窮的,希爾伯特旅館也就用上了。

無窮很怪,這個概念還經常被用在文學創作,尤其是科幻小說當中??苹檬菍ξ磥淼耐蒲?,但如果某件事可以增長到無窮,它往往會出現反常識的狀態。比如說永生不死的人,它可能首先就會失去對時間的概念,因為無窮的時間已經沒有意義了,進而表現出完全失去人類的一切特征,畢竟人類的所思所為,都是在時間有限這個前提下驅動的。又比如瞬間移動,它會不會讓空間失去意義,進而讓人失去辨別空間的需求和能力,進而出現從來不想停留下來的人,而始終都在超高速移動的人,究竟還是人嗎?

一件事如果逼近甚至抵達無窮,它就會超出控制,出現反常識,反邏輯的一面。這個邏輯,對于AI似乎也適用。

三、用這個邏輯,解釋智能涌現

這幾年伴隨著預訓練大模型的興起,越來越多的人開始談“智能涌現”。一般來說,所謂“智能涌現”現象,是指當模型規模突破某個未知的界限后,就會突然涌現出驚人的智能。比如模型會表達出訓練者預想不到的邏輯感、流暢性,甚至是人類稱之為情商的東西。

事實上,智能涌現作為一個目標,并不是今天才有。早在上世紀70年代,專家機器人的理論構想就是在輸入足夠多的知識后,讓計算機展現出一種無所不知,無所不曉的效果,從而幫助人類解決各種問題。只是礙于當時的算力與數據承載能力,最終這個設想無法落地。

而在今天云計算+大數據的組合下,更大規模的數據集可以應用到AI訓練中,加上深度學習在算法上實現了更好的數據吸納能力,才最終產出了ChatGPT為代表的智能涌現現象。

智能涌現到底是怎么實現的,這一點就像深度學習的黑箱性一樣,始終沒有特別合理的解釋。但“智能涌現”這個詞卻不是AI專有的,這個詞更早是一個生物學詞匯,是用來描述螞蟻、魚群表現出的集體智能行為。一只螞蟻挺傻的,一條魚也不聰明,但當大量螞蟻聚集到一起,所表現出的那種分工明確、體系森嚴、結構精巧的組織行動方式,簡直讓人嘆為觀止。是螞蟻的大腦進化了嗎?恐怕并不是,而是在螞蟻聚集到一定規模后,突破了某種希爾伯特旅館式的智能邊界。

從這個角度看,大模型這條AI之路,或許終極目標并不是模仿人類。它不需要進化出直覺、情感、自由意識這些人類獨有的東西。但它會積累無窮多的數據和知識,當我們無法觀測和預估大模型里擁有多少知識,那么它就有無窮的知識。AI模型就變成了一座類希爾伯特旅館,它可以吞噬更多知識,吞噬更多無窮,最終可以表現出人類想要的智能,也可能表現出更多人類不想要,或者沒準備好想要的東西。

或許我們改換個思路,最終的通用人工智能AGI、強人工智能Strong AI,可能內在機制并不類似于人類,而是更近乎螞蟻,近乎魚群,近乎希爾伯特旅館。

我們總是討論AI像不像人,能不能做人類所做的,人類有哪些獨有能力,巴拉巴拉巴拉。這是因為我們不住在希爾伯特旅館里,我們住在一個有限的世界,住在短暫的生命和易朽的軀殼里,住在一個絕大部分構成物是水的大腦里。但AI不是,它相比人類更加貼近無窮。他能通過圖靈測試,他最終能做到一切。但我們并不知道為什么,因為AI并不想成為人,他只是剛好住在希爾伯特旅館里。

“智能涌現”或許是個征兆,它告訴我們,AI的進化目標不是人類,而是《星際爭霸》里的蟲族。

作者:風辭遠

來源公眾號:腦極體(ID:unity007),從技術協同到產業革命,從智能密鑰到已知盡頭。

本文由人人都是產品經理合作媒體 @腦極體 授權發布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. “智能涌現”或許是個征兆,它告訴我們,AI的進化目標不是人類,而是《星際爭霸》里的蟲族。—-細思有點極恐

    來自江蘇 回復