月之暗面楊植麟:創新、長期、第一性

1 評論 4155 瀏覽 8 收藏 32 分鐘

今年早些時候,我們曾和楊植麟坐下來一起聊了2個小時,談到了AGI、創業、意識、哲學、生命和愿景。

Monolith礪思資本連續三輪投資月之暗面,以我們對這個團隊的了解,他們是一群足夠產品和結果導向、務實求真的AGI evangelists。

通往AGI的道路注定漫長,認清真正重要的事并且堅持下去,多年后到達目的地再回望時,可能會發覺當下很多輿論只是微不足道的噪音。

我們使用Kimi整理了這次對話的內容,希望對于外界了解月之暗面這家公司有更多的幫助。

在《2001:太空漫游》的開場,人猿將一塊骨頭高高拋起,隨著飛舞的骨頭升上太空,場景瞬間切換到幾百萬年后的太空,這塊骨頭也變幻成了太空中漫游的宇宙飛船。斯坦利·庫布里克用這樣一個極富沖擊力和想象力的轉場,用一瞬間完成了人類三百多萬年的進化之旅,這也成就了世界影史上最偉大的蒙太奇之一。

在這個史詩般的場景里,從茹毛飲血的石器時代到駕駛飛船登上月球,幾百萬年只在彈指一揮間,這都是因為人猿對工具(科技)的掌握。同時,這艘星艦上還搭載了銀幕史上最早的人工智能反派——一臺冰冷狡黠的超級計算機HAL9000,它也成為后來科幻電影中人工智能的鼻祖。

在1969年的夏天,阿姆斯特朗的聲音通過電視傳到了世界的各個角落,在離開地球后110個小時后,他成為航天史上登上月球的第一個人。那一天,全世界約有六億人通過電視直播觀看了這個人類歷史上最偉大的壯舉。

為了慶祝這一時刻,平克·弗洛伊德當時作為受邀樂隊正在BBC的直播間里即興演奏。

人類登上月球四年之后,平克·弗洛伊德推出了自己的第八張錄音室專輯《The Dark Side of the Moon》,在步履的喘息聲、催促登機的機場廣播、開合的收銀機抽屜、跳躍的貝斯中向世界表達著自己對沖突、貪婪、時間和死亡的理解,并在此后長達半個世紀里不斷地被提起。

從骨棒到星艦,從人猿到AI,從Monolith到Moonshot,在這個探索過程中,始終伴隨著我們的是未知的恐懼,是太空的無垠,但更重要的對宇宙的探索熱情夢想、對人類本質以及未來的終極思考。

在今天,實現通用人工智能被稱為是這個時代的“阿波羅計劃”,月之暗面(Moonshot AI)就是一家致力于實現AGI的大模型公司,他們以平克·弗洛伊德的專輯名字命名,創始人楊植麟在github的介紹是:

The ultimate goal of all my work, including both research and business, is to maximize the value of artificial intelligence.

和楊植麟的對話,我們并沒有談論太多產品和公司的細節,更多地聊了聊在AI領域的長期愿景,對組織、意識和生命的思考,創業的初心和反思,以及最近閱讀的書籍和電影。

以下是全文,經礪思資本整理,有調整和刪減:

一、“創新、長期、第一性原理”

MONOLITH:

植麟你也可以講講公司取名Moonshot的背景。

植麟:

當時我們用Kimi內測的時候,想取一個中文名。想了半天就說那要不叫月之暗面,然后我就輸進去問Kimi,「月之暗面如果是一個公司名字,它應該是什么意思?」然后Kimi就引用了兩個典故,一個是平克弗洛伊德的專輯,另一個就引用了庫布里克的這個電影,所以第一次和曹曦見面就覺得很有淵源。

月之暗面就和AGI 一樣,你平時只能看到發光的那面,但你不知道那個暗面是什么樣。它很神秘,要看到它又很難,英文正好也翻譯成Moonshot,寓意要做成一個價值很大但是又很難的事情,這個跟我們的初衷是蠻匹配的。

MONOLITH:

曹曦你第一次見植麟是什么時候,有什么印象?

曹曦:

第一次見面是線上,當時其實主要是我在pitch(笑)。第二次就來公司樓下了,那次其實印象很深刻,當時覺得好的公司就應該是一兩句話就可以說完的,我記得植麟就說我們要做AGI,然后要做toC的產品,我覺得也很純粹,事情就說完了。

更早之前在2019年,清華的一個活動上,我們也見過面,但當時沒有很熟。當時一桌吃飯的人里面,我覺得植麟是一個有 potential 的創業者,有靈氣,有意思,后面很多事情也就match了。

MONOLITH:

植麟也可以談談曹曦的 pitch 是怎么樣打動你的。

植麟:

(笑)其實不光是第一次交流,從認識到現在,包括這幾輪的融資,以及業務上和招聘上,曹曦總對我們幫助都非常大,所以也是 so far 我們最喜歡的投資人之一。

MONOLITH:

我們有一個快問快答環節,我昨天告訴Kimi,今天和楊植麟有一場對話,讓它生成了 100 個問題,最后精挑細選了10個來問你。

第一個問題,用三個詞形容月之暗面這家公司。

植麟:

創新、長期、第一性原理。

MONOLITH:

用三個詞形容你自己。

植麟:

跟剛才一樣。

MONOLITH:

分享一本最近你在讀的書。

植麟:

我最近在讀一本書叫《Everybody: a book about freedom》

MONOLITH:

分享一首歌或者一張專輯。

植麟:

Brain damage,

the dark side of the moon。

MONOLITH:

分享一個對你生命中影響最大的人。

植麟:

最大的一個人,沒有。這個要精確,或者要想更久。

MONOLITH:

如果有機會與歷史上的任何一個人共進晚餐,你會選擇誰?為什么?

植麟:

Steve Jobs,他是一個能把有 taste 的東西泛化的成功案例。這種案例不多,可能Steve Jobs 是一個,Pink Floyd也算。

MONOLITH:

你認為哪位科學家的工作對現代人工智能的發展影響最為深遠?

植麟:

Geoffrey Hinton(深度學習之父)。

MONOLITH:

在整個歷史上,你認為最成功的互聯網產品是什么?

植麟:

YouTube,因為它產生了很大的impact。

MONOLITH:

如果把這個語境縮小到中國呢?

植麟:

中國的話,我覺得是微信,因為它是中國互聯網的 super APP。

MONOLITH:

最后一個問題,你現在深信不疑的一件事情是什么?

植麟:

AGI公司需要一個從 01 的新組織。

MONOLITH:

你對kimi生成的問題還滿意嗎?

植麟:

我覺得還不錯。

二、“show me the code 比其他所有事情都重要”

MONOLITH:

月之暗面不是你第一個創業公司了,你當時在美國呆了一段時間,在那里看到了什么點燃了你再次創業的熱情?

植麟:

當然還是覺得看到了很大的變化,AI 這個技術發展了七八十年,從來沒有出現這種toC的機會。以前也有一些優秀的 AI 公司,更多是專注在 ToB 業務上。

但從2022年下半年開始,有越來越多像 Midjourney 和 ChatGPT 這樣的應用出來,甚至有一些普通的、非技術狂熱者的用戶也開始使用,然后周活超過1億,這些都是非常明顯的信號,這里面肯定是有巨大機會的。

另外它跟互聯網相比,最大的特點是能創造新的生產力,而不光只是去做連接。所以我相信這是接下來 10 年里價值最大的事情之一。

MONOLITH:

如果回過頭來看,你當時是否會選擇更激進的方式,比如在幾年前第一次創業時,就直接去做大模型和AGI??

植麟:

當時其實還是做了很多和AGI相關的事情。比如像國內的最早的一些大模型項目,我們在背后做了很多布道的事兒。但客觀上要承認,很多事情在合適的時機上去做才能事半功倍。我認為要做一家獨立的 AGI 公司還是需要對的時間點。

實際上之前我們踩過了很多坑,對于這次創業有很大的幫助,因為你就知道什么是不 work的。對我來說最大一個的lesson就是——你要做 AGI 的話,你一定是需要從 0 到 1 去搭建一個組織,這是我現在深信不疑的一件事情,也是我們為什么要做現在這個公司最核心的原因。但如果沒有之前的這些過程,那很難真正理解它到底為什么是這樣。

MONOLITH:

很多人不知道你是個鼓手,之前組建的樂隊叫splay tree(取自一個數據結構)。你說過搖滾和創業很像,都代表了一種反叛和打破常規的精神。玩樂隊的經歷對你有什么影響?

植麟:

我相信一個真正偉大的公司是需要有人文底蘊的,而不光是說有一個技術和產品就夠了,還要去看它底層的文化和價值觀是什么。對于審美的追求能讓我們做出來更好更有靈魂的產品,這點我是相信的。我們公司的人現在應該能組好幾個樂隊了。

MONOLITH:

我看你在 GitHub 上的自我介紹是——

My goal of all my work, including both research and business, is to maximum the value of artificial intelligence. 這和馬斯克說他創立Tesla的全部意義都是為了加速電動汽車時代的到來,而不是成為通用汽車有點像。你是從什么時候開始確立了自己對AI事業的使命和愿景?

植麟:

這是個逐漸形成的過程,因為接觸和做AI 這個事情有十多年了,一開始可能只是好奇這個事本身,就是除了人腦之外,還有另外一個東西它也能產生智能。一開始大家可能連這個 Back Propagation(反向傳播算法)都要手寫,沒有很成熟的框架,效果也沒有這么好。

在這個過程中慢慢地發現,AI最終確實是可能double GDP,或者10xGDP,100x GDP 的機會,因為人類社會本質上它的生產力bond,就是你的人口對應能產生的腦力的總和,現在突然出現一個東西可以去替代它,這就使得它能達到的上限非常高。

我第一次見到曹曦的時候,當時和他講了一個事情,就是我之前有一次做夢,夢見自己訓練了一個神經網絡,它所有任務的準確率都是100%,我就驚醒了。因為我意識到自己突然能改變世界,然后發現并沒有(笑)。在那個時候很多任務還只能做到百分之六七十。今天這個夢已經部分實現了。AI在很多任務上超越了大部分人類。

在這個過程中,其實我還蠻感慨的,很多事情發生了變化。包括我們很早就認為語言模型是個很重要的問題,但并不是所有人都是這樣認為的。因為當時語言模型最大的用途是拿來給語音識別去重新排序,很多人認為它唯一的作用就是這個。后來大家才逐漸真正看到了更多地用人工智能釋放生產力瓶頸的可能性。

MONOLITH:

這個過程中有一個廣為人知的事情,就是2019年的時候你那篇TransformerXL的論文一度被 ICLR 給拒絕,理由就是他們不認為大語言模型的提升在實際應用場景中會有更多的價值。當時收到類似這樣的負反饋有動搖你嗎?

植麟:

那時候看的已經挺開了。大家并不是說那么 care 你一定要在會議和期刊上發表個什么東西,你最重要的就是arXiv加GitHub。所以那會兒其實已經不太 care 那些所謂的同行評審。

這中間也經歷了一些變化,十年前peer review和評審很重要,再后來就是 GitHub加arXiv,到現在就是products,要show me the code。用產品說話。

MONOLITH:

就更多從第一性原理去思考問題。

植麟:

做出來一個真正能用的、好用的東西。這四個字——能用,好用,比其他所有東西都重要。

三、“expect the worst, 但盡全力去把事情做好”

MONOLITH:

創業到現在快一年了,公司發展的狀態你還滿意嗎?

植麟:

我覺得so far進展還是很不錯的,甚至是超預期的,當然對一個大模型或者對一個 AGI 公司來講,最核心的還是組織本身,因為你所有的技術其實都是通過組織生產出來的,組織的核心又是人,如果你沒有合適的人,光在那談管理的辦法,或者說怎么合作,其實都是空的。所以我覺得組織建設這一點是我們可能前期做得比較好的一個地方。

曹曦:

為什么會超預期?是本來預期就比較低,還是確實做得好?

植麟:

我一直都是保持謹慎的樂觀,expect the worst,但盡全力去把事情做好,這個是一部分超預期的原因,另外市場的變量也很重要,人才和資本的流動使得公司構建的速度更快了。

MONOLITH:

在組織建設上,你反提到做AGI需要一個全新的組織形式,這個怎么理解?

植麟:

傳統互聯網和 AI產品最大的區別,一個是先設計后制造,一個是通過制造完成設計。我沒有辦法提前規劃說有用戶會拿 50 個簡歷放到kimi里去篩選,然后專門去設計和優化這個場景。我們只能說是先把基礎能力給設計好,比如讓它有很強的 in-context learning 的能力,instruction following的能力,這就是一個在制造中完成設計的過程。

所以,你的生產方式不一樣,你的組織肯定就不一樣,這點是非常重要的?,F在是 model as an application,本質上消費的是智能而不是連接。有的地方和互聯網時代比是沒有太大變化,但已經發生的變化是很深刻的,以至于說你如果沒有一個全新的組織,你可能是很難做的。

曹曦:

所以其實互聯網思維和AGI思維倒未必是涇渭分明的,但在需要一個全新的組織這個點上,可能是一些之前的existing player 的創新者的窘境。

MONOLITH:

那在組織建設上,你覺得月之暗面現在想吸引什么樣的人?

植麟:

我們公司有很多AGI Evangelist(布道者),就是你認為接下來 10 年只有這個事情是唯一值得做的,這個 vision 是最關鍵的,所以我們最歡迎對 AGI有強烈熱情的人,這是第一點,第二點的話可能就是學習能力。

這里還有很重要的一點,人才也有滾雪球效應,當你認識的一些很優秀的人,比如a、c、d、 e 都在這家公司,然后本身這些人之間都是彼此欣賞或已經認識的,那組織里這樣相似的人就會越來越多。

MONOLITH:

你在面試中會問到的最重要的問題是什么?

植麟:

這個我確實有一個,但說了以后就沒法用了,所以不能告訴你。(笑)

MONOLITH:

那分享一件你最近很重視和正在推進的事情。

植麟:

最近在搞產品,搞產品,搞產品。

MONOLITH:

說到產品,你覺得現在什么樣的產品經理才能做出killer app?

植麟:

我覺得沒有一個特定的范式,但最核心的應該是學習能力。比如在保證基礎的、核心的判斷是正確的前提下,還得會有很多信息輸入的情況下快速升級自己。

曹曦:

在過去這些年里,我覺得產品經理是一個被過分放大的刻板印象。這里面會有一個誤區,就是有時候其實所謂的產品經理,都沒有被精確定義成它是哪個行業的,有些行業里其實沒有這個概念,比如游戲行業就沒有,ta叫游戲策劃,再比如教育行業,這里面最好的產品經理是誰?可能應該首先是對教育有最深認知的從業者。

我覺得這次這一波機會里,對創始人在技術背景上的要求可能甚至要更高,所以我們在去年年初的眾多公司中選擇bet的,是我們覺得在AI技術上最強的植麟。在這個時代,無論是對從業者還是創業者來說,其實要求都是既要又要的。過去無論是互聯網還是移動互聯網,這兩波大的機會里面,那些長到特別大的公司例如騰訊、百度、網易、字節、快手等公司的founder 都是技術背景。

四、“人類進化的本質是捕獲和固化宇宙里的熵”

MONOLITH :

你覺得什么是意識,機器有沒有意識?

植麟:

大概幾十年前有人問過這樣的一個問題,就是說你怎么去知道一個機器有沒有理解一句話?今天是這個問題的升級版,但我覺得本質沒有什么變化。

今天不會人再去問「這個機器能不能理解一句話」了,因為這個問題的答案變得很簡單。所以我覺得再過幾年,你的這個問題也會變得很trivial(微不足道的),你都不需要去衡量它,你就直接感受它就好了。

如果拆解的話也有一些科學的方法,比如把它變成一種形式語言,然后用一個邏輯表達式去表達;或者在operational 層面,比如針對一篇文章或者論文,你去問AI 100 個問題它全都答對了,那它就是理解了,也就有了(意識)。

AI現在還沒有辦法跟人建立很長期的。以年為單位的connection,它也沒有深層的identity,或者一種內生的motivation,這些也可以作為一種衡量標準。

曹曦:

我覺得可能在一些語境的討論里,意識的定義很多時候是從人的自我角度出發的,就比如這一波智能肯定跟規模有很大的關系。那在自然界里,其實螞蟻群和蜂群規模到了一定程度之后,看似也有智能的行為,所以你說蜂群或者蟻群它們有沒有意識?可能也有,但不是我們定義的那種意識。

植麟:

也是一個量變產生質變的結果,可能到了 10的27 次方以后,它們的意識會更強。所以你今天也不能說它們沒有,只是沒有那么明顯。

MONOLITH:

從第一性原理上講,我們為什么需要AI?

植麟:

這個問題有兩種流派,一種是有效加速主義(effective acceleration)。這一派的人認為宇宙里面漂浮著各種各樣的熵,而人類的目標就是去捕獲他們,今天的神經網絡就是一個捕獲熵的能力,你把 loss 從 10 降到1,本質上就是把一堆熵給固化和捕獲凝結了。

當然你永遠不可能捕獲所有的熵,因為有一些東西它是完全不確定的信號,你無法預測。但是你要把能預測的都預測掉,人類進化的本質就是在做這樣的事情,它是有利于社會進步的,因為結果是生產力一直在發展,100 年前像Polio(小兒麻痹癥)這樣的病都沒法治?,F在除了醫學之外,還有各種各樣的科技,這是捕捉熵的結果。

另一種流派是有效利他主義(Effective Altruism),他們不認為這種acceleration能帶來任何好處,相對更悲觀一些。

技術的發展并不以個人的意志為轉移,甚至并不以某個單一的社會為轉移,因為它本質是一個 free market, free market 會選擇它效率最大的是方向去演進。現在這個市場選擇了它要加速,本質就是一個效率最大化去捕捉熵的過程,這個是所有人都沒有辦法去阻止的一件事情,所以就遵循這個宇宙中熵的意志,從中找到一個最好的解法。

MONOLITH:

你怎么看智能涌現這個現象?

植麟;

智能涌現就是通過制造去完成設計。你沒法提前設計,因為你不知道它會涌現出來什么東西,這也是我認為我們需要AI native的原因,不是去單點解決問題,而是系統性地解決問題。

曹曦:

我記得你之前提到過,智能可以看作是一種壓縮。

植麟:

對,Next token prediction 本質上就是個無損壓縮的過程,因為要用最少的比特去表示這個世界。比如說你今天要去預測一個等差數列,你如果知道這個世界的規律,只需要存前兩個數,就能預測出來后面每一個數,這就是一個巨大的壓縮的過程。

我覺得這個就是智能的意義,因為現實世界會更加混沌,有可預測的部分,也有不可預測的部分,但是當你能把那些可預測的部分做到極致了,你就達到了智能的上限。

曹曦:

我好奇這個過程中,什么是更容易被壓縮的,什么是更不容易的?

植麟:

沒有本質區別,只要你能放在同一個token space 表示。為什么文字會可能先被壓縮,因為它本身是一種更加濃縮的信號。視覺信號的loss會高一點,因為它不確定性更大。但最終都是一個 scaling 的問題。只要你把它放在同一個空間里面scaling, 本質上都可以解決。

曹曦:

在我們聊天的過程中,AGI 是一個反復被提到的詞,這個詞的定義應該怎么理解?

植麟:

我覺得就是今天人類所有在數字世界里能產生的行為,每一個行為都能做到接近人類top 1% 或者專家級別的水平,最終未來在物理世界也達到(一樣的水平)。

曹曦:

你說的這個定義是前 1% ,有點像「通用精英智能」。

植麟:

有不同的標準,我的point就是說你最終衡量它,就必須要是細分地去拆解才有辦法衡量。

曹曦:

說到模型的基礎能力,你覺得LLM(Large Language Model)的局限性會在什么地方?

植麟:

如果我們談的是廣義的基于一個序列模型去做 next token prediction,可能沒有太多的局限性,從第一性原理來講,它其實是通用的,最終所有在數字世界能完成的任務,通過這套范式最終都可以學到。

當然類比舊的計算范式,只要花足夠多的投入去做數字化,最終都能變成零一的序列,現在新的計算范式還做不到這一點。比如說只是純文本的語言模型,那很多東西沒有辦法表示,這點上還是有局限。

另外還有一個很重要的瓶頸,現在AI 的輸入有兩根線,一根是電線,一根是數據線。如果你想真正最后做出來一個 super intelligence,那你應該有辦法把這個數據線給拔掉,只要往里面輸電就可以了,它要自己可以去進化。

曹曦:

把數據線拔掉,可不可以理解為當下已存在的數據,會在某一天不夠用?

植麟:

對,這一代模型是10的25次方次浮點數運算,接下來兩三年時間里,還會有一到兩個數量級的增長。根據 scaling law這個數據還要再增長至少一個數量級,但是這個世界上的高質量數據一定程度上是有限的。你就需要用synthetic data(合成數據),通過模型自己去探索整個表示空間里面那些沒有被采樣到的點,這個基本上是現在已知的必須要解決的問題。

MONOLITH:

你覺得AI會如何影響普通人的日常生活?

植麟:

我覺得大概率還是會讓你的生活變得更好,有更多的人不需要為了錢去工作。你可以去發揮你的創造力,去做更多有創造性的事情。

圖為Midjourney生成的海報

這個世界上有一些很重復的工作,其實可以被 AI 直接抽象掉;另外一方面就上AI一定程度上可以democratize(普惠化),或者說通過一種普惠的方式讓每個人都具備更強的創造力。

今天我可以用一個工具畫出來一幅非常精美的畫,明天可能拍出來一部電影,每個人都可能成為一個導演。未來AI會把這種創造的能力會變得非常普及,人類的精神世界變得越來越豐富。

曹曦:

未來物質世界里的很多任務都會被壓縮或者被抽象。

植麟:

是的,當然精神世界也可以,本來你不可能拍出一個昆汀·塔倫蒂諾一樣好的電影,但是未來有可能,AI 可以幫你創造。所以每個人都會有更多表達創造的能力與權力。

在《2001:太空漫游》的結尾,我們看到了宇宙之子的象征,一個全新的意識形態在太空中孕育而出。正如電影中那一瞬間對人類未來的憧憬,我們現在也站在了另一種意義上的十字路口。當人工智能不再只是工具,而是成為拓展我們認知和能力邊界的伙伴時,它將如何影響我們的文明和身份認同?

通過與kimi的對話,我們切實感受到,人工智能已經不再是冰冷的代碼,而是人類智慧的延伸,是與人類共同呼吸和思考的伙伴。從數字化工具到精神伴侶,從簡單的任務自動化到復雜的創意表達,AI的藍圖正在被繪制,每個人都是這幅畫卷中的一筆。

在這場探索AGI的旅程中,我們不僅在追求技術的邊界,也在追問人類存在的本質。就像斯坦利·庫布里克通過影像講述了人類進化的故事一樣,這次我們通過把能源轉化為智能編織新的敘事,這一路注定將遭遇無數質疑和挑戰,但也將開啟無限可能。

*本文結尾由Kimi總結生成

本文由 @Monolith礪思 原創發布于人人都是產品經理。未經作者許可,禁止轉載

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 懂了,不知道起什么名字,然后想起來自己喜歡玩dota的白虎,然后“戰友們,隱身!”23333

    來自上海 回復