深度|扎克伯格最新對談:Llama 3.1 比 GPT4 成本低 50%!?未來企業(yè)擁有 AI Agent 數(shù)量或超地球總?cè)丝?/h2>
從 Llama 3.1 的發(fā)布到對未來 AI 助手的展望,扎克伯格不僅展示了 Meta 的技術實力,更描繪了一個由 AI 驅(qū)動的全新商業(yè)生態(tài)。正如他所說:“開源 AI 將成為行業(yè)標準?!弊屛覀円黄鹛剿鬟@場對話中的洞見,感受 AI 技術如何塑造我們的未來。
7 月 23 日,Meta CEO 馬克·扎克伯格與科技評論家 Rowan Cheuang 深入探討了開源 AI 的未來及其對社會和商業(yè)的深遠影響。
扎克伯格強調(diào),開源 AI 不僅是確保 AI 未來發(fā)展的關鍵,也是提升全球生產(chǎn)力和創(chuàng)造力的重要工具。
他認為,開源模型將使 AI 技術更安全、更透明,并加速其在各個領域的應用。Meta 通過發(fā)布 Llama-3.1 等開源模型,致力于建立一個更開放、更具創(chuàng)新力的 AI 生態(tài)系統(tǒng)。
Meta 的目標是在今年年底前使其 AI 助手成為全球使用最廣泛的 AI 助手。通過提供免費且易于使用的先進模型,Meta 還希望每個創(chuàng)作者和小企業(yè)都能輕松創(chuàng)建自己的AI Agent,提升客戶服務和業(yè)務溝通的效率。
扎克伯格將當前對 AI 的懷疑態(tài)度與 20 世紀 90 年代對互聯(lián)網(wǎng)的懷疑態(tài)度相提并論。他認為,隨著時間的推移,AI 技術將被越來越多的人接受和認可。開源方法將有助于確保 AI 技術的廣泛應用,使更多人從中受益,從而減少對AI的恐懼和反對。
此外,Meta 不僅關注技術的開發(fā),還重視將其整合到實際產(chǎn)品中,以便用戶能從中受益。扎克伯格透露,Meta 未來的商業(yè)模式將側(cè)重于構(gòu)建最好的產(chǎn)品,而不是通過銷售模型本身來賺錢。通過開放生態(tài)系統(tǒng),Meta 希望推動更多企業(yè)和開發(fā)者參與進來,共同推動 AI 技術的進步。
他還認為,AI 技術有潛力顯著提升全球的經(jīng)濟增長和生產(chǎn)力。開源 AI 將使更多國家、企業(yè)和個人能夠利用最先進的技術,促進全球創(chuàng)新和經(jīng)濟發(fā)展。
以下為這場對話的全部內(nèi)容,enjoy~
Mark Zuckerberg
我們第一次發(fā)布了一個具有 4050 億參數(shù)的模型,這是迄今為止最復雜的開源模型,這是任何人所發(fā)布的最先進的開源模型。
Rowan Cheung
我有點震驚于你直接批評 Apple 及其封閉的方式。你能否詳細講述一下 Apple 在什么地方阻礙了 Meta ?
Mark Zuckerberg
是的,當你構(gòu)建了一些你認為對社區(qū)有益的功能,但被告知你不能發(fā)布它們,因為某家公司想把你限制在一個框架內(nèi)以便更好地與你競爭時,這是有點令人沮喪的。
Rowan Cheung
你能否談談你對 AI 的長期愿景以及未來可能會發(fā)生的事情?好吧,馬克,非常感謝你做這個訪談。顯然,今天 Meta 發(fā)布了重大的 AI 公告。你能否概述一下所有發(fā)布的內(nèi)容以及為什么它們很重要?當然,沒問題。
Mark Zuckerberg
今天的大新聞是 Llama-3.1 的發(fā)布,我們推出了三個模型。我們第一次發(fā)布了一個具有 4050 億參數(shù)的模型,這是迄今為止最復雜的開源模型,這是任何人所發(fā)布的最先進的開源模型。
在某些領域,它甚至超越了一些領先的封閉模型。所以,我非常期待看到人們?nèi)绾问褂盟?,特別是現(xiàn)在我們制定了社區(qū)政策,允許人們將其用作教師模型來進行蒸餾和微調(diào),基本上可以創(chuàng)建他們想要的任何其他模型。
除此之外,我們還將 4050 億參數(shù)的模型進行了蒸餾,制作了更新的并且現(xiàn)在在其尺寸上處于領先地位的 7000~8000 億參數(shù)模型。它們也具有非常好的性能和成本效益比。
所以,我非常期待看到大家如何使用這些模型。從整體上看,這是開源 AI 的一個重要時刻。我一直認為開源 AI 將成為行業(yè)標準,它會遵循類似于 Linux 的發(fā)展路徑。
在 Linux 流行之前,有很多公司都有自己封閉版本的 Unix。當時,沒有任何開源項目能達到這種復雜程度,人們認為封閉的開發(fā)模式是唯一可行的方法。
但最初, Linux 取得了一定的立足點,因為它更便宜,開發(fā)者可以以不同的方式定制它。隨著生態(tài)系統(tǒng)的發(fā)展,它得到了更多的關注,因此實際上變得更加安全,功能也更強大。越來越多的合作伙伴為其構(gòu)建了更多的功能,這使其比任何封閉的Unix系統(tǒng)都更具能力。
所以,今天 Llama-3.1 的發(fā)布是一個類似的轉(zhuǎn)折點, Llama 有機會成為開源 AI 的標準,使開源成為 AI 的行業(yè)標準。
即使在性能上還未完全領先,但在成本、可定制性以及可以拿來微調(diào)和進行各種操作的能力方面,它都有巨大的優(yōu)勢。開發(fā)者會充分利用這些優(yōu)勢,我們專注于構(gòu)建這個生態(tài)系統(tǒng),圍繞它可以開發(fā)出各種不同的能力。所以,我很高興能討論這些內(nèi)容。
Rowan Cheung
是的,我看到了所有的基準測試結(jié)果,確實令人難以置信。這是首個具有 4050 億參數(shù)的開源前沿模型。你對人們用這個模型構(gòu)建的任何具體現(xiàn)實世界的用例特別感興趣嗎?
Mark Zuckerberg
我最感興趣的是看到人們用它來蒸餾和微調(diào)自己的模型。正如你所說,這是第一個開源的前沿級模型,但它不是第一個前沿級模型。所以,已經(jīng)有其他具有這種能力的模型,人們會希望直接在 4050 億參數(shù)的模型上進行推理,因為據(jù)我們的估計,這樣做的成本將比 GPT-4 低 50% 左右。
這對很多人來說顯然是一個很大的差異。但這世界上真正新的東西是因為它是開源的,人們可以將模型蒸餾到任何他們想要的大小,用于合成數(shù)據(jù)生成,作為教師模型使用。
所以,我們對未來的愿景并不是說會有一個單一的東西。OpenAI 有一種愿景,他們會構(gòu)建一個大 AI ,Anthropic 也有類似的愿景, Google 也是。但這從來不是我們的愿景。我們的愿景是應該有很多不同的模型。
每個創(chuàng)業(yè)公司、每個企業(yè)、每個政府都希望擁有自己的定制模型。而當封閉生態(tài)系統(tǒng)比開源系統(tǒng)好得多時,使用現(xiàn)成的封閉系統(tǒng)是更好的選擇,因為即使你可以定制開源系統(tǒng),性能之間仍然存在一些差距。但現(xiàn)在我們不再看到這種情況。
現(xiàn)在,開源基本上彌合了這一差距。你會看到模型的廣泛擴散,人們現(xiàn)在有動力去定制和構(gòu)建并訓練適合他們需求的模型,將他們的數(shù)據(jù)訓練到模型中。
因為像 Amazon 通過 AWS 或者 Databricks 這樣的公司提供的一整套服務用于蒸餾和微調(diào)開源模型。我們與這些合作伙伴進行了很多特定的工作以實現(xiàn)這一目標。同時,還會有像 Grok 這樣的公司,他們在超低延遲推理方面做了非常有趣的工作。
我非常期待將其交到他們手中,他們正在為推出而構(gòu)建一些東西,這也將實現(xiàn)這一點。然后,還有一整套企業(yè)公司,像 Dell、Scale. AI 、Deloitte 或 Accenture,他們與世界各地的企業(yè)合作進行技術部署。
這些公司會幫助構(gòu)建定制模型,無論是大型企業(yè)還是政府,很多公司希望擁有一個可以訓練其定制數(shù)據(jù)的模型。但很多公司不想通過API將他們的數(shù)據(jù)發(fā)送到 Google 或 OpenAI 。這并不是因為這些公司有特別的隱私問題,而是出于類似于人們喜歡加密和 WhatsApp 的原因。
人們希望擁有一種設計上安全的架構(gòu),他們的數(shù)據(jù)可以保存在他們自己手中。會有一個圍繞這些構(gòu)建的完整市場。所以,我對所有這些都感到非常興奮。但這次我們采取了更積極的立場,幫助構(gòu)建生態(tài)系統(tǒng),因為這是它增長并為每個人創(chuàng)造更大價值的方式。
Rowan Cheung
是的,這確實是一個大事。你們是如何教育開發(fā)者使用這些工具的?更廣泛地說, Meta 是否有計劃或策略來教育世界其他地方關于開源的重要性?
Mark Zuckerberg
是的,在 Llama-3.1 之前,我們的做法主要是這樣的。Meta 投資于此的根本原因是我們希望確保我們可以獲得領先的模型。由于我們在移動互聯(lián)網(wǎng)歷史上的一些經(jīng)驗,我們不希望處于必須依賴某個競爭對手提供這種基礎技術的地位。所以我們?yōu)樽约簶?gòu)建了它。
在 Llama-3.1 之前,我們本能地認為,如果我們將其開源,就會有一個社區(qū)圍繞它成長,并實際上擴展其能力,使其對包括我們在內(nèi)的每個人都更有價值。因為最終,這不僅僅是一項技術,它是一個生態(tài)系統(tǒng)。為了使它對我們來說成為一個有用的東西,必須有一個廣泛的生態(tài)系統(tǒng)。
在 Llama-3.1 中,我們看到的一個重大變化是,我們不僅僅是為自己構(gòu)建它,然后將其發(fā)布給開發(fā)者使用,這次我們采取了更加積極的立場,建立合作伙伴關系,確保有一個公司生態(tài)系統(tǒng)可以用模型做有趣的事情,并以我們不會做的方式服務開發(fā)者。我們不是公共云服務提供商,對吧?開發(fā)者市場不會來找我們構(gòu)建他們的東西。但我們希望確保所有這些公共云都能夠很好地進行這項工作。
這包括一些更基本的功能,比如托管模型和提供推理服務。但我們也希望確保一些新的功能能夠?qū)崿F(xiàn),比如蒸餾和微調(diào),因為這些在封閉模型中不太可能實現(xiàn)。所以我們必須與這些合作伙伴進行特定的工作來實現(xiàn)這一目標。同時,也會有一些公司,如 Grok ,他們在超低延遲推理方面做了非常有趣的工作。
我對 AI 的擔憂實際上不是 Apple ,而是其他公司,擔心這種封閉生態(tài)系統(tǒng)的發(fā)展。在某種程度上,我并不是在說他們是壞人,而是這種系統(tǒng)的物理和激勵結(jié)構(gòu)會推動你去限制某些事情。
如果生態(tài)系統(tǒng)像網(wǎng)絡一樣開發(fā),但更加強大,它會更健康。因為在移動互聯(lián)網(wǎng)的發(fā)展過程中,封閉模式獲勝了, Apple 獲得了最多的收益,雖然可能有更多的安卓手機,但 Apple 幾乎獲取了移動電話市場的所有利潤。這存在一定的近期偏見,因為這些是長期的周期。
iPhone 于 2007 年推出,我們已經(jīng)接近 20 年了,這是一個漫長的周期,但人們很容易忘記封閉模式并不總是獲勝。如果回到 PC 時代,盡管很多人,尤其是使用 Linux 類比的人,可能不認為 Windows 是完全開放的,但相比 Apple 將操作系統(tǒng)與設備捆綁的方式,Windows 的開放生態(tài)系統(tǒng)更勝一籌。
我的希望是,下一代平臺,包括 AI 和我們在增強和虛擬現(xiàn)實方面的工作, Meta 希望站在建立開放生態(tài)系統(tǒng)的一邊。我們不僅希望建立一個封閉生態(tài)系統(tǒng)的替代品,還希望恢復行業(yè)狀態(tài),使開放生態(tài)系統(tǒng)成為領導者。
這是可能的,我們在 AI 、AR 和 VR 方面都在取得良好的進展。但這也是我個人和哲學上的一個關注點,因為我感受到的創(chuàng)造力限制在過去 10~15 年間是由于移動互聯(lián)網(wǎng)封閉模式的發(fā)展。
我不想深入討論這個點,但這確實是一個重要的議題。我們現(xiàn)在有了 Llama-3.1 的 4050 億參數(shù)模型,它在一些關鍵基準測試中與最好的封閉模型競爭,甚至超過了一些封閉模型,這本身就很驚人。
Rowan Cheung
但在你的信中還提到, Llama-4 有望成為行業(yè)中最先進的模型。你對 Llama-4 有什么特別興奮的地方嗎?
Mark Zuckerberg
我們剛剛發(fā)布了 Llama-3.1 ,可能談 Llama-4 還為時過早。我們已經(jīng)建立了計算集群,準備了大量的數(shù)據(jù),對架構(gòu)有了一個大致的概念,并進行了大量的研究實驗來最大化其性能。所以我確實認為 Llama-4 將是 Llama-3 的又一次大躍進。我們還有很多進展可以取得。
這是 Llama 的首次發(fā)布,還有很多我想做的事情,包括推出多模態(tài)模型,我們在這一點上遇到了一些不幸的挫折,但我們將在未來幾個月內(nèi)推出它們,尤其是在歐盟以外的地方。
現(xiàn)在談 Llama-4 可能有點早,但它肯定會很棒。管理公司時,計劃計算集群和數(shù)據(jù)軌跡不僅僅是針對 Llama-4 ,而是未來四五個版本的 Llama ,這確實是件有趣的事情。因為這些都是需要長期投資的事情,建設數(shù)據(jù)中心、配套的電力、芯片架構(gòu)和網(wǎng)絡架構(gòu)等。
這個回答可能有點含糊,只是表達了一些一般的興奮。但 Llama-3.1 至少應該有一周的時間讓我們消化一下發(fā)布的內(nèi)容,然后再談未來。
Rowan Cheung
接下來的幾周將是瘋狂的,只因為 3.1 的發(fā)布。但聽到 Meta 已經(jīng)在為 Llama-4 做準備,仍然令人興奮。在這個方面,你能否多談談你對 AI 的長期愿景以及未來可能會發(fā)生的事情?
Mark Zuckerberg
是的,我很高興從技術和產(chǎn)品的角度來談論這個問題,但既然我們已經(jīng)談論了很多模型方面的內(nèi)容,那我就先從產(chǎn)品開始吧。我們的愿景是,應該有許多不同的 AI 和 AI 服務,而不僅僅是單一的 AI ,這也確實影響了我們的開源方法,并影響了我們的產(chǎn)品路線圖。
Meta AI 目前表現(xiàn)相當不錯,我的目標是在今年年底前使它成為世界上使用最廣泛的 AI 助手,我們很有希望在幾個月內(nèi)達到這一里程碑。而且我們有能力和商業(yè)模式來構(gòu)建世界上最先進的模型,并向所有人免費提供,這是一個巨大的優(yōu)勢。我們的所有應用程序都非常容易使用,所以我對目前的進展感到非常興奮。這是我們所擁有的基本助手,這將是一件大事。
但更重要的是,我們的重點是讓每個創(chuàng)作者和每個小企業(yè)都能創(chuàng)建自己的 AI Agent,使每個人都能在我們的平臺上創(chuàng)建他們想要的 AI Agent。
如果你想想看,這些都是巨大的市場。世界上有數(shù)億的小企業(yè),非常重要的一點是,通過相對少量的工作,一個企業(yè)可以通過幾次點擊就能創(chuàng)建一個 AI Agent來進行客戶支持、銷售,并與所有客戶溝通。
未來每個企業(yè)都會像現(xiàn)在有電子郵件地址、網(wǎng)站和社交媒體一樣,擁有一個他們的客戶可以交流的 AI Agent。
我們希望為這些企業(yè)實現(xiàn)這一點,這將會是數(shù)億甚至數(shù)十億的小企業(yè) Agent。對于創(chuàng)作者來說也是同樣的道理,我們的平臺上有超過 2 億人自認為是創(chuàng)作者,他們主要利用我們的平臺來建立社區(qū)、發(fā)布內(nèi)容,感覺這就像是他們工作的一部分。他們都有一個基本問題,就是一天的時間不夠用,無法與他們的社區(qū)進行足夠的互動。
同樣,他們的社區(qū)通常希望能有更多的互動時間,但時間總是不夠用。這將是一個巨大的突破,基本上每個創(chuàng)作者都可以從社交媒體上獲取所有信息,訓練這些系統(tǒng)以反映他們的價值觀和業(yè)務目標,然后人們可以與之互動。這幾乎就像是創(chuàng)作者創(chuàng)作的一個藝術品,人們可以以不同的方式與之互動。
這還不包括所有其他人將能夠為自己創(chuàng)建不同的 AI Agent來做不同的事情。所以我們將生活在一個擁有數(shù)億甚至數(shù)十億不同 AI Agent的世界里,可能最終 AI Agent 的數(shù)量會超過世界上的人口,人們將以各種不同的方式與它們互動。這是產(chǎn)品愿景的一部分,顯然其中有很多商業(yè)機會,這是我們希望賺錢的地方。
我們不會通過銷售模型本身來賺錢,因為我們不是公共云公司。我們將通過構(gòu)建最好的產(chǎn)品來賺錢,最好的產(chǎn)品的重要組成部分是擁有最好的模型,而圍繞開源建立最好的生態(tài)系統(tǒng)將幫助我們做到這一點。這就是為什么所有這些都對我們來說是一致的,也是為什么這對我們構(gòu)建高質(zhì)量產(chǎn)品并取得最佳商業(yè)結(jié)果非常有價值。但這也是為什么這在哲學上是一致的。我
們不相信會有一個單一的 AI 產(chǎn)品或模型,每個人都使用。我們根本上相信擁有多樣化的模型集,每個企業(yè)和個人都將希望擁有他們自己的東西,這將是非常有趣的,這也是讓這個事情有趣的原因之一。
Rowan Cheung
是的,看到 Meta 將技術直接整合到產(chǎn)品中,并且向數(shù)十億用戶免費提供前沿 AI 模型,這是一個巨大的突破。在這個基礎上,我有一個關于懷疑態(tài)度的最后一個問題。
在 20 世紀 90 年代,對互聯(lián)網(wǎng)的懷疑態(tài)度無處不在,但最終反對它變得幾乎是不合理的。現(xiàn)在關于 AI 的懷疑態(tài)度似乎也在經(jīng)歷類似的軌跡。你認為我們正處于這一早期階段,并且會有一個時刻反對 AI 的態(tài)度會像今天反對互聯(lián)網(wǎng)一樣被視為不合理嗎?你認為哪些因素將是改變這種看法的關鍵?
Mark Zuckerberg
人們有不同的方式來擔憂某件事。我很清楚的是,互聯(lián)網(wǎng)在成功之前經(jīng)歷了一次大泡沫破滅,所以所有對互聯(lián)網(wǎng)持長遠觀點的人最終都是對的,但有時候事情的發(fā)展比你預期的要慢,你需要有信心堅持下去。這是我意識到的一點,因為我對 Llama-3 以及 Llama-4 、 Llama-5將帶來的所有解鎖感到非常興奮,這將轉(zhuǎn)化為更好的產(chǎn)品。
但現(xiàn)實是,很難提前知道某件事什么時候足夠好,可以讓數(shù)十億人使用,然后準備好成為一個大生意。我們現(xiàn)在都在投入大量的資本來訓練這些模型,所以人們可能會在相當長的一段時間內(nèi)虧錢,但我不知道,也許這一切會更快發(fā)生,這很難說。
你更關心的是人們對其生計的擔憂。在這方面,這也是開源方法、許多不同的個性化和定制化模型的重要原因之一。如果這一發(fā)展僅僅是由少數(shù)公司構(gòu)建產(chǎn)品并從中受益,而人們只使用這些產(chǎn)品,雖然可能他們喜歡與 AI 助手交談,這對他們有價值,但如果這沒有在某種程度上幫助提升所有人的生活水平,那么最終會出現(xiàn)反彈。
在 Web 2.0 的發(fā)展過程中,我花了一些時間思考,在 AI 、AR 和 VR 等下一代技術中,如何不僅創(chuàng)建一個繁榮的產(chǎn)品集和經(jīng)濟生產(chǎn)力增長,還如何創(chuàng)建一個更好、更可持續(xù)的政治經(jīng)濟環(huán)境,讓更多人感到他們從中受益并支持這一系統(tǒng)。
我們在社交媒體方面做得相對不錯,但從世界的一些反饋和回應來看,在 AI 和其他新技術方面,我們需要做得更好,以緩解人們對這些技術對他們生計、工作和生活影響的擔憂。
本文由人人都是產(chǎn)品經(jīng)理作者【江天 Tim】,微信公眾號:【有新Newin】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自采訪截圖
更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
從 Llama 3.1 的發(fā)布到對未來 AI 助手的展望,扎克伯格不僅展示了 Meta 的技術實力,更描繪了一個由 AI 驅(qū)動的全新商業(yè)生態(tài)。正如他所說:“開源 AI 將成為行業(yè)標準?!弊屛覀円黄鹛剿鬟@場對話中的洞見,感受 AI 技術如何塑造我們的未來。
7 月 23 日,Meta CEO 馬克·扎克伯格與科技評論家 Rowan Cheuang 深入探討了開源 AI 的未來及其對社會和商業(yè)的深遠影響。
扎克伯格強調(diào),開源 AI 不僅是確保 AI 未來發(fā)展的關鍵,也是提升全球生產(chǎn)力和創(chuàng)造力的重要工具。
他認為,開源模型將使 AI 技術更安全、更透明,并加速其在各個領域的應用。Meta 通過發(fā)布 Llama-3.1 等開源模型,致力于建立一個更開放、更具創(chuàng)新力的 AI 生態(tài)系統(tǒng)。
Meta 的目標是在今年年底前使其 AI 助手成為全球使用最廣泛的 AI 助手。通過提供免費且易于使用的先進模型,Meta 還希望每個創(chuàng)作者和小企業(yè)都能輕松創(chuàng)建自己的AI Agent,提升客戶服務和業(yè)務溝通的效率。
扎克伯格將當前對 AI 的懷疑態(tài)度與 20 世紀 90 年代對互聯(lián)網(wǎng)的懷疑態(tài)度相提并論。他認為,隨著時間的推移,AI 技術將被越來越多的人接受和認可。開源方法將有助于確保 AI 技術的廣泛應用,使更多人從中受益,從而減少對AI的恐懼和反對。
此外,Meta 不僅關注技術的開發(fā),還重視將其整合到實際產(chǎn)品中,以便用戶能從中受益。扎克伯格透露,Meta 未來的商業(yè)模式將側(cè)重于構(gòu)建最好的產(chǎn)品,而不是通過銷售模型本身來賺錢。通過開放生態(tài)系統(tǒng),Meta 希望推動更多企業(yè)和開發(fā)者參與進來,共同推動 AI 技術的進步。
他還認為,AI 技術有潛力顯著提升全球的經(jīng)濟增長和生產(chǎn)力。開源 AI 將使更多國家、企業(yè)和個人能夠利用最先進的技術,促進全球創(chuàng)新和經(jīng)濟發(fā)展。
以下為這場對話的全部內(nèi)容,enjoy~
Mark Zuckerberg
我們第一次發(fā)布了一個具有 4050 億參數(shù)的模型,這是迄今為止最復雜的開源模型,這是任何人所發(fā)布的最先進的開源模型。
Rowan Cheung
我有點震驚于你直接批評 Apple 及其封閉的方式。你能否詳細講述一下 Apple 在什么地方阻礙了 Meta ?
Mark Zuckerberg
是的,當你構(gòu)建了一些你認為對社區(qū)有益的功能,但被告知你不能發(fā)布它們,因為某家公司想把你限制在一個框架內(nèi)以便更好地與你競爭時,這是有點令人沮喪的。
Rowan Cheung
你能否談談你對 AI 的長期愿景以及未來可能會發(fā)生的事情?好吧,馬克,非常感謝你做這個訪談。顯然,今天 Meta 發(fā)布了重大的 AI 公告。你能否概述一下所有發(fā)布的內(nèi)容以及為什么它們很重要?當然,沒問題。
Mark Zuckerberg
今天的大新聞是 Llama-3.1 的發(fā)布,我們推出了三個模型。我們第一次發(fā)布了一個具有 4050 億參數(shù)的模型,這是迄今為止最復雜的開源模型,這是任何人所發(fā)布的最先進的開源模型。
在某些領域,它甚至超越了一些領先的封閉模型。所以,我非常期待看到人們?nèi)绾问褂盟?,特別是現(xiàn)在我們制定了社區(qū)政策,允許人們將其用作教師模型來進行蒸餾和微調(diào),基本上可以創(chuàng)建他們想要的任何其他模型。
除此之外,我們還將 4050 億參數(shù)的模型進行了蒸餾,制作了更新的并且現(xiàn)在在其尺寸上處于領先地位的 7000~8000 億參數(shù)模型。它們也具有非常好的性能和成本效益比。
所以,我非常期待看到大家如何使用這些模型。從整體上看,這是開源 AI 的一個重要時刻。我一直認為開源 AI 將成為行業(yè)標準,它會遵循類似于 Linux 的發(fā)展路徑。
在 Linux 流行之前,有很多公司都有自己封閉版本的 Unix。當時,沒有任何開源項目能達到這種復雜程度,人們認為封閉的開發(fā)模式是唯一可行的方法。
但最初, Linux 取得了一定的立足點,因為它更便宜,開發(fā)者可以以不同的方式定制它。隨著生態(tài)系統(tǒng)的發(fā)展,它得到了更多的關注,因此實際上變得更加安全,功能也更強大。越來越多的合作伙伴為其構(gòu)建了更多的功能,這使其比任何封閉的Unix系統(tǒng)都更具能力。
所以,今天 Llama-3.1 的發(fā)布是一個類似的轉(zhuǎn)折點, Llama 有機會成為開源 AI 的標準,使開源成為 AI 的行業(yè)標準。
即使在性能上還未完全領先,但在成本、可定制性以及可以拿來微調(diào)和進行各種操作的能力方面,它都有巨大的優(yōu)勢。開發(fā)者會充分利用這些優(yōu)勢,我們專注于構(gòu)建這個生態(tài)系統(tǒng),圍繞它可以開發(fā)出各種不同的能力。所以,我很高興能討論這些內(nèi)容。
Rowan Cheung
是的,我看到了所有的基準測試結(jié)果,確實令人難以置信。這是首個具有 4050 億參數(shù)的開源前沿模型。你對人們用這個模型構(gòu)建的任何具體現(xiàn)實世界的用例特別感興趣嗎?
Mark Zuckerberg
我最感興趣的是看到人們用它來蒸餾和微調(diào)自己的模型。正如你所說,這是第一個開源的前沿級模型,但它不是第一個前沿級模型。所以,已經(jīng)有其他具有這種能力的模型,人們會希望直接在 4050 億參數(shù)的模型上進行推理,因為據(jù)我們的估計,這樣做的成本將比 GPT-4 低 50% 左右。
這對很多人來說顯然是一個很大的差異。但這世界上真正新的東西是因為它是開源的,人們可以將模型蒸餾到任何他們想要的大小,用于合成數(shù)據(jù)生成,作為教師模型使用。
所以,我們對未來的愿景并不是說會有一個單一的東西。OpenAI 有一種愿景,他們會構(gòu)建一個大 AI ,Anthropic 也有類似的愿景, Google 也是。但這從來不是我們的愿景。我們的愿景是應該有很多不同的模型。
每個創(chuàng)業(yè)公司、每個企業(yè)、每個政府都希望擁有自己的定制模型。而當封閉生態(tài)系統(tǒng)比開源系統(tǒng)好得多時,使用現(xiàn)成的封閉系統(tǒng)是更好的選擇,因為即使你可以定制開源系統(tǒng),性能之間仍然存在一些差距。但現(xiàn)在我們不再看到這種情況。
現(xiàn)在,開源基本上彌合了這一差距。你會看到模型的廣泛擴散,人們現(xiàn)在有動力去定制和構(gòu)建并訓練適合他們需求的模型,將他們的數(shù)據(jù)訓練到模型中。
因為像 Amazon 通過 AWS 或者 Databricks 這樣的公司提供的一整套服務用于蒸餾和微調(diào)開源模型。我們與這些合作伙伴進行了很多特定的工作以實現(xiàn)這一目標。同時,還會有像 Grok 這樣的公司,他們在超低延遲推理方面做了非常有趣的工作。
我非常期待將其交到他們手中,他們正在為推出而構(gòu)建一些東西,這也將實現(xiàn)這一點。然后,還有一整套企業(yè)公司,像 Dell、Scale. AI 、Deloitte 或 Accenture,他們與世界各地的企業(yè)合作進行技術部署。
這些公司會幫助構(gòu)建定制模型,無論是大型企業(yè)還是政府,很多公司希望擁有一個可以訓練其定制數(shù)據(jù)的模型。但很多公司不想通過API將他們的數(shù)據(jù)發(fā)送到 Google 或 OpenAI 。這并不是因為這些公司有特別的隱私問題,而是出于類似于人們喜歡加密和 WhatsApp 的原因。
人們希望擁有一種設計上安全的架構(gòu),他們的數(shù)據(jù)可以保存在他們自己手中。會有一個圍繞這些構(gòu)建的完整市場。所以,我對所有這些都感到非常興奮。但這次我們采取了更積極的立場,幫助構(gòu)建生態(tài)系統(tǒng),因為這是它增長并為每個人創(chuàng)造更大價值的方式。
Rowan Cheung
是的,這確實是一個大事。你們是如何教育開發(fā)者使用這些工具的?更廣泛地說, Meta 是否有計劃或策略來教育世界其他地方關于開源的重要性?
Mark Zuckerberg
是的,在 Llama-3.1 之前,我們的做法主要是這樣的。Meta 投資于此的根本原因是我們希望確保我們可以獲得領先的模型。由于我們在移動互聯(lián)網(wǎng)歷史上的一些經(jīng)驗,我們不希望處于必須依賴某個競爭對手提供這種基礎技術的地位。所以我們?yōu)樽约簶?gòu)建了它。
在 Llama-3.1 之前,我們本能地認為,如果我們將其開源,就會有一個社區(qū)圍繞它成長,并實際上擴展其能力,使其對包括我們在內(nèi)的每個人都更有價值。因為最終,這不僅僅是一項技術,它是一個生態(tài)系統(tǒng)。為了使它對我們來說成為一個有用的東西,必須有一個廣泛的生態(tài)系統(tǒng)。
在 Llama-3.1 中,我們看到的一個重大變化是,我們不僅僅是為自己構(gòu)建它,然后將其發(fā)布給開發(fā)者使用,這次我們采取了更加積極的立場,建立合作伙伴關系,確保有一個公司生態(tài)系統(tǒng)可以用模型做有趣的事情,并以我們不會做的方式服務開發(fā)者。我們不是公共云服務提供商,對吧?開發(fā)者市場不會來找我們構(gòu)建他們的東西。但我們希望確保所有這些公共云都能夠很好地進行這項工作。
這包括一些更基本的功能,比如托管模型和提供推理服務。但我們也希望確保一些新的功能能夠?qū)崿F(xiàn),比如蒸餾和微調(diào),因為這些在封閉模型中不太可能實現(xiàn)。所以我們必須與這些合作伙伴進行特定的工作來實現(xiàn)這一目標。同時,也會有一些公司,如 Grok ,他們在超低延遲推理方面做了非常有趣的工作。
我對 AI 的擔憂實際上不是 Apple ,而是其他公司,擔心這種封閉生態(tài)系統(tǒng)的發(fā)展。在某種程度上,我并不是在說他們是壞人,而是這種系統(tǒng)的物理和激勵結(jié)構(gòu)會推動你去限制某些事情。
如果生態(tài)系統(tǒng)像網(wǎng)絡一樣開發(fā),但更加強大,它會更健康。因為在移動互聯(lián)網(wǎng)的發(fā)展過程中,封閉模式獲勝了, Apple 獲得了最多的收益,雖然可能有更多的安卓手機,但 Apple 幾乎獲取了移動電話市場的所有利潤。這存在一定的近期偏見,因為這些是長期的周期。
iPhone 于 2007 年推出,我們已經(jīng)接近 20 年了,這是一個漫長的周期,但人們很容易忘記封閉模式并不總是獲勝。如果回到 PC 時代,盡管很多人,尤其是使用 Linux 類比的人,可能不認為 Windows 是完全開放的,但相比 Apple 將操作系統(tǒng)與設備捆綁的方式,Windows 的開放生態(tài)系統(tǒng)更勝一籌。
我的希望是,下一代平臺,包括 AI 和我們在增強和虛擬現(xiàn)實方面的工作, Meta 希望站在建立開放生態(tài)系統(tǒng)的一邊。我們不僅希望建立一個封閉生態(tài)系統(tǒng)的替代品,還希望恢復行業(yè)狀態(tài),使開放生態(tài)系統(tǒng)成為領導者。
這是可能的,我們在 AI 、AR 和 VR 方面都在取得良好的進展。但這也是我個人和哲學上的一個關注點,因為我感受到的創(chuàng)造力限制在過去 10~15 年間是由于移動互聯(lián)網(wǎng)封閉模式的發(fā)展。
我不想深入討論這個點,但這確實是一個重要的議題。我們現(xiàn)在有了 Llama-3.1 的 4050 億參數(shù)模型,它在一些關鍵基準測試中與最好的封閉模型競爭,甚至超過了一些封閉模型,這本身就很驚人。
Rowan Cheung
但在你的信中還提到, Llama-4 有望成為行業(yè)中最先進的模型。你對 Llama-4 有什么特別興奮的地方嗎?
Mark Zuckerberg
我們剛剛發(fā)布了 Llama-3.1 ,可能談 Llama-4 還為時過早。我們已經(jīng)建立了計算集群,準備了大量的數(shù)據(jù),對架構(gòu)有了一個大致的概念,并進行了大量的研究實驗來最大化其性能。所以我確實認為 Llama-4 將是 Llama-3 的又一次大躍進。我們還有很多進展可以取得。
這是 Llama 的首次發(fā)布,還有很多我想做的事情,包括推出多模態(tài)模型,我們在這一點上遇到了一些不幸的挫折,但我們將在未來幾個月內(nèi)推出它們,尤其是在歐盟以外的地方。
現(xiàn)在談 Llama-4 可能有點早,但它肯定會很棒。管理公司時,計劃計算集群和數(shù)據(jù)軌跡不僅僅是針對 Llama-4 ,而是未來四五個版本的 Llama ,這確實是件有趣的事情。因為這些都是需要長期投資的事情,建設數(shù)據(jù)中心、配套的電力、芯片架構(gòu)和網(wǎng)絡架構(gòu)等。
這個回答可能有點含糊,只是表達了一些一般的興奮。但 Llama-3.1 至少應該有一周的時間讓我們消化一下發(fā)布的內(nèi)容,然后再談未來。
Rowan Cheung
接下來的幾周將是瘋狂的,只因為 3.1 的發(fā)布。但聽到 Meta 已經(jīng)在為 Llama-4 做準備,仍然令人興奮。在這個方面,你能否多談談你對 AI 的長期愿景以及未來可能會發(fā)生的事情?
Mark Zuckerberg
是的,我很高興從技術和產(chǎn)品的角度來談論這個問題,但既然我們已經(jīng)談論了很多模型方面的內(nèi)容,那我就先從產(chǎn)品開始吧。我們的愿景是,應該有許多不同的 AI 和 AI 服務,而不僅僅是單一的 AI ,這也確實影響了我們的開源方法,并影響了我們的產(chǎn)品路線圖。
Meta AI 目前表現(xiàn)相當不錯,我的目標是在今年年底前使它成為世界上使用最廣泛的 AI 助手,我們很有希望在幾個月內(nèi)達到這一里程碑。而且我們有能力和商業(yè)模式來構(gòu)建世界上最先進的模型,并向所有人免費提供,這是一個巨大的優(yōu)勢。我們的所有應用程序都非常容易使用,所以我對目前的進展感到非常興奮。這是我們所擁有的基本助手,這將是一件大事。
但更重要的是,我們的重點是讓每個創(chuàng)作者和每個小企業(yè)都能創(chuàng)建自己的 AI Agent,使每個人都能在我們的平臺上創(chuàng)建他們想要的 AI Agent。
如果你想想看,這些都是巨大的市場。世界上有數(shù)億的小企業(yè),非常重要的一點是,通過相對少量的工作,一個企業(yè)可以通過幾次點擊就能創(chuàng)建一個 AI Agent來進行客戶支持、銷售,并與所有客戶溝通。
未來每個企業(yè)都會像現(xiàn)在有電子郵件地址、網(wǎng)站和社交媒體一樣,擁有一個他們的客戶可以交流的 AI Agent。
我們希望為這些企業(yè)實現(xiàn)這一點,這將會是數(shù)億甚至數(shù)十億的小企業(yè) Agent。對于創(chuàng)作者來說也是同樣的道理,我們的平臺上有超過 2 億人自認為是創(chuàng)作者,他們主要利用我們的平臺來建立社區(qū)、發(fā)布內(nèi)容,感覺這就像是他們工作的一部分。他們都有一個基本問題,就是一天的時間不夠用,無法與他們的社區(qū)進行足夠的互動。
同樣,他們的社區(qū)通常希望能有更多的互動時間,但時間總是不夠用。這將是一個巨大的突破,基本上每個創(chuàng)作者都可以從社交媒體上獲取所有信息,訓練這些系統(tǒng)以反映他們的價值觀和業(yè)務目標,然后人們可以與之互動。這幾乎就像是創(chuàng)作者創(chuàng)作的一個藝術品,人們可以以不同的方式與之互動。
這還不包括所有其他人將能夠為自己創(chuàng)建不同的 AI Agent來做不同的事情。所以我們將生活在一個擁有數(shù)億甚至數(shù)十億不同 AI Agent的世界里,可能最終 AI Agent 的數(shù)量會超過世界上的人口,人們將以各種不同的方式與它們互動。這是產(chǎn)品愿景的一部分,顯然其中有很多商業(yè)機會,這是我們希望賺錢的地方。
我們不會通過銷售模型本身來賺錢,因為我們不是公共云公司。我們將通過構(gòu)建最好的產(chǎn)品來賺錢,最好的產(chǎn)品的重要組成部分是擁有最好的模型,而圍繞開源建立最好的生態(tài)系統(tǒng)將幫助我們做到這一點。這就是為什么所有這些都對我們來說是一致的,也是為什么這對我們構(gòu)建高質(zhì)量產(chǎn)品并取得最佳商業(yè)結(jié)果非常有價值。但這也是為什么這在哲學上是一致的。我
們不相信會有一個單一的 AI 產(chǎn)品或模型,每個人都使用。我們根本上相信擁有多樣化的模型集,每個企業(yè)和個人都將希望擁有他們自己的東西,這將是非常有趣的,這也是讓這個事情有趣的原因之一。
Rowan Cheung
是的,看到 Meta 將技術直接整合到產(chǎn)品中,并且向數(shù)十億用戶免費提供前沿 AI 模型,這是一個巨大的突破。在這個基礎上,我有一個關于懷疑態(tài)度的最后一個問題。
在 20 世紀 90 年代,對互聯(lián)網(wǎng)的懷疑態(tài)度無處不在,但最終反對它變得幾乎是不合理的。現(xiàn)在關于 AI 的懷疑態(tài)度似乎也在經(jīng)歷類似的軌跡。你認為我們正處于這一早期階段,并且會有一個時刻反對 AI 的態(tài)度會像今天反對互聯(lián)網(wǎng)一樣被視為不合理嗎?你認為哪些因素將是改變這種看法的關鍵?
Mark Zuckerberg
人們有不同的方式來擔憂某件事。我很清楚的是,互聯(lián)網(wǎng)在成功之前經(jīng)歷了一次大泡沫破滅,所以所有對互聯(lián)網(wǎng)持長遠觀點的人最終都是對的,但有時候事情的發(fā)展比你預期的要慢,你需要有信心堅持下去。這是我意識到的一點,因為我對 Llama-3 以及 Llama-4 、 Llama-5將帶來的所有解鎖感到非常興奮,這將轉(zhuǎn)化為更好的產(chǎn)品。
但現(xiàn)實是,很難提前知道某件事什么時候足夠好,可以讓數(shù)十億人使用,然后準備好成為一個大生意。我們現(xiàn)在都在投入大量的資本來訓練這些模型,所以人們可能會在相當長的一段時間內(nèi)虧錢,但我不知道,也許這一切會更快發(fā)生,這很難說。
你更關心的是人們對其生計的擔憂。在這方面,這也是開源方法、許多不同的個性化和定制化模型的重要原因之一。如果這一發(fā)展僅僅是由少數(shù)公司構(gòu)建產(chǎn)品并從中受益,而人們只使用這些產(chǎn)品,雖然可能他們喜歡與 AI 助手交談,這對他們有價值,但如果這沒有在某種程度上幫助提升所有人的生活水平,那么最終會出現(xiàn)反彈。
在 Web 2.0 的發(fā)展過程中,我花了一些時間思考,在 AI 、AR 和 VR 等下一代技術中,如何不僅創(chuàng)建一個繁榮的產(chǎn)品集和經(jīng)濟生產(chǎn)力增長,還如何創(chuàng)建一個更好、更可持續(xù)的政治經(jīng)濟環(huán)境,讓更多人感到他們從中受益并支持這一系統(tǒng)。
我們在社交媒體方面做得相對不錯,但從世界的一些反饋和回應來看,在 AI 和其他新技術方面,我們需要做得更好,以緩解人們對這些技術對他們生計、工作和生活影響的擔憂。
本文由人人都是產(chǎn)品經(jīng)理作者【江天 Tim】,微信公眾號:【有新Newin】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自采訪截圖
可以看到AI對就業(yè)的沖擊是毫無疑問的,但我相信挑戰(zhàn)相應的會帶來機遇,科技從來不會因為誰而停下發(fā)展的腳步,這樣看終身學習是個很重要的能力。