OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

0 評論 3605 瀏覽 4 收藏 24 分鐘

有消息稱,前 OpenAI 聯合創始人&主席 Elon Musk,正在接洽曾在 DeepMind & OpenAI 任職的工程師 Igor Baushkin,打算組建一個新的AI實驗室及ChatGPT的替代品,未來會如何呢?本文作者圍繞這件事進行了分析,并分享了20年前的“ChatGPT”的故事,一起來看一下吧。

這是 OpenAI 系列的第四篇,源自一則新聞,該新聞報道前 OpenAI 聯合創始人&主席的 Elon Musk 正在接洽曾在 DeepMind & OpenAI 任職的工程師 Igor Baushkin,從而組建一個新的 AI 實驗室以及 ChatGPT 的替代品,可能的名稱為 Based AI 以及 TruthGPT,本篇將主要圍繞這起事件分 2 節進行展開,第 3 節是一個古早的創業故事:

  1. OpenAI 的初衷與 Musk 的執念
  2. Igor Bauschkin 會是下個“AK”么?
  3. 微軟棄嬰,20 年前的“ChatGPT”

01 OpenAI 的初衷與 Musk 的執念

根據外媒報道,Elon Musk 正與 AI 研究人員接洽,希望組建一個新的 AI 研究實驗室以開發 ChatGPT 的替代品,其中就包括上周剛離開 Alphabet 旗下 DeepMind 部門的工程師 —— Igor Bauschkin。

報道出來的同一天,Musk 其實還在 Twitter 上發了一個表情包,名為「Based AI」的 Doge 手持大棒打跑了 「Woke AI」以及「Closed AI」,不知道是不是分別暗指 DeepMind 和 OpenAI 這兩家 :D,但無論如何還會出現一個第三方,并且是 Musk 主導的,暫且叫「Based AI」。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

那么這個「Based AI」想做什么呢?其實又回到了 OpenAI 成立之初,Elon Musk 所暢想的愿景與使命,畢竟 OpenAI 現在的狀態可不是原先 Musk 所想的那樣,OpenAI 成立之初非營利的性質是為了防止 Google 作惡,現在 OpenAI 變成了另一個硅谷巨頭微軟變相控制的企業,且以盈利導向,好家伙,非但原先的假想敵沒干掉,還一下變成倆,這怎么搞?

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

回到當年 OpenAI 成立不久,Musk 還同 Greg Brockman、Sam Altman 以及 Ilya Sutskever 一同署名了一篇文章《OpenAI technical goals,OpenAI’s mission is to build safe AI, and ensure AI’s benefits are as widely and evenly distributed as possible 》,也是登在 OpenAI 官網的唯一一篇Musk 以作者身份署名的文章,開頭如下:

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

大概意思是 OpenAI 的技術目標是構建安全的 AI,確保 AI 的利益盡可能的防范和均勻分布,而 Musk 對于目前 AI 的態度就好像對待 Twitter 一樣,作為 Twitter 的深度用戶,看到平臺上的內容和信息集中而不均勻,或者叫中心化,這對于每一個內容消費者來說并不是好事。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

對于 Elon Musk 而言,訓練一個聊天機器人不是最終目的,“我們需要 TruthGPT”,提高大語言模型的推理能力和真實性才是更重要的,即模型的可用性和可靠性。打個比方,作為用戶,不管是“搜索”還是“聊天”,得到的結果無非是「人類生產+算法分發」或者「人類生產+ AI 加工」,AI 到一定程度實現生成即分發,兩者還有區別么?區沒區別其實也不重要,但是效果一樣,終端用戶是否依然受限于一個信息繭房之中?或者更嚴重?

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

這里不具體討論 Musk 主觀想法,別人也難猜到,但是客觀分析他的言論,確實存在“信息繭房”的問題。無論是推薦算法分發的時代,還是接下來生成式 AI 時代,用戶如果都是被動獲取來自機器派送的信息,那么一方面將受限于用戶自己在屏幕的每一次點擊、滑動、停留以及互動,另一方面也受限于用戶當前的認知與語言框架,更可能本身 AI 訓練的數據集都是被修飾過的。

除此之外,生成式 AI 可能也會生產出一堆“噪音”,“噪音”可能比人類生產的“噪音”還要高效,那么就更加難以分辨出真正的“信號”,這個過程有點像是你用某搜索引擎搜索,得到的結果都是人家 SEO 精心優化好的。

這一點其實在 Musk 對于教育的看法上有些吻合。Musk 在公開場合曾表示教育的本質是把數據(案例)和算法(方法)下載到大腦里,大部分知識可以在網上免費搜到,那么在網上沖浪本身也帶有邊刷邊學的場景在,如果數據和算法是不安全的,那么也將會影響下一個“Musk”。

所以,結合 TruthGPT 的話題反過來想,不管是 UGC 還是 AIGC,用戶只要在網絡上獲取的是“噪音”而不是“信號”,那么體驗總歸是不好的,這也是為什么強調 “Truth”。

未來如何,這很難預測,但應對“噪音”這個問題,Musk 本人也曾提過他的思維框架,這可能是一種可行的“降噪”方式 —— “你需要有一個這樣的立場,從某種程度上假設自己是錯的,你的目標打從一開始就不是分出對錯,而是隨著時間的推移減少錯誤”,這樣就避免了過早下結論導致出錯的可能性,并且保持穩扎穩打的心態。

02 Igor Bauschkin 會是下個“AK”么

接著文章開頭,細聊下Musk 想招納的這個帥哥 Igor Bauschkin 履歷與經歷,也許他會是下一個“Andrej Karpathy”,OpenAI 的創始團隊成員,ex 特斯拉 AI 總監。

Bauschkin 是物理學+計算機背景 ,在 DeepMind 和 OpenAI 都工作過,也接手過 Gopher 和 GPT 兩大模型。2015 年,Bauschkin 在德國多特蒙德工業大學獲得物理學碩士學位,在讀書期間還報名了 CERN(歐洲核子研究中心)暑期學生計劃,該計劃也為 Igor Bauschkin 這樣理工科背景的學生提供機器學習相關課程的機會。

在正式步入 AI 領域前,Bauschkin 畢業后在 CERN 進行大型強子對撞機研究工作,在那里通過 LHCb 實驗分析粒子衰變,期間在許多物理學相關期刊發表了多篇論文。

Bauschkin 在機器學習領域的研究最早可以追溯至 2018 年在 ICML 國際會議上與人合著發表的《Synthesizing programs for images using reinforced adversarial learning》,主要講述在無監督情況下,通過分布式強化學習來進行模型訓練,從而合成圖像。

2017 年,Bauschkin 加入當時已經被 Google 收購的 DeepMind 擔任 Research Engineer,主要負責自然語言處理和強化學習方面的研究。2019 年 1 月,DeepMind 在官方博客更新了一篇《Alphastar: Mastering the real-time strategy game starcraft ii 》的文章,AlphaStar 是 DeepMind 開發的第一個擊敗頂級職業玩家的人工智能,當時AI 以 5:0 的比分擊敗了職業選手,Bauschkin 是 AlphaStar Team 的主要成員之一,文章講述了 AlphaStar 是如何通過深度神經網絡訓練的。同年 11 月,相關研究《Grandmaster level in StarCraft II using multi-agent reinforcement learning》登上《Nature》。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

2020 年 11 月,Bauschkin 離職,加入已經成立滿 5 年的 OpenAI 擔任 Technical Staff,期間參與了 GPT-3、DALL-E 和 CLIP 項目的開發。

同期,Bauschkin 還是另一篇 DeepMind 在 2021 年發表的論文《Scaling Language Models: Methods, Analysis & Insights from Training Gopher》合著者。

這篇論文講述了基于 Google Transformer 的各種語言模型在規模與性能上的比對,從數千萬參數的模型再到 2800 億參數量量的 Gopher 模型,研究人員發現規模收益主要體現在閱讀理解和內容審查方面,而在邏輯和數學推理的收益較小,比如 Gopher 模型在以下幾個垂直知識領域甚至超過了當時的 GPT-3 和人類專家。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

Gopher 模型和 GPT-3 模型兩者都基于 Google 的 Transformer 神經網絡架構開發,也都是預訓練模型,在參數規模上前者達 2800 億,后者為 1750 億,但由于在訓練數據集以及訓練方式的差異,兩者的表現也不同,就好比 28 歲的 A 和 17 歲的 B 一起考試,你很難說 A 會因為年齡大更聰明,又或者 B 更年輕而跑更快。Gopher 模型也能實現 ChatGPT 那樣的聊天,DeepMind 在文章里還公開過一些 QA 案例。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

2022 年 4 月,Bauschkin 從 OpenAI 離開,再次回歸 DeepMind,擔任 Senior Staff Research Engineer,在短短停留 11 個月后宣布離開。根據 Igor Bauschkin 在接受媒體采訪時表示,目前還沒有正式簽署 Elon Musk 的項目,但希望和 Musk 一起在大語言模型領域進行研究,論實力 Musk 無論在想象力、執行力、財力還是組織力上都是滿級的存在,作為 OpenAI 的早期發起人他具備另起爐灶的要素,Musk 的 BasedAI 以及 Truth GPT 還是值得期待的。

03 微軟棄嬰,20 年前的“ChatGPT”

聊完今時今日 Musk 與他的 AI 大計,就到了本期的最后一節,主要講述微軟與 20 年前火極一時,不亞于今天 ChatGPT 的一款產品,它們很相似,但可能走著不同的命運。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

這款產品叫做 SmarterChild,可能是最早的互聯網模因(“?!保┲?,當時是一款主要內嵌在即時通訊軟件內的 ToC 聊天機器人,當然它也有 ToB 的形態,一個類訂閱號的 Bot 來提供營銷服務;它所呈現的個性并不基于技術,而是基于 Bot 背后編輯團隊的創意,最終它被微軟收購,被微軟應用在旗下的產品當中。

2000 年,Tim Kay 和姐夫Robert Hoffer,外加一個紐約的廣告狂人 Peter Levitan 創立了 ActiveBuddy,Inc 這家公司。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

2001年6月,ActiveBuddy在 AIM(AOL Instant Messenger)上推出名為 SmarterChild 的聊天機器人,就像是在電腦端 QQ 好友列表里添加 ChatGPT;同月,大洋彼岸的 OICQ 也正式更名為 QQ 并推出了經典的企鵝 logo。

根據聯合創始人 Hoffer 描述,SmarterChild 自 2001 年 6 月推出后,是有史以來第一個互聯網模因,當時每天的新增用戶按「萬」為計量單位,甚至超過了 Twitter 的增速。PS:大概是2006 年前后的數據,因為 Twitter 最早版本是 2006 年 3月推出的。

2003 年紐約時報的一篇文章顯示,每天有 25 萬人與 SmarterChild 聊天,按照今天的話說是 DAU 為 25 萬,在其生命周期內總共在 AOL、MSN 以及 Yahoo 平臺三大平臺的即時通訊軟件上吸引了超過 3000 萬的用戶,巔峰時期占所有 IM 通訊軟件流量的 5%,每天接受數億條消息。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

當然,故事的結局是 SmarterChild 沒有活到成年,不然現在也沒有 ChatGPT 什么事了,原因自然和微軟脫不了干系。

最初 SmarterChild 的產品 Demo 來源于聯合創始人 Kay 在車庫里的嘗試,通過代碼連接一個名為“ActiveBuddy”的好友代理來查股票代碼,之后又支持了 AOL聊天模塊上的文字冒險游戲“Colossal Cave Adventure”、MIT 的問答系統“Boris Katz Start”以及更廣泛的數據庫,包括訪問新聞、天氣、股票、電影、體育等數據和各類如計算器和翻譯的工具。PS:害,這不就是今天的 Microsoft Bing 么?原來早就有了。

投資了 Siri、Uber、Epic、Chime 的投資人——Menlo Venture 道合伙人 Shawn Carolan 回憶道:“首次接觸 Siri 時,當時的 SmarterChild 已經擁有 1000 萬用戶,每天收到 10 億條消息”。實際上,Siri 成立于 2007 年,2008 年初拿到 Carolan 的投資,當時的 SmarterChild 已經處于產品生命周期尾聲了。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

ActiveBuddy,Inc 成立之初曾籌集到數千萬美元,商業化策略主要是為英國搖滾樂隊 Radiohead、電影《王牌大賤諜》、《體育新聞》 、英特爾以及 Keebler 等 B 端客戶提供 IM 營銷服務。舉個例子,Radiohead 當時在其第 5 張專輯《Amnesiac》中推出名為 GoolyMinotaur(Gooly) 的角色,Gooly 也是 ActiveBuddy 推出的定制化音樂機器人。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

用戶可以通過 AOL 的即時通訊軟件 AIM 添加 SmarterChild 為好友,并從聊天框里獲得樂隊巡演、簡介、音樂下載以及工作室的獨家內容,就理解成微信里面的企業訂閱號吧……根據統計當時這個“訂閱號”曾向 100 萬用戶發送大約 6000 萬條消息推送。

OpenAI 第四彈:馬斯克強調的 TruthGPT 是什么?下個“AK”;微軟棄嬰,二十年前的 ChatGPT

SmarterChild 早期產品成功的原因主要歸納為 4 點:

  1. 產品形態:SmarterChild 本質是一款聊天機器人,通過文本與用戶交互,20多年前 128kbps 的網速下載 1 秒的音頻需要 16000 字節,而文本僅 90 字節,在有限的網速下文本作為媒介具備明顯傳輸優勢;
  2. 兼容性:SmarterChild 不是客戶端產品,不需要下載和安裝,用戶通過當時的 IM 平臺即可添加 SmarterChild 到好友列表里,如同今天活在 Discord 社區里的 Midjourney;
  3. 社交屬性:按照當時的網絡環境,上網聊天的是一群感時髦的孩子,他們通常在放學后撥號上網,并在睡前迎來又一波流量高峰,對 Ta 們來說通過 SmarterChild 獲取信息不重要,社交、好奇與打發時間才是更重要的;
  4. 個性:對,你沒看錯,這是 SmarterChild 的第一位投資人 —— Hoffer 的朋友,當時在 Pixar 擔任 2D 動畫師的 Doug Frankel 投資了 ActiveBuddy 約 400 萬美元,Frankel 當時表示 SmarterChild 有點點“壞”,它會 PUA 用戶,這不是因為當時的技術有多先進,更談不上 AI,而是聊天機器人背后的編輯們是一群充滿創意和惡搞的群體,用戶喜歡的這種“壞”,就好比《狂飆》里的強哥。

Hoffer 曾表示“當擁有一個具有個性的角色時,可能面臨的不是技術問題,而是編輯問題,作為角色的塑造方,你必須愿意激怒 50% 的用戶,這也是大公司做不好和不敢做的原因”。PS:今天 Google 復現了這個 Bug~

Kay 這么形容當時互聯網泡沫前后發生的變化 —— 互聯網泡沫破滅前,人們在說“哦,你有一個商業模式并不重要,吸引眼球才是最重要的” ,而當互聯網泡沫破滅后,人們在說“你必須賺錢?!?/p>

2000 年的互聯網泡沫破滅后,當時廣告行業處于下行周期,投資機構也變得謹慎,而 SmarterChild 業務發展和商業化也正需要更多的工程師、腳本編輯團隊和業務開發人員。

ActiveBuddy 終于獲得了一家名為 Wit Soundview 的風投機構支持,但這家機構缺乏遠見,以激進的方式推動管理層將公司商業化,最終導致了核心團隊的流失,包括那些有趣的編輯們,公司的業務也面臨轉型,聚焦 B 端服務,開始為 Comcast 和 Cox 等大型傳播集團提供定制服務,2003 年公司更名為 Conversagent,2006 年再次更名為 Colloquis,最終在 2006 年 10 月被微軟以 4600 萬美元收購。

微軟收購 Colloquis 的本意是將這家公司的對話技術推向其現有的客戶,Colloquis 的相關產品包括后來的 Windows Live Service Agents,可以在 Windows Live Messenger 上提供服務機器人,以及 Colloquis Answer Suite。

同樣,微軟這邊也是以商業化為目的,2007 年微軟發布了圣誕老人機器人,由于這款產品向未成年發布了攻擊性的暗示,最終在 2009 年被微軟喊“Cut”。

至于為什么?原因是那時聊天機器人的底層能力遠比不上今時今日大模型所表現出的“類人”能力,更需要編輯們生產的“數據”和內容審核,但微軟恰恰不是一家內容公司,激進的商業化反過來加劇了管理的混亂,早期成員流失。

回顧 SmarterChild 這款產品的一生,將它比作 20 多年前手工版的“ChatGPT”并不為過,兩者有許多相似的地方,相同的地方不列舉了,而不同的地方,例如技術與商業環境今非昔比、今天的微軟也比 2007 年那會兒支棱多了、大語言模型的學習效率與 GPT 模型肉眼可見的演化,以及 OpenAI LP 與微軟之間復雜的條款約定,而并非 100%所有。

最后,與其推測 OpenAI 版的“SmarterChild”未來會如何?倒不如順著 Musk 的逆向思維,看看 ChatGPT 是否已經避開了當年 SmarterChild 的一些覆轍?另外還具備了哪些新的競爭優勢?

Reference:

https://fortune.com/2023/02/28/elon-musk-rival-openai-chatgpt-woke-ai/

https://www.nature.com/articles/s41586-019-1724-z.epdf?author_access_token=lZH3nqPYtWJXfDA10W0CNNRgN0jAjWel9jnR3ZoTv0PSZcPzJFGNAZhOlk4deBCKzKm70KfinloafEF1bCCXL6IIHHgKaDkaTkBcTEv7aT-wqDoG1VeO9-wO3GEoAMF9bAOt7mJ0RWQnRVMbyfgH9A%3D%3D

https://www.deepmind.com/blog/language-modelling-at-scale-gopher-ethical-considerations-and-retrieval

https://zhuanlan.zhihu.com/p/458200357

https://www.babushk.in/index.html

https://en.wikipedia.org/wiki/SmarterChild

https://www.vice.com/en/article/jpgpey/a-history-of-smarterchild

https://peterlevitan.com/my-story/

https://www.avclub.com/the-oral-history-of-radiohead-s-googlyminotaur-a-chatb-1798248780

https://en.wikipedia.org/wiki/GooglyMinotaur

https://en.wikipedia.org/wiki/Colloquis

https://chatbotsmagazine.com/radiohead-s-googlyminotaur-ee91cd600a4a

作者:TimJ;來源公眾號:江天Tim

本文由 @江天Tim 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!