蘋果 Vision Pro 和 GPT-4,開啟了「智力盈余」時代
隨著科技的進步,人工智能技術的發展為我們帶來了更多驚喜,比如最近蘋果推出的Vision Pro,以及先前掀起廣泛討論的GPT-4,這些技術或新產品的出現,某種程度上將帶領我們開啟一個「智力盈余」時代。具體如何理解?不妨來看看作者的解讀。
2023 年已經接近過半,但是還沒有什么人說這一年是「XX 元年」,畢竟我們在樂觀時代的樂觀情緒鼓動下,已經把「AI 元年」,「VR 元年」,「元宇宙元年」,以及區塊鏈,Web3 等等技術的元年分配出去了。
與之相反,2023 年早已不屬于樂觀時代,那種火熱的樂觀情緒正在變得異常謹慎,最簡單的例子就是,OPEN AI 目前的估值還不到 300 億美元,要是在四五年前,它的估值很可能翻倍甚至更多。
當然,這一年注定還有很多其他的事情,比如智能手機行業徹底進入了下行通道,曾經被認為是出貨量下滑主因的疫情因素剔除之后,大家只能面對嚴酷的現實:大家對智能手機已經意興闌珊了。再比如阿里云開啟史上最大規模降價,隨后騰訊云也跟進。還有比如高通展示了在 Android 手機上本地運行的 Stable Diffusion(一種開源 AI 繪圖工具)。或者是一些和互聯網關系不大的,比如大家對于可控核聚變突然信心充足起來了……
當然,以世界之廣闊,一年之悠長,類似的新聞年年有之,只看這些,2023 年又類似于萬歷十五年那樣,不過是歷史上平平淡淡的一年。
但如果時間維度拉長,我們回看 2023 年的時候,一定有兩款產品在歷史維度上留名:已經發布的 GPT-4,和剛剛發布的蘋果 Vision Pro 頭顯。
2023 不是任何「元年」,但因為 GPT-4 和蘋果 Vision Pro 成為極為重要的一年。
一、智力
實際上,GPT-4 是一個統稱:可以取代部分腦力工作的 AI 工具。
比如,微軟 Office Copilot,原本需要學習很久的 Excel 公式才可以實現的數據分析,如今只需要一句話就可以做到;原本需要一整天制作的 PPT,現在還是一句話的事兒。
MidJourney 生成的圖片,玻璃反射極為逼真
再比如 AI 畫圖工具 MidJourney,可以在幾分鐘時間里輸出質量極高的各類圖片,無論是二次元插畫風格,還是像是專業相機拍攝的以假亂真圖片。
還有 GPT-4 本身作為大語言模型以及通用人工智能的代表所呈現出來的「智力」:讓它去參加「美國高考」SAT 考試的話,它的成績可以打敗 90% 考生,分數足以讓它進入美國哈佛或者斯坦福等名校。
除此之外,現在每天還有各種各樣的 AI 工具出現,在某些方面上展現出遠超人類能力的高效。
如同 GPT-4 等大模型展現出來的「涌現」現象一樣,現在的 AI 工具也不斷地涌現出來,對于大多數人來說,不談學習和使用這些工具,光是做到知道這些工具的存在就已經不太可能了。
《漫長的季節》當中,男主角王響在鋼鐵廠開了幾十年的火車,開火車的技能讓王響手捧鐵飯碗,也享有不錯的社會地位和家庭地位。
在同樣或者更早的時期,一項并不難獲得的技能足以保證一個人在幾十年時間里獲得安穩的工作:五六十年前的美國高中畢業生如果會用打字機或者計算器,那就可以在一家公司找到穩定 30 年的白領工作。
現在,沒有人認為依靠掌握了 Office 軟件就能在一家公司干 30 年。
在 10 年前,我在愛范兒寫一些編譯類快訊新聞類消息,一天寫 6 條已經讓我倍感疲憊,但是如今借助 ChatGPT 的翻譯和總結能力,一個有基本英語和語文能力的高中生,一天寫 60 條快訊新聞也不是難事。
這是一道最簡單的算術題,現在的 AI 工具并不能完全替代人,但是可以在一些工作崗位上實現「1 個人+AI=10 個人」的效果。
這種算術題并不是作為威懾的戰略武器,而是正在發生的情形,不少游戲公司已經用 AI 進行人物原畫繪畫和場景建模。
盒馬鮮生用 MidJourney 生成的宣傳圖,能夠以假亂真
上上個月盒馬賣花促銷活動「芍藥季」的宣傳海報中,就已經用到了 MidJourney 制作不在花期的花卉圖片,如果不是特別標注,幾乎不會有人看出這是 AI 繪圖。
很多人猜測這張《王者榮耀》游戲插畫是 AI 繪圖,人工修改完成
而不久前手游《王者榮耀》里的一幅插畫也引起了不少玩家和畫師的猜測:因為諸多細節上的不合理之處,讓大家懷疑這是 AI 繪圖,人工略微修改的作品。
一位游戲大廠的市場營銷員工告訴愛范兒,類似的單幅海報插畫,給外包畫師的價格是 2-5 萬元,有特別要求的還會更貴。
當然,還有很多人,包括我自己,在進行 AI 工具測試的時候會發現,目前 AI 工具還不具備取代自己的能力,或者說沒法很好地融入到自己的工作流。但是對自己再自信的人心里也明白,今天它不行,不過總有一天它可以,這一天也不會太久。
在多數打工人的視角看來,ChatGPT 等等 AI 工具不會讓某種工作消失,但會讓崗位需求銳減,少數精英加 AI 的工作模式使得原本是行業平均水平左右的人面臨失業風險,而這些人又是行業的主流人群。
始作俑者 OPEN AI 自己也發布了報告,列舉了不少最容易被 ChatGPT 影響的職業,其中有不少曾經被認為是白領甚至是金領的職業面臨被取代的風險。
這個風險不在以后,就在現在。
前不久好萊塢編劇行業正在進行大罷工,除了抗議待遇過低,NetFlix 等雇傭方壓榨勞力之外,矛盾點還集中在 AI 創作上,這批編劇的集體訴求是「禁止使用 AI 撰寫文學材料;禁止將其作為原始材料;禁止使用作家們創作的材料訓練 AI?!?/p>
但是,代表雇傭方利益的 AMPTP(美國影視制片人聯盟)主席卻表示:
編劇能有一份短期工作已經是很幸運的事了。
言下之意大概是,以后或許連短期工作都找不到了。
這就是路人皆知的司馬昭之心,從雇傭方的角度來看,GPT-4 帶來的效率提升和人力成本降低,是巨大的機遇,這也是為什么這么多互聯網行業的老板熱衷于轉發各種 AI 進展到朋友圈的底層原因,他們堅信并且希望 AI 能夠降本增效。
正如經濟學家 Tyler Cowen 在《平均的終結》所表述的,哪個行業的就業人數更多,顛覆這個工種就會創造更大的商業價值。
被雇傭的打工人自然是另外的想法,降本增效,降本靠裁員,增效靠壓榨,橫豎逃不脫悲慘的命運。
以農業為例,愛范兒曾去巴音郭楞蒙古自治州尉犁縣看過現代農業機械如何讓幾個人就能管理數千畝的棉花田:一架農業無人機每小時可以噴灑農藥超過 150 畝的農田,相當于 60 個人的效率。一輛價值 500 多萬元的約翰迪爾 CP690 摘棉機的效率相當于 700 多個采棉工人。
可以說,過往數千年,尤其是近代農業和工業的發展,就是創造「體力盈余」,用機器代替人力的歷史。
如果重復的體力勞動可以被機器取代,那么重復的腦力勞動為什么不可以?
現在看來,智力的屏障,并不比體力的屏障牢固。
二、智力的載體
其實把 GPT-4 等 AI 稱為工具是有失妥當的,因為對于人類來說,工具無需智力,不需要什么人類定義的「主觀能動性」,遵循特定的邏輯,菜刀切菜,微信聊天,Photoshop 修圖等等,我們使用工具的每一個動作,都有一個明確預期。
這種預期的典型例子就是「圖形界面,GUI」,無論是 PC、Mac 還是智能手機,都依賴于圖形界面進行操控,我們觸碰微信圖標,手機絕對不會打開微博。我們在飛書上點擊會議錄音按鈕,它絕不會打開月報匯報頁面。這是因為程序是寫死的,A 到 B 的路徑是一定且透明的。
但是對于 GPT-4 而言,不光是我們沒法保證預期結果是明確的,更不知道我們發出的指令到 GPT-4 輸出結果之間發生了什么。
正如前面所說,在很多涉及到推理和理解環節,ChatGPT3.5 顯得很弱智,但是 GPT-4 則表現得像是個情智雙高的學霸。
2023 年上半年的科技新聞熱搜顯然是被 ChatGPT 霸榜的半年,其中有三個新聞熱度最高:GPT-4 發布,基于 GPT-4 能力的微軟 Office Copilot 發布,ChatGPT 發布 iOS 版應用。
蘋果的 Vision Pro 頭顯
然后,就是蘋果 Vision Pro 頭顯的發布。
之所以這款設備被如此看重,是人們在智能手機之后,孜孜不倦地尋找下一個計算平臺,一度人們寄希望于智能手表這樣的可穿戴設備,但事實證明它的定位是沒法干活也沒法娛樂,智能手表能在交互上做的革新乏善可陳。
數量眾多的傳感器和攝像頭,為全新交互提供了基礎
那么,蘋果 Vision Pro 頭顯在交互上做了什么呢?
我們操控電腦,需要鍵盤和鼠標;我們操控智能手機,需要觸摸屏幕,總有一個東西作為「介質」來連接設備和人,而在蘋果 Vision Pro 頭顯上,我們幾乎不需要這種「介質」了,手勢、眼球和嘴巴就成了主要的交互工具:
- 手勢:代表將要執行的動作
- 眼球:代表注意力的方向
- 嘴巴:代表繁重的內容輸入
鍵鼠之所以精確,是因為我們點擊 F 鍵,它不會被識別為 G 鍵,但觸控屏偶有誤觸的現象,針對誤觸,很多輸入法又推出了「智能糾錯」,在我們打出類似于「zjihui」的時候,智能糾正為「zhihui」,這就是設備開始有了自己的「判斷」。
對于蘋果 Vision Pro 頭顯而言,它幾乎無時無刻都在進行「判斷」:用戶這個手勢代表什么,眼球看向哪里,說的這句話是什么意思?
簡言之,它需要足夠「聰明」,才能執行這樣的交互。在一些游戲主機配件和智能手機,手勢操作,眼球追蹤,還有語音識別都不是新鮮事,但也都是錦上添花型的功能,圖個新鮮感,并不能作為主要的交互方式。
但沒有鍵鼠和觸屏的蘋果 Vision Pro 頭顯,把三者結合,既是丟了過去的包袱,也開啟了新的未來,交互的自由度和維度得到最大程度的解放,在腦機接口商用之前,人類新的人機交互方式講會以此為基礎:無需借助「介質」,人體器官就是交互的主體。
如果到這里,你還是覺得蘋果 Vision Pro 頭顯缺了點什么,毫無疑問就是一個類似于 ChatGPT 這樣的大語言模型以及相關應用。
2023 年最令人震撼的場景之一:Office Copilot 自動生成 PPT
再如果一下,要是微軟牢記使命不改初心,堅持做最好的蘋果生態開發者,把 Office Copilot 留到六月,在蘋果 Vision Pro 頭顯環節進行演示,絕對要比什么米老鼠之類的更炸裂。
哪個打工人不想在虛擬世界里對著 Office Copilot 說一句話就能生成個 PPT,然后給老板交差,自己接著看電影呢?
微軟把 Office Copilot 上難嗎?
一點都不難。
那么如果 Stable Diffusion 能在驍龍旗艦手機上跑,ChatGPT 能在 iOS 上跑,那帶著一顆 M2 芯片的蘋果 Vision Pro 頭顯加上它帶來的全新交互方式,意味著它可以是,也應當是一種「智力的載體」。
如果不能理解為什么類似于 ChatGPT 這樣的大模型是一種智力,蘋果 Vision Pro 頭顯是一種智力的載體,那么在鼓吹「元宇宙」時代一路沉淪的 Meta,在 AIGC 時代股價連連提升,其發布的諸多大模型都能和 VR 業務掛鉤,至少證明資本市場對其邏輯的認可,這也是佐證「智力和智力的載體」的例子。
所有 AR、VR 和 XR 從業者都期待著蘋果的「打樣」,3499 美元的售價則給其他相關產品留下了足夠的市場空間。
諸如 PICO 4 Pro 這樣輕便(597 克),性能不錯,視角和分辨率處于主流水平,搭載眼動和面部追蹤等新技術,有了初步生態,還帶點性價比(相比于 Vision Pro)的產品預計會成為不少人的「平替」,除了價格,蘋果 Vision Pro 的上市時間和初期產量也給大家留下了不小空間。
另一個傳感器越來越多,算力越來越強,語音交互地位越來越高的「電子產品」,是汽車。
也就是前不久,理想汽車創始人李想就說:
智能駕駛和智能空間都已經進入大模型時代,大模型的研發和訓練是智能電動車企業的必要能力,否則只會停留在電動車的時代。
這則是另一品類殊途同歸的例子。
用最炫酷的 Vision Pro,做最枯燥的工作
三、智力盈余
前不久去看廣東美術學院畢業展的時候,看到了一個廣東美術學院和騰訊合作的展區,主題是未來城市 WeCityX,在暢享未來辦公,居住,出行場景的時候,還未踏出校園的學生展現了他們充滿未來視角的展望:
- 一個畢業設計作品是 AR 眼鏡,滿足了隨時隨地辦公的需求;
- 另一個畢業設計作品是未來工位,搭配 AR 眼鏡,可以在工位上工作,鍛煉,休憩;
- 還有一個作品是未來出行,在無人駕駛汽車里安排了工位,不開車可以,但得工作。
更早之前,在采訪金山辦公高管的時候,我問「AI 是不是讓曾經是偽命題的移動辦公成真了?」,得到的答案是肯定的。
在手機處理表格是很多人的噩夢,在電腦上易如反掌的「把表格第三行和第八行互換位置」的操作在手機上會變得非常繁瑣,但是如果是擁有「智力」的 AI,我們只需要說出來,在任何設備上,PC、手機、平板乃至智能頭顯,其效率都是一樣的。
對于未來工作場景的設想,廣美畢業生們都預判到了一點:工作如風,常伴吾身。
為什么會變成這樣呢?
其實是我們離信息和智力這兩個處理工作的要素越來越近了。
皮尤研究中心不久前的針對美國成年人的一項調查研究結果表明,更年輕,更高學歷和更高收入的人,使用 ChatGPT 更多。
我們沒法準確預測,這群對 AI 持更開放態度的人,未來會因為 AI 變成什么樣,但是「強者愈強」的馬太效應確實無處不在的。
放寬到城市維度,城市核心地產的價格漲幅,往往大于郊區;城市經濟增長和能源消耗水平也往往大于人口增長;城市經濟增長的成果大部分被收入前 10% 的群體獲得,當然,這個群體也會被城市增長的快節奏所裹挾,回到前面說的:工作如風,常伴吾身。
如果皮尤研究中心的報告增加一個地理緯度的話,那幾乎可以肯定,位于加州灣區或者紐約的人,相比于五大湖地區鐵銹帶的人,更樂于使用 ChatGPT。
類似的認知領先在過往的例子比比皆是,如果在 2013 年左右成為第一批網約車司機,因為平臺競爭和補貼等優惠政策,月入兩三萬很簡單。現在的情況是,長沙三亞等多地交管部門發布預警,稱當地網約車司機數量趨于飽和,不宜作為職業選擇。
因為 ChatGPT 等 AI 工具有非常明顯的「傻逼牛逼二象性」,這使得很多人對它們的認知并不清晰。
一家公司里面,最善于驅使他人智力的,一般是老板和主管,這種地位和分工,亦可能形成認知上的領先,比如每次當我對 AI 工具將信將疑,使用幾次發現不過爾爾的時候,我的老板就會用親身經歷和實踐以及結果告訴我:如果 AI 工具沒給到你要的東西,不是它不行,而是你問得不對或者不夠。
當我思考,為什么他總是可以從 AI 那里獲得他想要的結果時,得到的答案有兩點,一是他對 AI 的智力和知識有信心;二是他有豐富驅使其他智力的經驗。
對于大多數貢獻自己智力和體力的人來說,選擇、驅使和利用其他智力,是一個全新的命題。
在以 BAT 為代表的大型互聯網公司中,較為成功的員工可能是既聰明又勤奮的,最為成功的員工往往是再疊加一個「善于利用公司各種資源」的要素,這種資源往往就包括智力。
這種不平均自古有之,現代汽車功率大小所采用的單位「馬力」源自蒸汽動力設備的出現,蒸汽機改良者瓦特測定一匹馬一個小時可以轉動磨坊轉盤 144 圈,折算為一匹馬每秒能夠把 75 千克的水提高 1 米,即字面上的意思:一匹馬的力量。
顯然步行時候,人的力量是遠不如馬的,但古人達官貴人的馬車有三四匹馬牽引,還有時候,人是貢獻馬力的,比如給達官貴人抬轎的時候。
而現在最新的特斯拉 Model S Plaid 則能夠瞬間爆發出 1000 馬力的功率,這在古代是上千騎兵才有的力量,但現在一輛轎車就僅為 1-5 人服務而已。
美國學者和咨詢顧問克萊·舍基在《認知盈余:自由時間的力量》中認為,互聯網的產生和勃興,源自于人類的認知盈余和分享精神。因為對這本書觀點的認可,馬化騰還給這本書得中文版進行作序,他認為「認知盈余」概念是平臺型互聯網企業得以發展的時代紅利,Facebook、Twitter、維基百科和微博都是基于此。
實際上,UGC(用戶貢獻內容)和 PGC(專業用戶貢獻內容)的概念和「認知盈余」一脈相承,當這一波 AI 浪潮冠以 AIGC 之名的時候,實際上印證的是 AI 能夠貢獻的「智力盈余」幾乎是無限的。
每個人都有機會,擁有無限的「外部智力」。
對于這種新工具的認知差異,比自己步行和開特斯拉 Model S Plaid 的差異還要大得多,前者使用的不過是 0.1 馬力不到,而后者能用到 1000 馬力,前者的行進速度大概是 5KM/h,而后者可以達到 320KM/h。
在這一波 AI 浪潮中,受益最大的是英偉達,它的市值前不久一度超過了 1 萬億美元,成為首家市值超萬億的芯片公司,無論是 PC 浪潮中的英特爾,還是智能手機浪潮中的高通都未能達到這一成就。
前不久英偉達創始人&CEO 黃仁勛在臺大進行了演講,在結尾,他是這么說的:
無論是什么,像我們一樣全力以赴去追求它,跑吧!不要慢慢走。不論是為了食物而奔跑,或不被他人當做食物而奔跑。你往往無法知道自己正處在哪一種情況,但無論如何,都要保持奔跑。
六七年前,我在朋友圈看到一些 AI 領域創業者預言未來的人類借助外腦、外骨骼甚至機械植入和腦機接口,將會在智力和體力上產生巨大的差異,差異大到是物種和物種的差別。生物學上原教旨主義上的人類,或許迎來了終結。
近一期的《時代》封面
當時覺得不過是科幻場景,現在看來,ChatGPT 和智能頭顯的結合,已經趨近于外腦的雛形了。
沒有發令槍,但競速早已經開始,現在的情況是跑在最前面的人開始對擁擠在起跑線上的人開始大喊:快跑啊,不跑會被吃掉!
與我們在大學演講慣常見到的「有人年少成名,有人大器晚成,不必急躁,做你自己」之類的雞湯不同,黃仁勛的勉勵近乎于「社會達爾文主義」的弱肉強食觀點了。
至于為什么這么說,因為他認為,反應敏捷的企業將利用 AI 技術提升競爭力,而未能善用 AI 的企業將面臨衰退。AI 將改變每一種工作,一些工作將會被淘汰,每個組織每個人都需要學習利用 AI 的優勢。這就是為什么這么多 AI 從業者在高喊「平均已經終結」,人和人,組織和組織,會因為 AI 變得更不平均。
還是以汽車為例子,汽車不光是一種「體力盈余」的象征,擁有 1000 匹馬的力量,也會因為算力(英偉達 Thor 自動駕駛芯片擁有 2000 TFLOPS 算力)、傳感器(激光雷達、攝像頭和毫米波雷達的組合,遠超人眼的感知能力)和算法以及大模型也能產生「智力盈余」,有智能駕駛和沒智能駕駛的汽車,已經是兩類產品。
手握方向盤的駕駛行為必將成為歷史,就像我現在一個字一個字敲擊鍵盤打出這篇文章的行為一樣。
如果你認為人可以被分為「走路的人,自己開車的人,用自動駕駛到終點的人」,那么,人和「AI 智力」的關系,也將成為區分人群的關鍵。
ChatGPT 和蘋果 Vision Pro 頭顯已經開啟了「智力盈余」的時代,你可以不必擁有 Vision Pro,但必須擁有 Vision。
作者:劉學文
來源公眾號:愛范兒(ID:ifanr);連接熱愛,創造不同。
本文由人人都是產品經理合作媒體 @愛范兒 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!