亚洲影院天堂中文av色,国产小呦泬泬99,欧美性受喷水XXXX

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

AI創業者的慘痛教訓：押注模型準確性是產品陷阱，利用模型靈活性才是答案

烏鴉智能說

2025-01-31

0 評論 3674 瀏覽 1 收藏

16 分鐘

在AI創業領域，許多創業者曾將希望寄托于提升模型的準確性，試圖通過復雜的工程設計來彌補模型的不足。然而，隨著AI技術的飛速發展，這種策略逐漸暴露出其局限性。本文將探討為什么押注模型的靈活性，而非單純的準確性，才是AI產品成功的關鍵。通過分析不同類型的AI產品和應用場景，文章揭示了靈活性如何幫助創業者更好地適應模型的快速迭代，從而在競爭激烈的市場中脫穎而出。

隨著越來越多AI產品落地，很多投資人心中都有一個疑問：

到底什么樣的AI應用才值得投資？

關于這個問題，我們或許能在Andon Labs聯合創始人（YC 24W孵化）Lukas Petersson的一篇文章中找到答案。

最近，Lukas Petersson在YC Hacker News發布了一篇文章，內容是其在調研了100多個YC校友項目并復盤了Richard Sutton著名的文章《痛苦的教訓》后提出：

現在大量AI產品在當前模型的局限性上投入過多精力，但從長期看，創業公司更應該押注那些能夠充分利用大模型自主性與靈活性的機會。

這個文章一經發布就引發了廣泛的討論。今天，烏鴉君就為您編譯了這篇文章，以下是該文章的核心觀點：

1）從歷史角度來看，通用方法總能在人工智能領域勝出。

2）現在人工智能應用領域的創始人正在重蹈過去人工智能研究人員所犯的覆轍。

3）更出色的人工智能模型將催生通用型人工智能應用。與此同時，圍繞人工智能模型的軟件附加值將會減少。

01 通用方法總能勝出

2019年，理查德·薩頓（Richard Sutton）以如下文章作為其著名文章《痛苦的教訓》的開篇：

“從70年的人工智能研究中可以得到的最大教訓是，利用計算的通用方法最終是最有效的，而且優勢巨大”。

他提到，在人工智能的發展歷程中，研究人員曾屢次嘗試將人類領域的知識融入系統，進而推動AI技術進步。

但后來大家發現，一個擁有更強算力的系統，效果遠遠好于其他精心設計的解決方案。這種趨勢并沒有停止，未來仍將延續。

這個《痛苦的教訓》基于以下歷史觀察：

人工智能研究人員經常試圖將知識構建到他們的智能體中；
這在短期內總是有幫助的，并且讓研究人員個人感到滿足；
但從長遠來看，它會停滯不前，甚至阻礙進一步的進步；
而突破性的進展最終會通過一種基于擴展計算資源的相反方法實現。

本文著眼于應用層的人工智能產品，其中“更好”既指性能，也指市場接受度。更好的性能意味著處理更復雜的問題，從而釋放更多價值。

圖 1，不同類型的 AI 產品說明?

目前，人工智能產品通常是將人工智能模型封裝在某些配套軟件中。

你可以通過兩種方式提高其性能：

通過工程設計：通過單一領域知識輸入，在軟件上實現特定的功能
通過更好的模型：等待人工智能實驗室發布更強大的模型

對于創業者來說，這兩條路并不沖突。

但問題在于：隨著模型的改進，工程工作的價值會降低，甚至最后根本不用復雜的工程設計，模型就能解決大部分問題。

圖2說明了在應用層構建 AI 產品時工程投入的回報遞減。隨著工程投入的增加和更好的模型的發布，價值也會減少

上圖顯示了隨著模型的改進，工程工作的價值如何降低。

當前的模型存在很大的局限性，這意味著公司仍然可以從工程工作中獲得很多收益。

在YC校友演示日上，我看到很多產品都利用這點實現了成功。這些工程層面的成功大致可以分為兩類：

一類是產品已大規模投入生產（解決相對簡單的問題）——目前來看是少數；另一類則瞄準稍微復雜的問題。第二類公司表現良好，因為他們的概念驗證表明，通過足夠的工程努力，他們可以實現相應的目標。

但這些公司面臨的關鍵問題是：下一個模型發布是否會讓所有這些工程工作變得毫無意義，進而徹底摧毀它們的競爭優勢？

OpenAI的o1模型的發布就說明了這種風險。

我和很多AI應用的創始人聊過，他們都很擔心。因為他們在優化提升上投入了大量的資源，但隨著o1發布，提示工程的重要性逐漸下降。

從本質上講，這項工程努力旨在限制人工智能并減少其錯誤。通過觀察許多解決方案，我發現了兩種主要類型的限制：

特異性：指的是解決方案的專注程度。垂直解決方案的配套軟件是為解決特定問題而構建的。相比之下，通用型產品可以處理多種不同類型的問題。
自主性：衡量人工智能獨立運作的程度。按Anthropic的術語，我們將其分為Workflow（LLM和工具遵循預定義代碼路徑的系統）和Agent（LLM控制自身流程和工具的使用，自主決定如何完成任務的系統）。

這兩種類型構成了一個對人工智能產品進行分類的框架：

表 1：著名AI產品分類

請注意，ChatGPT可能遵循每條消息的預定義代碼路徑，使其成為工作流而不是代理

讓我們來探索一下如何針對同一項任務實施每個類別：業務分析師制作投資路演幻燈片。以下是每種方法的一種可能方法：

Vertical workflow：固定的步驟順序：首先，對公司數據庫進行RAG查詢，將其傳遞給小型LLM進行匯總，然后傳遞給更強大的LLM，提取關鍵數字并使用計算器工具。LLM在編寫幻燈片內容之前檢查這些數字是否有意義。最后，幻燈片生成器創建演示文稿。每次都按此順序運行。
Vertical agent：LLM循環運行，使用一次迭代的輸出作為下一次迭代的輸入。它可以訪問與工作流版本相同的工具，但自行決定何時使用它們。循環持續進行，直到代理確定結果符合其質量閾值。
Horizontal workflow：ChatGPT和類似工具可以協助完成部分任務，但無法端到端地完成任務。它們既缺乏完成全部工作所需的專業化，也缺乏自主性。
Horizontal agent：Claude 計算機使用可以訪問標準的辦公軟件。分析師用自然語言提供指令，代理像人類一樣操作計算機，根據需要調整其方法。

演示日上幾乎所有的產品都屬于垂直工作流程類別。這是有道理的——目前的模型對于其他方法來說不夠可靠。

即使是對于垂直Workflow而言過于復雜的問題，也被被迫采取這種模式。因為這是當前模型能力下接近可接受性能的唯一方法。

雖然工程可以改進這些解決方案，但它所能實現的效果有明顯的上限。對于當前模型無法解決的問題，更好的策略是等待一個更強大的模型。

正如利奧波德·阿申布倫納 (Leopold Aschenbrenner)在《情境意識》中所說，對于許多問題，工程工作將比等待更好的模型花費更長的時間：