ChatGPT界面大更新,開始卷應用了?這次想滅誰?

0 評論 312 瀏覽 1 收藏 11 分鐘

OpenAI在獲得巨額融資后,緊接著推出了ChatGPT的全新界面更新——"canvas(畫布)"。這項更新標志著ChatGPT在交互設計上的重大轉變,從傳統(tǒng)的聊天模式,邁向了更深層次的協(xié)作空間。

就在OpenAI宣布獲得史上最大規(guī)模66億美元融資的第二天,又推出了自ChatGPT問世兩年來的首次重大界面更新“canvas(畫布)”。

canvas是一個全新設計的交互界面,專為寫作和編程任務設計。不再局限于傳統(tǒng)的聊天模式,而是通過在標準對話框旁開啟的獨立窗口,提供一個用戶與ChatGPT的深度協(xié)作空間,共同創(chuàng)建和優(yōu)化項目。

它基于特別訓練的GPT-4o構建,用戶可以直接在這里編輯文本或代碼。選定任何需要修改的部分,ChatGPT就會基于上下文環(huán)境給出精準的優(yōu)化建議。系統(tǒng)還提供了包含調整文本長度、更改閱讀水平、代碼審查修復、添加等在內(nèi)的快捷菜單。此外,通過 “返回”按鈕,用戶可以輕松恢復之前的工作版本。

打開canvas很簡單:在模型選擇器中選擇“GPT-4o with canvas”,只需輸入“使用canvas…”或“啟動canvas…”之類的提示,新窗口就會彈出。當ChatGPT檢測到可能有幫助的場景時,無需用戶調用,canvas也會自動打開。

具體來看看它的各項功能。

01 canvas輔助寫作

canvas可以根據(jù)指令為你生成一個項目初稿,供你與AI一起編輯,也可以對現(xiàn)有草稿進行優(yōu)化。適合長文章、報告、策劃案或電子郵件等內(nèi)容撰寫。

內(nèi)置5項實用的寫作快捷功能:

  1. 建議編輯:由ChatGPT提供行內(nèi)建議和反饋。
  2. 調整長度:將文檔長度擴充或精簡。
  3. 更改閱讀水平:調整閱讀水平,范圍涵蓋從幼兒園、中學、大學到研究生。
  4. 最終潤色:全面檢查語法、清晰度和一致性。
  5. 添加emoji:添加相關表情符號以增強趣味色彩。

例如以下視頻中,用戶先上傳筆記至canvas生成博客內(nèi)容,再為第一段添加舉例讓表述更豐富和潤色題目,最后調至“大學閱讀水平”。不到一分鐘,粗略零散的筆記就變成了一篇完整的結構化博客文章。

硅星人也淺試了一下,在canvas里讓GPT寫一篇介紹OpenAI本周新聞的文章,然后翻譯為中文。可以看到中文稿直接覆蓋原英文生成,而不是以問答形式另起對話。

進一步用“建議編輯”補充內(nèi)容后,分別生成“Graduate School”和“Kindergarten”版本來對比看看差異。

除了AI智能改進之外,還能直接在原文調整字體加粗、斜體、字號等格式。

簡單來說,canvas拓展了一種與ChatGPT的全新交互方式。集成多種工具,讓用戶在聊天和文檔編輯之間無縫轉換,輕松將對話中的想法變?yōu)槌墒斓淖罱K版本。在一個平臺完成全套寫作過程,有效避免了工作流的中斷。

02 用canvas編程

與寫作類似,編程也是一個需要反復迭代的過程,且對邏輯的嚴密性有更高的要求。

為了幫助開發(fā)者更高效完成代碼編寫和調試,canvas 也配備了一些相關的便捷功能,包括:

  • 代碼審查:ChatGPT提供編建議,供用戶批準或拒絕,幫助優(yōu)化代碼質量。
  • 添加logs:插入print日志輸出,幫助開發(fā)者跟蹤程序運行情況,方便調試。
  • 添加comments:為代碼添加注釋,便于理解代碼。
  • 修復錯誤:自動檢測并修復代碼中的問題,減少調試時間。
  • 代碼移植:將現(xiàn)有代碼轉換為不同編程語言,如JavaScript、Python、Java等,便于跨語言開發(fā)。

下面的demo展示了在canvas界面生成Rust語言的API Web服務器,并進行代碼優(yōu)化和全局審查的過程。

1. 使用o1-preview輸出的合成數(shù)據(jù)特別訓練

OpenAI對canvas集成的GPT-4o進行了專門訓練,使其能夠在創(chuàng)作過程中擔任更積極的協(xié)作者角色,并且具備更好的上下文感知能力。

為此,研究團隊開發(fā)了“在寫作和編程任務中自動觸發(fā)畫布、生成多樣化內(nèi)容類型、執(zhí)行有針對性的編輯、重寫文檔、提供內(nèi)嵌批注與建議”等核心功能。

訓練方法上,應用了他們一直強調的合成數(shù)據(jù)生成技術,從o1-preview模型中提取輸出,幫助GPT-4o針對目標功能進行后期訓練。這一方法使ChatGPT能夠快速提升寫作質量,并適應新的用戶交互模式,無需依賴人工生成的數(shù)據(jù)。

(如果擔心自己上傳的內(nèi)容被OpenAI用于模型訓練,記得到用戶設置里關閉“數(shù)據(jù)共享”選項。)

2. canvas集成模型評估

為了評估模型表現(xiàn),OpenAI進行了超過20項內(nèi)部自動化測試。

其中一個關鍵挑戰(zhàn)是定義何時觸發(fā)canvas功能。研究團隊教會模型在處理復雜寫作任務時正確觸發(fā)畫布,比如“撰寫博客文章”,而避免在類似“幫我做一道晚餐食譜”這樣的簡單問答中過度觸發(fā)。經(jīng)過優(yōu)化后,GPT-4o在寫作任務中的正確觸發(fā)率達到83%,編程任務的正確率更高,達到了94%。

第二個挑戰(zhàn)是模型在canvas被觸發(fā)后的編輯行為。比如在用戶明確選擇特定文本時進行有針對性的編輯(targeted edit),其他情況下則傾向于重寫(rewriting)。結果顯示,特別訓練后的GPT-4o在針對性編輯上的準確率比基線模型提高了18%。

此外,團隊還通過人工評估驗證了模型生成高質量評論的能力。相比零樣本提示的GPT-4o,canvas集成的模型在評論準確性上提升30%,在評論質量上提升16%。

03 OpenAI開始卷應用

可用性方面,canvas測試版已對Plus和Team用戶開放,下周起擴展至教育及企業(yè)用戶,最終會讓所有用戶都能免費訪問。

OpenAI表示,canvas目前仍處于早期階段,但他們計劃迅速提升其功能。對于那些需要頻繁編輯和修改的復雜任務,讓canvas成為傳統(tǒng)聊天界面的有力補充,實現(xiàn)“更自然”的人機協(xié)作愿景。

Canvas并不算OpenAI掀起的全新交互模式,也離最理想的AI與人類交互形態(tài)還很遠。而且,在canvas身上,用戶能看到很多OpenAI對手已經(jīng)做出來的產(chǎn)品形態(tài)的影子。它就像Anthropic的Artifacts工具及AI代碼編輯器Cursor等明星應用產(chǎn)品功能的大雜燴,然后在這些基礎上做了一些細節(jié)的升級。

很明顯,卷應用是OpenAI新的發(fā)力方向。此前OpenAI其實在應用的交互體驗和細節(jié)設計上都有些遲緩,這家公司在GPT模型依然能保持領先的階段,并沒有體現(xiàn)出對產(chǎn)品的重視?,F(xiàn)在模型能力的格局已經(jīng)完全不同,不僅差距縮小,而且當前多家大模型和消費級AI提供商都將可編輯工作空間作為生成式AI的最新突破點。

除了上面提到的幾款應用,此前谷歌不僅將Gemini集成到Docs,它的NotebookLM近期創(chuàng)新的AI播客功能也大受好評,現(xiàn)在OpenAI也加入了進來。

隨著大量資金仍在流向硅谷的AI公司,消費者在未來一年內(nèi)可以期待更多基于現(xiàn)有工具的結構性實驗新品推出。只不過這個過程里,OpenAI變得更像一個追隨者,而非引領者了。

作者|Jessica 郵箱|JessicaZhang@pingwest.com

本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】,微信公眾號:【硅星人Pro】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!