NotebookLM 是 Google 的 ChatGPT 時刻嗎?

0 評論 338 瀏覽 0 收藏 31 分鐘

Google 最近推出的 NotebookLM 在 AI 領(lǐng)域引起了廣泛的關(guān)注和討論。這款實(shí)驗(yàn)性的 AI 工具,允許用戶上傳文件并通過對話方式與文檔互動,其音頻總結(jié)功能更是將信息獲取方式提升到了新的層次。本文深入探討了 NotebookLM 的技術(shù)原理、設(shè)計理念以及未來的發(fā)展方向,同時討論了它是否標(biāo)志著 Google 的“ChatGPT 時刻”。

并不擅長 to C 產(chǎn)品的 Google 推出的 NotebookLM 在近期刷了屏,Andrej Karpathy 稱 NotebookLM 讓他想起了 “ChatGPT 時刻”,Sam Altman 也公開表示,“NotebookLM 很酷”。

NotebookLM 的前身是 Project Tailwind,最初是 Google 推出的一款實(shí)驗(yàn)性的 AI 工具。它允許用戶上傳多種格式的文件,隨后用戶可以用對話的方式和這些文檔進(jìn)行交互,而近期推出音頻總結(jié)更是能將 AI 對文檔總結(jié)生成播客,讓用戶用“聽內(nèi)容”的方式獲取信息,最終引起了產(chǎn)品的病毒式傳播。從一個“20% 項(xiàng)目”快速增長到擁有 6 萬 Discord 社群成員的現(xiàn)象級產(chǎn)品。?????

本篇內(nèi)容是紅杉美國的 Pat Grady 和 Sonya Huang 對 NotebookLM 的核心開發(fā)團(tuán)隊成員的訪談。其中,Raiza Martin 是 NotebookLM 的產(chǎn)品負(fù)責(zé)人,而 Jason Spielman 是技術(shù)負(fù)責(zé)人。

團(tuán)隊成員除了討論 NotebookLM 的誕生背景、關(guān)鍵技術(shù)原理外,也分享了他們觀察到的 NotebookLM 的 一系列 use case。關(guān)于如何打造一款 AI- native 產(chǎn)品,NotebookLM 團(tuán)隊也有著有趣的理解:

1)上下文是 LLM 交互的一個重要特點(diǎn),只有基于上下文才能創(chuàng)造粘性極高的用戶體驗(yàn);

2)今天 AI 應(yīng)用的開發(fā)處于“擬物化”的階段,和 iOS 早期一樣,這是因?yàn)檫€有大量用戶才剛開始接觸到 AI,開發(fā)者需要通過用戶熟悉交互或者場景來讓他們習(xí)慣和 AI 互動;?

3)Claude Artifacts 的動態(tài) UI 也許是 AI 交互的未來形態(tài)之一。

         ?? 目錄 ??        

   01 NotebookLM 是 Google 的  

        ChatGPT 時刻嗎

   02 NotebookLM 的用例

   03 如何設(shè)計出好的 AI-native 產(chǎn)品

   04 NotebookLM 的未來

一、NotebookLM 是 Google 的 ChatGPT 時刻嗎?

Sonya Huang:  雖然 NotebookLM 只是一個實(shí)驗(yàn)性的嘗試,但它很快就形成了病毒式傳播。所以大家都把 NotebookLM 看作是 Google 的 ChatGPT 時刻,你們怎么看這個觀點(diǎn)?

Raiza Martin: 對我來說,把 NotebookLM 比成 ChatGPT 時刻可能太大了,但我也看到很多人通過項(xiàng)目感受到原來 AI 是這樣的、也體會到了 AI 的能力,從這個層面上,NotebookLM 和 ChatGPT 帶來的影響可能是類似的。

Jason Spielman: 我在第一次聽 Audio Overview 的時候,隨著第二個主持人聲音的出現(xiàn)、音頻總結(jié)變成了一個播客的時候真的是一種令人震驚的體驗(yàn)。但我認(rèn)為,更本質(zhì)上,Gemini 1.5 Pro 很好地處理這些復(fù)雜文本,并以相當(dāng)簡潔的方式呈現(xiàn)出來,這一點(diǎn)也很重要。所以對我來說,語言模型和聲音的結(jié)合確實(shí)是一個很重要的時刻。

Sonya Huang:你們自己會怎么定義 NotebookLM?

Raiza Martin:Notebook 是一個 AI 驅(qū)動的研究和寫作工具,今天很多人可能會把它用來將某個內(nèi)容生成語音總結(jié)或者 Podcast。

Sonya Huang: 作為一個 Killer App,Notebook 是怎么誕生的?是偶然還是刻意設(shè)計的結(jié)果?

Raiza Martin: 我們一直在研究多模態(tài)的生成和輸出,我認(rèn)為聲音是下一個重要方向,在這個基礎(chǔ)上我們選擇了對話的形式。Notebook 發(fā)布之前我們并不知道它會成為一個所謂的 Killer app,我們只是覺得它的體驗(yàn)會讓人感到很新奇,但從結(jié)果來看人們和這個產(chǎn)品的交互體驗(yàn)比我們想象中更驚人。

去年我們一直在做 AI Test Kitchen 這個項(xiàng)目,Notebook 最初可能只是一個完成度只有 20% 的項(xiàng)目。當(dāng)時我們團(tuán)隊中有一位工程師在開發(fā)一個叫做“talk to small corpus”,我一開始并不理解這個項(xiàng)目,但后來我和他交流時,他解釋說,這個項(xiàng)目的核心思想是利用 LLM 和自己的數(shù)據(jù)對話,從而從中提取有用信息。當(dāng)時我就覺得這個想法很有趣。

AI Test Kitchen 是 Google 在 2022 年推出的一個實(shí)驗(yàn)性平臺,最初在 Google 的 I/O 開發(fā)者大會上亮相,目的是共同負(fù)責(zé)任地學(xué)習(xí)、改進(jìn)和創(chuàng)新 AI。AI Test Kitchen 提供了多種交互式實(shí)驗(yàn),讓用戶能夠體驗(yàn)到最新的 AI 技術(shù),例如使用 LaMDA 對話模型,用 MusicFX 生成音樂,或者通過 ImageFX 將文字轉(zhuǎn)化為圖像等等,平臺也允許用戶提交反饋。

也由此我會繼續(xù)想這項(xiàng)技術(shù)具體能有哪些應(yīng)用場景。作為一名成人學(xué)習(xí)者,我突然意識到,如果我能利用 LLM 與教科書進(jìn)行對話,那將會是一件很有意義的事情。我能想象到這項(xiàng)技術(shù)不僅可能改變我的生活,還可能改變許多人的生活。

從那時起,我們就開始著手考慮如何打造這項(xiàng)技術(shù)的第一個版本,并將其介紹給大眾。去年 5 月,我們推出了 Project Tailwind,這個項(xiàng)目就是這個想法的具體實(shí)現(xiàn)。用戶可以上傳一個 PDF 文件作為信息源,然后與之進(jìn)行對話交流。

Jason Spielman: 我認(rèn)為 NotebookLM 最獨(dú)特的地方在于它是基于源文檔的(source-grounded)。在開始做這個項(xiàng)目時,我都沒意識到我們?nèi)粘?chuàng)造的每樣?xùn)|西,往往都是基于某些已有的資料或文檔。所以目前來說,我會把它稱為一個基于源文檔的工具。但實(shí)際上,它正在發(fā)展成為一個用于創(chuàng)作和其他多種用途的源文檔工具。

Sonya Huang:  Notebook 的播客和音頻總結(jié)的體驗(yàn)確實(shí)很神奇,背后的技術(shù)原理是什么?比如,為什么它聽起來如此逼真的?生成的對話是怎么做到能吸引聽眾的?

Raiza Martin: 首先,這絕對是團(tuán)隊協(xié)作的成果。其次,能實(shí)現(xiàn)這些體驗(yàn)的核心還是得益于 Google 強(qiáng)大的模型能力。最關(guān)鍵的是 Gemini 1.5 模型,它能夠處理用戶輸入到 NotebookLM 的所有數(shù)據(jù),并在此基礎(chǔ)上生成全新的內(nèi)容。NotebookLM 的音頻功能也是基于 Google 的語音模型實(shí)現(xiàn)的。這些不同模型的結(jié)合最終造就了 Notebook 的獨(dú)特體驗(yàn)。當(dāng)然,除了模型本身的能力外,我們團(tuán)隊在如何有效利用這些模型方面也下了不少功夫。

在 Gemini 1.5 和音頻模型之間還有一個很關(guān)鍵的組件是一個叫做 Content Studio 的工具。Content Studio 在用戶提供的內(nèi)容源到最終生成的播客的過程中扮演了內(nèi)容編輯的角色?;?Content Studio ,Notebook 在生成內(nèi)容的過程中擁有了某種程度上的“創(chuàng)作空間”。

Sonya Huang: 你們是否考慮在未來把 Studio 這個功能開放給用戶?比如讓用戶可以自己調(diào)整內(nèi)容,讓內(nèi)容更有趣一些,或者更正式一些?

Raiza Martin: 現(xiàn)在使用 Notebook 的用戶很多,對于我們來說下一步就是讓用戶有更多可控性,讓他們可以自己來調(diào)整生產(chǎn)的內(nèi)容。其實(shí)一開始我聽到這些需求我會直覺性地反應(yīng)說:“好,那就把這些調(diào)節(jié)選項(xiàng)加上吧”。但我現(xiàn)在在嘗試更加謹(jǐn)慎地思考這個問題。大家喜歡上這個功能是因?yàn)樗屓烁械襟@喜。那么,我們怎樣才能在保持這種驚喜和魔力的同時,還能給用戶一些可控性?

Jason Spielman: 我認(rèn)為 NoteLM 音頻總結(jié)功能爆發(fā)式增長的部分原因就在于它是一個簡單的一鍵式體驗(yàn)。我之前在電話里向我奶奶解釋如何使用這個功能,結(jié)果發(fā)現(xiàn)根本不需要解釋。我只要告訴她“把資料導(dǎo)入進(jìn)去”,她就回答“我看到了,然后點(diǎn)這個按鈕就能生成是吧”?我覺得正是這種創(chuàng)建的簡易性真正催化了 Notebook 的爆發(fā)式增長。所以,在考慮增加一些可控性的選項(xiàng)時,我們會很謹(jǐn)慎地去做這件事,保持這種產(chǎn)品簡單易用的特性。

Pat Grady:  今天幾乎所有 AI 產(chǎn)品都還在圍繞對話框來展開,你們是怎么想到讓用戶“聽內(nèi)容”這件事的?為什么人們會想要通過聽播客的形式來了解某些信息?

Raiza Martin: 這件事來自 Jason 之前提到的一點(diǎn),那就是:我們要怎么以一種人們易于理解也易于接受的方式來呈現(xiàn)新的事物,讓他們愿意去嘗試?當(dāng)我們想到可以讓用戶上傳素材,然后生成新的語音內(nèi)容時,我們就在想,到底能生成哪些語音內(nèi)容呢?Google 的這個語音模型非常強(qiáng)大,既可以生成獨(dú)白,也可以生成對話,還可以讓用戶來選擇生成什么格式的內(nèi)容。但真正能引起人們共鳴的點(diǎn)在于,播客是一種對話形式,它能做的不只是把文本轉(zhuǎn)成語音,讓我們?nèi)ヂ犂首x的文本。我認(rèn)為,一旦我們看到這種形式實(shí)際的應(yīng)用,就會知道這就是我們要去做的事情。

二、NotebookLM 的用例

Sonya Huang:你們提到人們最初是沖著播客功能來的,然后因?yàn)槠渌δ芰粝聛?。能分享一下音頻之外的好的 use case 嗎?

Raiza Martin: 我在前面提到過 NotebookLM 在教育場景的 use case,我看到很多學(xué)生和教育工作者在使用 NotebookLM,我覺得這件事對我個人來說很有意義。但令人驚訝的是,我發(fā)現(xiàn)有很多人在工作中也會使用 NotebookLM。

一個很好的例子是我們在 Google 內(nèi)部試用 NotebookLM 時看到的一個 use case。Google 廣告團(tuán)隊中有很多廣告銷售人員和廣告專家,這些廣告銷售人員的銷售培訓(xùn)和文檔往往有幾百頁那么長,并且這些內(nèi)容還會經(jīng)常變化。要熟悉這些內(nèi)容到能夠銷售的程度是很困難的。所以銷售團(tuán)隊內(nèi)部通常的做法是,或者說在有 NotebookLM 之前的做法是,互相詢問。一個典型場景是,他們會提出類似這樣的問題:“Joe,這個產(chǎn)品到底是怎么運(yùn)作的?我該怎么向客戶推薦?”等 Joe 回復(fù)后,他們再把回復(fù)復(fù)制粘貼到郵件里,稍作修改就發(fā)出去了。

但實(shí)際上,像 Joe 這樣閱讀了所有文檔、掌握了大量知識的人,他們會通過 NotebookLM 創(chuàng)建一個文檔,然后分享給其他銷售人員,這樣就有上百人自動開始使用這個 Notebook,也因此他們不用再去咨詢 Joe 了。我覺得這件事很有趣,因?yàn)檫@是一個非常簡單的應(yīng)用場景,但在此基礎(chǔ)上還可以開發(fā)出更多用途。

Jason Spielman: 我最近和一個做銷售的朋友聊天,他也提到自己做了一個 Notebook,在和客戶交流中遇到某些問題不清楚答案的時候,就會和這個 Notebook 對話,然后得到對應(yīng)的答案。我認(rèn)為這種知識分發(fā)的方式對于大規(guī)模的銷售團(tuán)隊或數(shù)據(jù)中心來說非常有幫助。

另一個我覺得很有意思的 use case 是,很多在 VC 行業(yè)工作的人在日常工作中要看很多公司信息和對應(yīng)的文件,我有位 VC 朋友說,他現(xiàn)在會把收到的文檔或 deck 放進(jìn) Notebook 里面,從而更加快速地處理這些信息,工作效率差不多提高了 10 倍。

三、如何設(shè)計出好的 AI-native 產(chǎn)品?

Sonya Huang: 你們在產(chǎn)品設(shè)計上做了哪些取舍來讓 Notebook 好用且便捷?

Jason Spielman: 我想先說明的是,我們到現(xiàn)在還是在持續(xù)不斷地做這些產(chǎn)品層面的決策,我覺得我們現(xiàn)在的重點(diǎn)在于快速推出產(chǎn)品,然后通過和用戶密切互動來理解什么是最好的、他們想要什么。今天模型能力迭代得很快,很難說基于模型能力再來決定做具體什么事情。

但具體來講的話我認(rèn)為我們有一個決策是做對了,就是讓左側(cè)的 Source 欄很突出。我認(rèn)為我們是一個基于源文檔的項(xiàng)目,我們需要明確表示你是在與你上傳的源文檔對話。所以我認(rèn)為左側(cè)的 Source 欄是這個產(chǎn)品的一個關(guān)鍵部分。另外一點(diǎn)就是正如我之前提到的,一鍵生成音頻總結(jié)對于產(chǎn)品傳播來說也很有效,我們在產(chǎn)品設(shè)計上整體傾向于這種簡單的體驗(yàn)。

Raiza Martin: 我想補(bǔ)充一點(diǎn)我們在產(chǎn)品層面上的考慮,特別是在產(chǎn)品優(yōu)先級上,我們一直在思考的問題是如何讓一個新事物變得很直觀。要做到這一點(diǎn)非常困難,特別是像“首先用戶必須上傳一個源文檔”這種細(xì)節(jié),用戶通常會對這一步產(chǎn)生抵觸,他們可能第一反應(yīng)會問“為什么?”,因?yàn)樵谑褂?ChatGPT 或 Gemini 的時候第一步并不需要上傳任何文檔,直接就能用。所以我認(rèn)為在“上手即用”這個方向上,我們還有很多工作要做。

Sonya Huang: 你認(rèn)為在讓人們適應(yīng)這種新的 AI 原生體驗(yàn)時,還面臨哪些最大的挑戰(zhàn)?

Jason Spielman: 我覺得今天 AI 產(chǎn)品設(shè)計所處的階段可以總結(jié)為“擬物化(skeuomorphic)時代”。擬物化是指用虛擬對象來映射現(xiàn)實(shí)世界。在早期 iOS 中可以看到這個特點(diǎn),比如 Apple 的 Note 應(yīng)用頂部有皮革邊框,記事本頁面是黃色的,這是為了幫助用戶更容易從物理世界過渡到虛擬世界。我覺得今天我們在 AI 產(chǎn)品上的實(shí)踐也處于類似階段,我們首先要構(gòu)建一些 UI 來滿足用戶當(dāng)下的需求。但我也想強(qiáng)調(diào)的是,在不斷給用戶創(chuàng)造新奇體驗(yàn)的同時,也要意識到,對許多用戶來說,這是他們第一次與 AI 互動。

Sonya Huang: 我認(rèn)為 Midjourney 做得非常好的一點(diǎn)是,它很好地解決了用戶不擅長提 prompt 的問題。在你看來有沒有哪些 AI 應(yīng)用在解決這些 UI 挑戰(zhàn)也做得很好的?

Raiza Martin: 我最近用了 Pika,我很喜歡 Pika 的效果預(yù)覽功能,通過這個功能用戶可以很清楚地看到上傳圖片后會發(fā)生什么、得到什么。在看到這些效果預(yù)覽的時候我就覺得這些嘗試很有趣,所以我上傳了一張飲料的圖片,然后選擇了一個蛋糕效果,想把飲料變成蛋糕。等待飲料變成蛋糕的過程讓我興奮不已,我甚至當(dāng)時就在想是不是可以付費(fèi)了。所以我覺得這種效果預(yù)覽不僅可以激發(fā)用戶使用產(chǎn)品的意愿,甚至還可以驅(qū)動付費(fèi)。

Jason Spielman: 我覺得 Claude Artifacts 做得很不錯。我認(rèn)為他們在代碼生成方面做得非常出色。我覺得我們今天所處的階段是怎么平衡 AI 和人類之間的關(guān)系,我們想要創(chuàng)建一個 AI 產(chǎn)品絕對不想要取代一群人的工作,而是想提供更好的支持。我之所以認(rèn)為 Claude Artifacts 是一個完美的例子,就是因?yàn)槲覀冊诤?AI 交流的同時,它就已經(jīng)在開始按照我們的交流去構(gòu)建一些東西了。

Sonya Huang: 在你看來,NotebookLM 的產(chǎn)品思路和 Claude 相比是有哪些異同?

Jason Spielman: 首先,我們和 Claude 最根本的不同是我們還是圍繞一個特定文檔來展開交互的工具(source-grounded tool)。

Raiza Martin: 圍繞這一點(diǎn)來說的話,LLM 交互中圍繞上下文展開是一個很重要的特點(diǎn),我覺得也正是因?yàn)樯舷挛牡拇嬖诓拍軇?chuàng)造粘性極高的用戶體驗(yàn)。Anthropic、OpenAI 以及 Google 等所有參與 LLM 研究的人肯定都知道這一點(diǎn),但我認(rèn)為關(guān)鍵在于在什么時候引入這個特點(diǎn),以及基于什么樣的交互界面?

這也是我對于 NotebookLM 感到興奮的原因。因?yàn)槲覀儚囊婚_始就突出了上下文交互這一點(diǎn)。當(dāng)用戶意識到 source-grounded 的重要性時,就會發(fā)現(xiàn) NotebookLM 會是他們在尋找的工具。所以我們當(dāng)下也會更專注于這一點(diǎn),在其它 LLM 工具還在專注其它 use case 時,我們會在這個方向上先走得更遠(yuǎn)。

Sonya Huang: 你之前提到 Chat 是 AI 產(chǎn)品設(shè)計中的一種擬物化交互界面,NotebookLM 現(xiàn)階段在嘗試更前沿的方式,這種形態(tài)可能會是什么樣子?

Jason Spielman: 我個人對動態(tài) UI 很感興趣,Claude Artifacts 就是一個動態(tài) UI 例子。但總體上我覺得我們目前還處于一個探索階段,但考慮到用戶是不是也能很好理解 AI 產(chǎn)品的意圖,我們能做的事情是比較有限的。所以現(xiàn)在我們要平衡這種 AI 帶來的無限可能和面前的有限需求。

Raiza Martin: 我會更多地考慮傾向于新的模式。我自己做了很多原型設(shè)計,也實(shí)驗(yàn)了很多自己的行為。我最喜歡的一個嘗試是我可以邊走邊和我的 LLM 交談,或者說和一整個 AI 生態(tài)系統(tǒng)進(jìn)行交互。

我個人最近最喜歡的例子之一是,我開始通過這種方式來“寫”日記。不是我自己來寫,而是通過來回對話,讓 LLM 為我創(chuàng)建一個日志,然后基于這個日志來形成一個可視化的內(nèi)容,呈現(xiàn)的信息大致是,這周我不開心的天數(shù)比開心的天數(shù)多,哪些是讓我開心的事情,哪些是讓我不開心的事情。我認(rèn)為在交互中會產(chǎn)生更多豐富的內(nèi)容。

我們現(xiàn)在嘗試的這種基于一個特定源文檔的 AI 有一些非常實(shí)用的 use case,主要集中在工作和學(xué)習(xí)場景。但個人用例也非常吸引人,所以我在思考如何把我的這些個人產(chǎn)品實(shí)踐的經(jīng)驗(yàn)帶回到 NotebookLM 中,也許是在 Mobile App 里。

四、NotebookLM 的未來

Sonya Huang: 關(guān)于 NotebookLM 的增長有哪些可以分享的?

Raiza Martin: 我可以簡單分享一些情況。在推出音頻總結(jié)功能之前,NotebookLM 的增長一直比較平穩(wěn),但自從推出這項(xiàng)功能后,產(chǎn)品的增長速度就迅速加快了。所以音頻總結(jié)成了吸引用戶嘗試我們產(chǎn)品的一個非常好的切入點(diǎn)。另外值得一提的是,雖然用戶最初是被音頻總結(jié)吸引來的,但他們往往會因?yàn)槠渌δ芏^續(xù)使用我們的產(chǎn)品。這個現(xiàn)象很有意思,它讓我們看到用戶到底想從 Notebook 這樣的工具中獲得什么。

Pat Grady: 你們往前推進(jìn)這個項(xiàng)目的思路很像一家創(chuàng)業(yè)公司,團(tuán)隊足夠精簡、和用戶交互足夠多、產(chǎn)品快速迭代。這和大家印象中 Google 做事情的方式不太一樣。加入 Google 對你們做 NotebookLM 有什么幫助嗎?

Raiza Martin: Google 做得比較好、也比較特別的兩點(diǎn)是,首先,在模型完善之前,我們就能接觸到它們,提前了解計劃推出的功能,這能幫我們從不同的角度去思考該如何開發(fā)產(chǎn)品,從而可以更好地去規(guī)劃該怎么完善產(chǎn)品的整個開發(fā)流程。其次,我們團(tuán)隊里的人都非常聰明,很有才華,也很善于合作,而且都很希望能打造出好的產(chǎn)品。

所以,作為產(chǎn)品的開發(fā)者,能夠同時集齊這兩大要素,就很幸運(yùn)了,之后只需要去執(zhí)行交付就可以了。只要繼續(xù)做下去,就一定能做出有意思的產(chǎn)品。

我覺得,我們做的一件打破常規(guī)的事是,我們最在意的是先把產(chǎn)品做出來。因?yàn)槲抑霸?Google 工作過,我經(jīng)常會想這樣做會不會產(chǎn)生這樣那樣的影響什么的,要考慮的事情太多了,但其實(shí)一旦我們的目標(biāo)是推出產(chǎn)品,就必須不惜一切代價去實(shí)現(xiàn)它。

Jason Spielman: 現(xiàn)在很多人會誤以為 Google 做事情很慢。但是我在 Google 工作的 7 年里,我其實(shí)發(fā)現(xiàn)事情推進(jìn)得非常快。有些團(tuán)隊的規(guī)模很大,他們每天影響的用戶能有幾個億,所以會在決策上更加審慎。我們團(tuán)隊現(xiàn)在其實(shí)是處在一個最好的位置,既擁有大公司擁有的規(guī)模和數(shù)據(jù)優(yōu)勢,但也足夠精簡,我們團(tuán)隊大概有 10 人左右,所以我們的速度也會很快。

Sonya Huang: 你們對 NotebookLM 下一步的規(guī)劃是什么?

Raiza Martin: 說實(shí)話,就是繼續(xù)往下開發(fā) NotebookLM。我們希望用戶體驗(yàn)?zāi)芨?,能讓他們真的?NotebookLM 用起來,讓人們愿意留下來繼續(xù)用它。

Pat Grady: 你們覺得現(xiàn)階段 NotebookLM 還有哪些是沒做到的?

Raiza Martin: 如果我能回到過去,在發(fā)布之前多設(shè)計一些功能,我想要在產(chǎn)品層面實(shí)現(xiàn)更好的內(nèi)容分享。我在刷 X 的時候會常??吹接幸徊糠秩藶榱顺尸F(xiàn) NotebookLM 使用了一些視頻或可視化工具,而不是最原生的 NotebookLM 的界面,我就覺得自己錯過了這部分用戶,因?yàn)樗麄內(nèi)ビ昧藙e的平臺。所以,對我來說,NotebookLM 缺的是音頻總結(jié)的分享和協(xié)作功能。

Jason Spielman: 我比較期待能增加寫作功能。比如很多人都會做 Q&A 調(diào)查,然后基于 Q&A 收集到的答案來完成新的內(nèi)容創(chuàng)作,所以我很期待能讓 NotebookLM 參與到用戶創(chuàng)造內(nèi)容的整個過程里。

Sonya Huang: NotebookLM 生成的內(nèi)容質(zhì)量確實(shí)高,對我來說,甚至已經(jīng)可以取代人類做的播客了。但為什么你們會認(rèn)為現(xiàn)在 NotebookLM 做得還不夠好,還不能取代人類做的播客?

Raiza Martin: 在我們的觀察中,用戶想要做成播客的內(nèi)容,和很多人類做的播客內(nèi)容其實(shí)并不重合。比如說,我非常喜歡 Lenny’s Podcast,但我不會想要把他的播客做成一篇文章,再重新生成新的播客去聽,而是會直接聽他的播客,聽他對某個話題的看法是什么。

有些用戶會用 NotebookLM 給他們的簡歷或者 LinkedIn 的個人資料頁來制作音頻總結(jié),還有些初創(chuàng)公司的創(chuàng)始人會把他們公司登陸頁的內(nèi)容放到  NotebookLM 里,來看看他們的信息表達(dá)得是不是足夠清楚。這些做法都很有意思,因?yàn)橹皬膩頉]有人會給自己的簡歷做播客。

Jason Spielman: NotebookLM 的音頻交互其實(shí)和播客是不同的媒體形態(tài)。雖然 NotebookLM 生成的音頻聽起來是播客,但 Raiza 舉的這些例子也很好地說明了,人們會把它用在各種各樣的場景中。我覺得可以去想問什么今天社交媒體上有很多 reaction 視頻。人們現(xiàn)在來聽這期播客不僅僅是因?yàn)槲覀儯彩且驗(yàn)樗麄兿肼牭侥銈冏鳛橥顿Y人對這個領(lǐng)域的看法,所以當(dāng)我們在討論播客的時候,不同立場、背景的人之間的討論互動也是要考慮到的。

Raiza Martin: 關(guān)于這一點(diǎn)我想分享一個很有意思的點(diǎn)。雖然很多用戶都在分享他們生成的音頻總結(jié),但這個東西其實(shí)是很私人的。就像我做了個人簡歷的播客,但其實(shí)我并不是為了讓其他人來聽我的簡歷。還有人在 TikTok 上上傳了她從 2004 年開始寫的日記,像這種事情如果做成播客一起聽,肯定很有意思,但是對她來說,有意思的是她自己寫的日記可以被轉(zhuǎn)成音頻的過程,她可能也不會專門去聽同類型的播客。

我最喜歡的一個 use case 是,最近有人說,周末的時候他們的大學(xué)群里突然因?yàn)槟臣麓蠹伊牧撕芏鄡?nèi)容,不過他們并沒有選擇在當(dāng)時去讀這些消息,而是把它們?nèi)繌?fù)制粘貼到一個文檔中,放到周一早上開車上班的時候聽,我覺得這真的很棒,個性化生成就是這樣的。

Sonya Huang: 今天的 NotebookLM  除了有 Podcast 這個 Killer feature 之外,還提供了一個面向很多場景應(yīng)用的 horizontal 的交互的界面,你認(rèn)為接下來還會做什么?是繼續(xù)強(qiáng)化播客這個功能嗎?比如有沒有可能可以生成一段 YouTube 視頻?

Raiza Martin: 輸出視頻的話需要看成本什么時候能降下來。

對于我們來說,首先,我們現(xiàn)在想要實(shí)現(xiàn)的是,讓用戶能夠?qū)敫鞣N類型的內(nèi)容,然后用 AI 創(chuàng)造出新內(nèi)容。播客當(dāng)然是我們想要繼續(xù)探索的一種輸出形式,因?yàn)槲覀円呀?jīng)看到人們都很重視播客。

其次,我們也想往其他方面發(fā)展,做一些更實(shí)用的東西,因?yàn)槊總€人的偏好都不一樣,甚至就在兩三天前,還有人問我,“能輸出播客確實(shí)很好,但你能讓輸出的代碼質(zhì)量更高一點(diǎn)嗎”?這個方向也很好,但對我們來說都只是 roadmap,我們確實(shí)要想想怎么去探索輸出的形式。

編譯:牛佳晨
本文由人人都是產(chǎn)品經(jīng)理作者【海外獨(dú)角獸】,微信公眾號:【海外獨(dú)角獸】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!