AI產品觀察:現在做播客都可以不用說話了?—NotebookLM

0 評論 1393 瀏覽 1 收藏 6 分鐘

去年5月,Google推出了一款基于AI的筆記管理工具NotebookLM。作為一款有大模型支持的筆記應用,其具體表現如何?這篇文章,我們來看看作者的分析。

一句話概述:NotebookLM是谷歌推出的一款基于AI的筆記管理工具,旨在幫助用戶高效地組織和提取信息,通過與用戶上傳的文檔結合,生成實用的內容和見解。

一、基本信息

前身為谷歌的Project Tailwind產品,該項目由谷歌實驗室的小團隊開發,在2023年 5 月的 I/O 2023 上進行了產品先導,谷歌推出其 “AI-first notebook”,新名稱為:NotebookLM,該產品由此應運而生。

Project Tailwind舊圖標

Logo

NotebookLM的Logo采用簡潔的圖形+字母的設計,以黑白色彩為主,體現了其作為谷歌產品的身份,同時傳達出現代和高效的感覺。

Slogan

Do your best note-taking

平平無奇談不上有什么特別大的內涵輸出。

二、功能拆解

  • 語音轉播客:根據上傳的文本進行語音轉化,根據文本內容生成兩人對話式的英語語音對話錄音
  • 文檔上傳與管理: 用戶可以上傳各種格式的文檔(如Google drive文件、PDF等),并創建筆記本以組織信息。
  • 信息摘要與提問: AI能夠根據上傳的文檔自動生成摘要,并允許用戶提出問題以獲取更深入的信息,可以進行時間軸整理、目錄整理、指南、簡報等筆記創作。
  • 實時協作: 支持多用戶實時編輯同一筆記本,方便團隊合作。
  • 引用與來源管理: 根據上傳的文件對提問的答案生成自動生成引用,確保用戶可以追溯到原始信息來源。類似于內部文件的RAG

三、核心技術

NotebookLM基于谷歌最新的大型語言模型(LLM)Gemini 1.5 Pro,采用源基礎模型(source-grounded model)技術,使得AI生成的信息更貼近用戶提供的文檔內容,從而減少錯誤和“幻覺”的發生。

四、盈利模式

NotebookLM體驗版目前為免費服務

揣測其未來可能會探索以下盈利模式:

  • 增值服務: 提供高級功能或云存儲空間擴容,吸引用戶升級到付費版本。
  • 企業版: 針對企業用戶推出定制化解決方案,收取訂閱費用。
  • 特定功能付費: 提供例如轉音頻以及未來可能迭代的高階功能進行token計費制服務。

五、不足與迭代

  1. 當前上傳文件的格式僅限于pdf、txt、Google drive文件、markdown格式。word、ppt、excel乃至epub(量子速讀)格式都無法進行上傳
  2. 源數量限制50個,如果針對企業級文檔量級如此數量不足,可能限制復雜項目的處理能力。
  3. 轉語音的功能目前只支持英文和官方音色,無法支持對話人數設置、音色自訓練、多語言溝通或者穿插交流的定制
  4. 由于端到端的特性限制,在音頻對話時的節奏感和幽默感效果不可控

六、戰略方向

語音功能重點開發:

未來可以將語音功能單列成為特殊功能板塊進行迭代,不僅限于當前的簡單tts轉化。開發訓練獨立音色、音頻提取、音頻剪輯等功能。

工作流功能:

針對會議語音處理、學習資料復習、報表研究等特定工作流場景可以進行工作流功能板塊引導,提示用戶使用PMF,保證產品直擊癢點和痛點。

硬件融合:

除了谷歌自己的pixel手機以外,該產品可以成為安卓的原生功能,亦或者谷歌與其他安卓廠商合作,將功能內嵌至硬件設備系統中。

本文由 @笑笑生觀察日記 原創發布于人人都是產品經理。未經作者許可,禁止轉載

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!