AI+音樂|對話 Suno CEO:破圈的音樂生成產品是如何誕生的?
最近,Suno 隨著 V3 的發(fā)布迎來了破圈,那么這款音樂生成產品,是如何誕生的?這篇文章里,作者對 Suno 誕生的背景、Suno 的創(chuàng)作方式等方面做了解讀,我們不妨來看一下。
最近,音樂生成產品 Suno 隨著 V3 的發(fā)布迎來了破圈。這款產品的第一次發(fā)布是在去年 12 月 20 日,在第一時間體驗了產品之后我們看到音樂創(chuàng)作和消費有望隨著創(chuàng)作門檻的極大降低而成為消費級產品的內容形態(tài),于是我們發(fā)表了第一篇 Suno 的研究文章。
近日我們進一步整理了 Suno CEO:Mikey Shulman 的最新訪談和滾石雜志的報道,關于 Suno 誕生的背景、音樂創(chuàng)作的方式與消費的可能性。
Sense 思考:
我們嘗試基于文章內容,提出更多發(fā)散性的推演和深思,歡迎交流。
Suno AI通過結合人工智能技術與音樂創(chuàng)作,為用戶提供了一個全新的音樂創(chuàng)作平臺。這種技術的應用不僅降低了音樂制作的門檻,還為音樂愛好者和專業(yè)人士提供了新的創(chuàng)作工具,從而推動了音樂創(chuàng)作的民主化。
Suno AI 可以作為一個教育工具,幫助學習者理解音樂結構和創(chuàng)作過程。通過實踐操作,學習者可以更快地掌握音樂創(chuàng)作的技巧,這可能會改變傳統(tǒng)的音樂教育模式。
Suno AI 等工具的出現可能會改變音樂產業(yè)的運作方式。從音樂制作到分發(fā),AI 技術的應用可能會導致新的商業(yè)模式和服務的出現,從而影響音樂創(chuàng)作者、發(fā)行商和消費者的互動。
AI Native 產品分析——Suno
1.產品:Suno
2. 創(chuàng)立時間:2022 年
3. 創(chuàng)始團隊
Mikey Shulman:擔任首席執(zhí)行官,他曾擔任Kensho的機器學習主管,麻省理工學院斯隆管理學院的講師,哥倫比亞大學應用物理專業(yè)的學士學位和哈佛大學物理學專業(yè)的博士學位;
Camachoeorg Kucsko:Kensho Technologies的首席構架師,在哈佛大學畢業(yè)后加入Suno團隊。
4. 產品簡介:
Suno AI是一款由麻省理工團隊開發(fā)的強大人工智能音樂生成器。用戶可以通過簡單的文本提示進行創(chuàng)作,生成多種音樂風格的高質量音樂和語音。
5. 融資情況:
2023年:Suno.ai進行了種子輪融資,融資金額達到140萬美元;
一、創(chuàng)始人背景與音樂之路
Suno,一款開創(chuàng)性的AI音樂創(chuàng)作工具,在迅速增長的人工智能音樂生成器領域中脫穎而出。與主要關注器樂作品的傳統(tǒng)工具不同,Suno的獨特之處在于它能夠創(chuàng)作包含歌詞和人聲的完整歌曲。這一獨特技能讓Suno與Google的MusicFX以及Meta的AudioGen等競爭者顯著區(qū)別開來。
Suno由一支專門從事AI和機器學習的專家團隊創(chuàng)立,他們之前在Kensho Technologies工作過,Suno旨在使音樂創(chuàng)作民主化。包括擁有哈佛物理學博士學位的Mikey Shulman在內的創(chuàng)始人都是音樂家,他們將Suno視為解決音樂聽眾與創(chuàng)作者之間數量不平衡的工具。他們的愿景是讓全球十億人能夠使用Suno發(fā)揮自己潛在的音樂才能,提供一個大家都可以簡單使用的歌曲創(chuàng)作平臺。
Mikey Schulman是Suno的CEO聯合創(chuàng)始人之一,在一次訪談中Schulman回顧了自己的音樂之路。
他從學習了多種樂器,并在高中和大學期間在紐約的一些小型俱樂部里演奏貝斯。盡管演出并不總是那么成功,但與人們一起制作音樂的過程充滿了樂趣。
Mikey:“音樂一直是我生活中很重要的一部分。我從小學習小提琴和吉他,大學時組建了一支樂隊?!?/p>
后來,Mikey在哈佛大學學習物理,但他的職業(yè)生涯最終轉向了人工智能和機器學習領域。
Mikey:“雖然我學的是物理,但音樂始終是我的激情所在,我錄過一張EP。作為業(yè)余音樂人,錄音棚工作比現場演出要枯燥得多。我記得有一次錄音時因為不小心從椅子上滑下來,導致一個很棒的錄音報廢,不得不重新錄。這種事在現場演出時絕對不會發(fā)生。”
Mikey研究生畢業(yè)后,就在Kensho Technologies工作,該公司后來被S&P Global收購。
Mikey:“我在讀研究生的最后一年,剛好認識了 Keno 的一些人,其中一位 Martin 現在是我的聯合創(chuàng)始人。一次午餐時他們問我什么時候去面試,我說我是學生,隨時都行。結果他們說那現在就去吧,我就跟著上樓面試了。雖然面得很糟糕,但他們還是決定給我一個機會?!?/p>
在Kensho,Mikey和他的團隊成員開始探索音頻AI的可能性。Mikey和他的團隊在Kensho進行的一項關于語音轉寫的項目,讓他們對音頻AI產生了濃厚的興趣。盡管這個項目專注于財經領域,但他們認識到音頻AI在更廣泛的音樂創(chuàng)作領域內的潛力。
Mikey:“Keno 主要是利用 NLP 和機器學習處理大量金融文檔,2018年被標普全球收購。收購后我們獲得了大量的金融文檔數據,簡直是夢想成真。我們還做了一個語音項目,就是將上市公司的財報電話會議實時轉錄成文字。這是 Keno 第一次涉足音頻 AI 領域。我們發(fā)現,如果擁有幾十年積累的高質量轉錄數據,再加上機器學習算法,就可以大幅提升準確率,遠超市面上的語音轉文字服務。”
Mikey和他的合作伙伴意識到,在金融服務公司追求音頻AI可能并不合適。他們認為有更大的機會在音樂創(chuàng)作方面利用AI技術。Mikey特別指出,盡管最初他們沒有確定產品的具體形式,但他們知道這個方向充滿了機遇和挑戰(zhàn)。
Mikey:“Keno 主要還是做文本方面的項目。這個音頻項目是在被收購一年后開始做的。雖然金融領域確實有很多音頻方面值得探索的地方,但我認為音頻 AI 在金融之外有更廣闊的應用空間。另外金融行業(yè)出于風險考慮,在創(chuàng)新方面會相對保守一些。文本領域有太多有趣的項目值得投入,很難分散精力去做音頻?!?/p>
Suno團隊早期的一個重要里程碑是發(fā)布了一個名為”Bark”的開源文本到語音項目。這個項目受到了社區(qū)的廣泛關注,他們發(fā)現人們最感興趣的是音樂生成,而不僅僅是文本到語音。他們發(fā)現,盡管人們試圖使用Bark生成音樂,但這并不是訓練該模型的初衷。但正是這一點激勵了他們更進一步發(fā)展Suno,專注于音樂生成。
Mikey:“我們仔細評估了音頻領域的各種機會,發(fā)現大部分人并不喜歡處理音頻數據,可能這就是我們的特別之處,我們是真的很喜歡音頻(笑)。我們一開始就決定要走 foundation model 的路線,因為從長遠來看,這是最有前途的方向,雖然當時業(yè)界幾乎沒有用 transformer 做音頻的先例。說實話,剛離開 Keno 時,我們還沒完全確定是要做語音還是音樂。畢竟我們在語音領域有更多經驗,也有不少人勸我們說語音市場更大,不要去做音樂。
但有兩件事改變了我們的想法:
1.作為音樂愛好者,我們還是忍不住要去嘗試音樂;
2.我們開源了一個叫 bark 的語音模型后,在 GitHub 上獲得了很多關注。通過一個調查表單,我們發(fā)現用戶最感興趣的領域其實是音樂,而不是語音?!?/p>
Mikey希望讓Suno重新定義音樂的創(chuàng)作和消費體驗,無論你是音樂專業(yè)人士,還是從未嘗試過創(chuàng)作的普通用戶,Sunno都希望成為你表達內心情感、講述生活故事的全新方式。
Mikey:“我們的目標就是讓每個人都能將腦海中的音樂靈感,通過簡單易用的工具,轉化為實際的音樂作品。無論你是音樂專業(yè)人士,還是從未嘗試過創(chuàng)作的普通用戶,Suno都希望成為你表達內心情感、講述生活故事的全新方式。未來,我們還計劃探索更多有趣的人機交互方式。比如也許你可以哼唱一段旋律,模型就能以此為靈感,生成一首完整的歌曲;又或者你可以上傳一些圖片或視頻,講述你的生活片段,模型就能據此創(chuàng)作出與之相匹配的背景音樂。我們希望充分利用AI的能力,激發(fā)人們的創(chuàng)造力,讓音樂創(chuàng)作成為一種全新的生活方式。當然,我們也深知音樂行業(yè)對知識產權的重視。Sunno致力于以合法合規(guī)的方式發(fā)展音樂AI。我們訓練模型時只使用了無版權問題的音樂數據。生成的歌曲也經過了仔細地過濾,確保不會侵犯任何藝術家的權益。用戶創(chuàng)作的歌曲,其版權將完全由用戶自己所有。我們的目標是成為連接音樂人和AI的橋梁,讓雙方都能從這項技術中受益,而不是相互取代?!?/p>
二、Suno的創(chuàng)作方式
Suno的獨特之處在于它不僅生成音樂的旋律和伴奏,還能創(chuàng)作歌詞和人聲。這意味著它可以產生完整的歌曲,包括所有必要的音樂元素。它的音樂元素甚至包含了不同種語言,甚至是方言,粵語,四川話的音樂都可以生成。
使用Suno的時候,用戶可以選擇兩種模式。
- 基礎模式:用戶提供一個AI風格的文本提示,并可以選擇讓歌曲保持純樂器,無歌詞的演奏。
- 自定義模式:用戶可以使用自己的歌詞,設置多種流派風格的音樂,并給主動給歌曲命名。
用戶使用Suno的創(chuàng)作流程很簡單,當用戶使用Suno時,用戶首先選擇生成模式(基礎或自定義),然后輸入相關的提示信息,如歌曲的主題、風格或特定的歌詞。Suno利用這些輸入生成一首完整的歌曲,并提供音軌供用戶試聽,同時提供歌詞和代表歌曲主題的圖片。
Suno以端到端的方式生成歌曲,意味著歌曲的人聲、樂器和其他所有部分都是一次性生成的,并且使Suno能夠創(chuàng)建歌詞和人聲的決定大大增加了模型訓練的復雜性。這需要Suno的創(chuàng)始團隊投入大量的努力,以確保模型能理解和生成人類的歌聲和歌詞。
在Suno最新的版本v3中引入了更多自然 sounding 和較少 auto-tune 樣式的人聲,以及為用戶提供對創(chuàng)作過程更細致控制的新功能。例如,用戶可以鎖定他們喜歡的歌曲部分并重新生成不符合預期的部分。
三、Suno的創(chuàng)作意義
Suno提供了一條讓人們可以用文本探索音樂的道路,讓任何人都可以享受制作音樂的樂趣,無論創(chuàng)作者是否有音樂背景。Suno希望賦能更多人將內心的旋律轉化為現實,讓音樂創(chuàng)作不再局限于專業(yè)音樂人。
Suno不僅關注于如何以新的方式創(chuàng)作音樂,也致力于探索如何以新的方式體驗和分享音樂。Suno的出現可能預示著音樂消費和分享方式的變革,其中音樂不再僅僅是被動消費的對象,而是可以根據聽眾的具體情感和需求動態(tài)生成的體驗。
Suno通過使音樂創(chuàng)作更加普及和個性化,有可能改變人們與音樂的關系,促進音樂作為一種表達和溝通方式的發(fā)展。這種自然語言創(chuàng)造音樂的分享方式將會產生一種新的社交模式——音樂社交。
音樂社交不僅僅是關于分享音樂本身,它還是一種新的互動方式,讓人們可以通過音樂來連接和理解彼此。在這個平臺上,用戶不僅可以發(fā)布自己的音樂作品,還可以發(fā)現來自世界各地的創(chuàng)作者和他們的作品,從而激發(fā)新的靈感和創(chuàng)意。這種跨文化的交流和合作將推動音樂的創(chuàng)新,使其成為一種真正全球化的語言。
隨著Suno社區(qū)的不斷壯大,我們也將看到更多基于音樂的社交活動和事件的出現。從在線音樂會到創(chuàng)作工作坊,Suno為用戶提供了一個平臺,讓他們可以共同參與和享受音樂的樂趣。這不僅加深了社區(qū)成員之間的聯系,也為音樂愛好者帶來了全新的體驗和機會。
參考材料:
https://www.tomsguide.com/ai/i-tried-the-radio-quality-suno-ai-music-generator-heres-how-it-sounds
https://www.rollingstone.com/music/music-features/suno-ai-chatgpt-for-music-1234982307/
https://gosummarize.com/youtube/@lightspeedvp/mikey-shulman-suno-and-the-sound-of-ai-music
編譯:Evan;編輯:Vela
來源公眾號:深思SenseAI;關注全球 AI 前沿,走進科技創(chuàng)業(yè)公司,提供產業(yè)多維深思。
本文由人人都是產品經理合作媒體 @深思SenseAI 授權發(fā)布,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
Suno所開創(chuàng)的音樂創(chuàng)作與分享模式是一場深刻的變革,它讓音樂變得更加親民、更加多元、更加具有創(chuàng)新性。我為能夠見證和參與這一變革而感到興奮和自豪。