國產AI再創新,這次是真的很接地氣
最近在網絡平臺上,各路名人突然一夜之間變成了“語言大師”,而在這些AI配音視頻背后,其實是HeyGen這款產品在“炫技”,用戶只需簡單的操作,即可生成短視頻。這樣看來,AI似乎離普通人的生活越來越近了。
郭德綱在麻省理工講起了英語相聲?
是的,你沒看錯,郭老師甚至可以用他的京腔英語直接對話趙本山的東北英語。更有大量德云英語聽力試題不斷沖擊著好學的網友。
除了英語,一眾外國明星也紛紛操起一口流利的中文,連諧音梗大師完顏慧德的普通話都標準了起來,八國語言隨意切換,只需動動手指就能把自己笑擁。
各路名人為何一夜之間變成了語言大師?原來,這都是AI配音搞的鬼。
01
AI越來越會炫技了。
這款“爆火”的AI視頻翻譯工具叫HeyGen,只需要上傳一張人物照片,什么都不用做,啪的一下,一個短視頻就生成了。除了上百款數字人素材和模板,官方還提供包括中文在內的50多種語言和300多種不同的音色供用戶選擇。
HeyGen背后的公司名叫詩云科技,成立于 2020 年。他們最初致力于做 AI 數字人生成,目前其客戶包括英偉達、亞馬遜、volvo等。
不少網友感嘆,“這翻譯沒有譯制片腔調。”“嘴型、手勢都對得上,太自然了,差點兒以為是真的?!薄安恢棺煨危€有身體動作和語速的配合?!?/p>
不得不說,在翻譯配音上,AI的表現非常出色,HeyGen的火爆程度也完全不輸去年面世的AI繪畫工具Midjourney。同樣只需幾秒鐘,被稱為史上最強作圖神器的Midjourney就能調配出各種風格的圖像,同類型軟件還可以讓生成的圖片直接動起來。
自去年11月ChatGPT橫空出世,大眾一次次被AI的創新所驚艷。從GPT4到Midjourney,再到HeyGen,文字、圖片到視頻,AI不斷刺激著人類的感官,一次次刷新著人類的認知。更讓人期待的是,AI還有無限的潛能可被發掘,創新之路還遠遠看不到盡頭。
02
那么,人人追捧的AI,究竟離我們普通人的生活還有多遠?
雖然2023年以來國內很多公司都發布了自己的通用大模型,但很多還停留在“開放閑聊”階段,這種泛娛樂的方式并不能帶來實際生產力。所以,以“開放閑聊”為產品形態的ChatGPT,“嘗鮮“的流量在6月達到巔峰之后,就開始出現下滑。
與通用大模型不同,垂直大模型可以深入到不同行業,更容易落地到具體的場景,如金融、教育、醫療和零售等。目前已經積累了數百萬個視頻數據的HeyGen,之后也會考慮做視頻垂直領域的大模型。
有趣好玩,還能極大提升效率,是AI帶給大眾最直接的好處。AI配音既能打破語言隔閡,還能取代一部分配音和字幕組的工作。
此前,生成式AI的幾次創新也都伴隨著對重復人工的解放。Midjourney的出現,為影視工作者提供了更高效的工作方式,國內網友熟知的妙鴨視頻,最早也是誕生于劇組的選角場景,用AI圖像生成的方式不僅提高效率還大大節約了成本。AI生成內容的浪潮已經從追風開始走向務實。
縱觀全行業,今年以來的“百模大戰”背后,垂直領域的大模型開始成為新一輪布局的重點。
03
說到底,無論是通用還是垂直大模型,其核心點還是落地場景和商業化。讓普通人都能用起來,是大模型最重要的后半步。
如今,AI正廣泛運用于繪圖、配音、劇本寫作等方面,科技公司們也在多模態上不斷訓練自家AI,試圖讓其產出更接近真人的創作。圖片生成上,阿里大文娛推出的妙鴨相機,逼真的換裝功能對用戶開放后,也曾走紅網絡。在配音上,AI燕姿、AI杰倫就曾憑借獨特的音色與唱腔,搭配與歌手本人風格或相似或迥異的歌曲,吸引了不少關注。
但隨之而來的,是廣泛運用后產生的爭議。AI換臉和AI配音都會構成侵權,甚至會被一些不法分子用于詐騙,如果AI技術被濫用,后果是無法想象的。技術的普及也讓這些隱患風險一一暴露,除了監管部門,研發公司也應該從源頭杜絕「技術濫用」的發生。
行業巨頭們都非常重視這一威脅。OpenAI CEO Sam Altman一直擔憂AI有一天會向人類扔核彈。他們最近組建了一支全新的團隊,旨在對抗“人工智能的災難性風險”。
但任何技術的革新都無法擺脫風險和挑戰,只要對人類有益,這項技術就值得推進。在具體的應用場景中不斷成長,不斷滿足用戶反饋的需求,或許是大模型最快也是最理想的落地方式。
作者:Lime
來源公眾號:明晰野望(ID:MXYW-1688),銳眼看財經野望大市場
本文由人人都是產品經理合作媒體 @明晰野望 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!