直播亮點回顧:如何用大模型和實時音視頻構建社交應用?

0 評論 3285 瀏覽 10 收藏 11 分鐘

人人都是產品經理 x 即構科技聯合舉辦的“AI驅動社交創新:如何利用大模型和實時音視頻構建社交應用”主題直播已圓滿結束,干貨滿滿,一起來看。

隨著大模型技術的不斷演進,AI應用正迅速融入各行各業,深入到實際應用場景的探索與創新中。特別是在AI社交領域,產品經理面臨著全新的機遇和挑戰:他們迫切希望了解AI大模型技術如何重塑社交行業格局,AI如何改變人們的社交方式與體驗,以及AI實時互動技術將帶來哪些創新的社交應用場景。

為了幫助產品經理深入了解AI技術加持下的社交應用,人人都是產品經理與即構科技共同舉辦了一場直播活動。

8月28日,我們邀請了臉臉科技CTO@黎平,即構科技資深產品經理/AI業務負責人@孫靖昆作為嘉賓。他們圍繞社交AI陪伴、實時互動數字人等話題,探討了如何利用大模型和實時音視頻技術構建創新性的社交應用。

一、圓桌互動問答

直播開始,兩位老師就活動主題帶來了精彩的對談,著重討論了AI趨勢及其對社交行業創新發展的推動作用,突出了AI實時互動技術在客服、情感娛樂、文旅等領域的廣泛應用前景。

以下是概要的問答對話:

Q1:AI趨勢、大模型技術對社交行業賽道的影響有哪些?

孫靖昆老師:

第一種是,社交本身的AI化轉變,之前是人與人之間的社交,現在慢慢變成一些人與AI之間的社交;

第二種是,AI對于內容創作和審核方面的新的東西,如定制化頭像、人設皮膚、在社交平臺上發的文本,視頻等;

第三種是,AI在語言翻譯中的應用,AI翻譯技術促進了跨文化社交,使得不同文化之間的用戶可以通過AI來做到很好的跨語種之間的社交溝通。

Q2:用戶在線上線下的不同行為特點和習慣?

黎平老師:

我們在運營的過程中發現線上跟線下的用戶其實可以分為幾類。

  • 確定性消費:比方說去買一個飛利浦剃須刀,這種用戶基本上不去京東,不閑逛,可能幾分鐘就已經下單完成,下午可能就送到貨了。
  • 半確定性消費:就是比方說想買剃須刀,但還沒確定是買什么牌子,還需要看性價比、看價格、看功能介紹。這些人就可能就去了天貓,去淘寶,去逛。
  • 不確定性消費:就比方說在購物中心,每天3到4萬,周末6到8萬的流量,這些人其實并不知道要買什么。因此怎么去創造買點是非常重要的。需要通過互動加娛樂,去創造消費。

Q3:在眾多實時互動云服務品牌中,臉臉科技為什么選擇了即構?決策背后的考量?

黎平老師:

第一個是,整個公司的體量規模,即構算是一個老牌的資深的公司。

第二個是,看我們要發展的AI跟數字,和即構公司的技術沉淀跟主要的方向是不是一致。

第三個就是,看服務質量的響應速度。在落地一些AI數字人,包括一些模型訓練上,即構的響應速度還是很快,解決問題的速度也很快。

Q4:雙方合作過程中,有沒有遇到哪些問題,又是如何解決的?

黎平老師:

臉臉科技一直在做商業場景,最近跨界到了文旅場景,做了一些景點的數字人的活化,通過我們的3D屏呈現出來。

我們在西湖邊上有蘇軾的數字人,選擇的是一個年紀大的演員形象,所以他有胡子。在數字人在處理的時候,胡子的飄逸還是蠻難的。

在跟即構合作的過程中,也跟工程師一直在探討,怎么去把這個胡子這種飄逸感,很自然的感覺能呈現出來。

孫靖昆老師:

其實站在即構的技術角度來看,像AI實時互動這種場景的挑戰性還是蠻大的。

  • 第一個是,效果的自然程度。黎總的這個文旅場景,演員模特有個長須,從AI視覺上來說,其實是一個很難處理的問題。因為他不是一個很連貫,在圖像拼接上有很大技術挑戰的事情。
  • 第二個是,聲音的自然程度。說話的時候,受到的情緒感染,是不是自然?這個最直觀的影響因素就是聲音,他的音色好不好聽,停頓語氣怎么樣。
  • 第三個是,延遲方面,對話的延遲?;旧掀胀ㄓ脩舻母惺苁浅^2秒就不能夠正常對話了。我們在整個工程化的鏈路上,把語音轉文本大模型,延遲都壓縮到了極致,現在是做到了1.5秒內。

Q5:雙方合作中,AI和數字人的應用場景有哪些?為線下流量場景帶來了哪些價值?

黎平老師:

比方說給品牌做AI櫥窗。像傳統意義上的服裝品牌在全國各地有幾千家。每次上新款,所有的模特都去換一遍,成本蠻高的。通過數字人的方式,一鍵就能夠把所有門店的數字化櫥窗都換掉。

第二個就是文旅場景,包括一些文化展廳,都用到了一些數字的活化。一個數字人,去介紹他們的特產、文化。還有準備跟文化展廳合作的一些AI文創商店,去把一個人風格化,最后面呈現紀念品上。

Q6:AI實時互動技術還有哪些行業和場景中的創新應用?能否分享一些例子?

孫靖昆老師:

從場景上來說,目前是有兩大類的場景是比較能夠跑通商業化的。

第一大類是客服場景。重點在于幫企業顧客去解決問題,增強了顧客的體驗的流程,包括語音的實時問答,甚至視頻去服務客戶。

第二類是一些面向to c的場景。比如說AI陪伴,大部分做的是智能體,或者叫一個仔仔的概念。用戶自己去寫人設,上傳視頻或者圖片,捏出自己的仔仔。跟這個仔仔去聊天、視頻通話等等,來獲得情感需求。從商業的收入上來看,賺的是會員費,跟仔仔互動過程中,隨著聊天越來越多,展開背后的更多的情節和故事。從數據上看,轉化的漏斗是蠻高的。每個用戶的粘性非常大,是付費的中堅力量。

即構在這兩種場景下提供了非常完善的解決方案。包括數字人形象的云端API的解決方案,語音轉文本和文本轉語音的多模態大模型,RTC實時音視頻的推拉流的能力,幾行代碼快速調用IM對話聊天消息,提供了一個完整的AI實時互動的解決方案。

更詳細的互動問答內容,可以在直播當中一睹為快:https://vip.qidianla.com/course/detail/n2kv8.html#description

二、RTC+AI,泛娛樂社交AI新場景探索與實踐

兩位嘉賓互動結束后,孫靖昆老師還帶來了主題分享,內容聚焦RTC+AI在泛娛樂社交領域的最新進展和應用。首先,介紹了實時音視頻技術與AI的結合如何推動娛樂和陪伴場景的發展,并強調了AI陪伴作為行業的一個重要發展方向,及其在內容生成、編輯和實時互動等方面的應用。

孫老師指出,數字分身技術通過提供個性化的AI陪伴,已經改變了社交媒體用戶的交互模式,并創造了新的商業模式。AI陪伴產品主要通過訂閱會員、內購及廣告營收三種方式盈利。此外,GPT技術通過減少語音交互的延遲,實現了多模態交互與情緒識別,大大提高了人機對話的真實性和流暢性。

此次,還介紹了即構科技提供的面向應用層開發者的AI陪伴一站式解決方案,旨在提供全方位的絲滑互動體驗。討論還包括了直播過程中的具體執行細節和面臨的挑戰,如音視頻設置、內容編輯、畫面切換策略以及抽獎流程的準備等。深入探討了RTC+AI技術在社交娛樂領域的應用現狀和未來發展趨勢。

還有更多的內容因為篇幅有限不全部展開啦,感興趣的同學戳鏈接進行觀看:https://vip.qidianla.com/course/detail/n2kv8.html#description

掃碼添加小助手領取產品體驗demo

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!