產(chǎn)品趨勢:四大批次備案境內(nèi)深度學習算法及公司一覽

0 評論 1433 瀏覽 1 收藏 11 分鐘

隨著人工智能賽道的火熱,監(jiān)管方面的相關工作也在不斷推進中。本文總結了四大批次備案境內(nèi)深度學習算法及公司一覽,供你參考。

2024年3月,人工智能賽道上,中美印歐等國家和地區(qū)在監(jiān)管探索方面展現(xiàn)出不同策略。而在我國,隨著一系列監(jiān)管方案的出臺,境內(nèi)深度學習算法的備案工作也在有序推進。

梳理了網(wǎng)信辦《境內(nèi)深度合成服務算法備案清單》四份備案材料,統(tǒng)計一共涉及了326項算法備案,包括2023年6月、2023年8月、2024年1月、2024年2月的備案清單,以及最后的3項補充備案。

一、哪個細分賽道的深度合成算法玩家最多?最卷?

在深度合成算法領域,幾類算法因其廣泛的應用和實用性而備受歡迎。這些算法包括文本生成算法、圖像生成算法、語音生成算法、視頻生成算法、數(shù)字人生成算法、代碼生成算法以及音頻生成算法。

1. 文本生成算法:主要用途包括智能對話、知識問答、文章寫作、機器翻譯等

  • 智譜ChatGLM生成算法 (北京智譜華章科技有限公司)
  • 百度PLATO大模型算法 (北京百度網(wǎng)訊科技有限公司)
  • 小冰語言模型算法 (北京紅棉小冰科技有限公司)

比如,智譜ChatGLM生成算法的準確性不亞于GPT3.5,同時集成了文生圖、智能對話、數(shù)據(jù)分析等。測試下來,智譜的長文本解讀功能真的強悍,支持不超過30M的PDF文件解讀,準確率極高,期待開放更多doc等格式。但文生圖、數(shù)據(jù)分析功能并不好用。舉個例子,其中文生圖的promote語句“不帶眼鏡”但生成的圖像基本都帶有眼鏡、數(shù)據(jù)分析只能支持平均數(shù)、中文數(shù)等分析。

智譜并不是一個熟悉的AI公司,但其背后卻是互聯(lián)網(wǎng)資本。早在2023年的8月和9月,阿里巴巴旗下的螞蟻集團與阿里云戰(zhàn)投相繼參與了對智譜AI的融資,分別投入了4.4億元和12億元,助力其B輪次的融資。此外,這一輪融資還吸引了順為、小米、紅杉、高瓴、騰訊等眾多知名投資方的加入,形成了豪華的投資陣容。

2. 圖像生成算法:主要用途涵蓋虛擬試衣、虛擬裝修、虛擬形象、表情特效、圖片編輯等

  • 百度文生圖內(nèi)容生成算法(北京百度網(wǎng)訊科技有限公司)
  • 商湯秒畫內(nèi)容生成算法(上海商湯智能科技有限公司)
  • 商湯格物高精度重建算法(上海商湯智能科技有限公司)

本月商湯系的MiniMax剛獲得阿里巴巴的領投,根據(jù)彭博社的消息,新一輪融資完成后,MiniMax的估值將超25億美元(約合人民幣180億)。

MiniMax自主研發(fā)的AI聊天應用Glow允許用戶親手“塑造”出個性化的AI智能體,無論是理想的戀人還是親密的朋友,用戶都可以根據(jù)自己的喜好為其取名,并設定獨特的人設、性格和愛好。通過與這些AI智能體的內(nèi)容生成和用戶反饋機制,用戶可以進行自然而流暢的溝通交流。據(jù)媒體報道,Glow自上線以來僅短短4個月時間,用戶數(shù)量便迅速逼近500萬,展現(xiàn)出強大的市場潛力和用戶吸引力。

3. 語音生成算法主要用途包括文本轉語音、語音合成、歌聲合成等

  • 百度語音合成算法(北京百度網(wǎng)訊科技有限公司)
  • 達摩院語音合成算法(阿里巴巴達摩院(杭州)科技有限公司)
  • 訊飛語音合成算法(科大訊飛股份有限公司)

語音生成算法在文本轉語音、語音合成和歌聲合成等方面具有廣泛應用,為語音交互和語音內(nèi)容創(chuàng)作提供了可能。我使用最多的是飛書妙記的語音轉文字,相比onenote插件僅支持繁體字、騰訊會議的ai錄屏等,飛書妙記的網(wǎng)頁版非常方便、不容易斷續(xù)且文本翻譯質量非常高。

此外,字節(jié)在剪映等視頻剪輯軟件中的變聲、文字轉語音等應用也非常使用且場景豐富。

4. 視頻生成算法:主要用途包括虛擬數(shù)字人、視頻換臉、視頻風格轉換等

  • 百度數(shù)字人驅動算法(北京百度網(wǎng)訊科技有限公司)
  • 商湯2D數(shù)字人合成算法(上海商湯智能科技有限公司)
  • 騰訊云數(shù)字人形象合成算法(深圳市騰訊計算機系統(tǒng)有限公司)

騰訊云、火山引擎B端定制數(shù)字人的價格是6000+/個,但通用版其實基本免費,這類IP類的落地和使用也較多。應用場景比如說金融行業(yè):銀行、保險、證券等,證券分析師、保險代理人等觸客一線的專業(yè)人士可以利用數(shù)字人進行溝通產(chǎn)出,我們公司已在使用。此外自媒體等ip產(chǎn)出也較多,例如財經(jīng)類大V等視頻其實并不是本人,而是MCN機構量產(chǎn)的數(shù)字人。

5. 代碼生成算法:主要用途包括代碼自動生成、代碼翻譯等

  • 商湯AI代碼生成算法(上海商湯智能科技有限公司)
  • 商湯AI代碼生成算法-1(上海商湯智能科技有限公司)

我們公司已在推廣使用代碼助手,看了一眼推特上STEVEN HONG利用AI發(fā)布的代碼問答非常專業(yè),理解后續(xù)能解放雙手、釋放效率也非常棒。

6. 音頻生成算法:主要用途包括語音合成、歌聲合成等

  • 快音音色提取和歌聲合成算法(成都開心音符科技有限公司)
  • 小冰歌聲合成服務算法(北京紅棉小冰科技有限公司)
  • 唱鴨文字生成音樂算法(廣州歡城文化傳媒有限公司)

二、主要玩家是哪些?

就備案數(shù)量而言,深度合成算法領域,國內(nèi)的主要玩家包括北京百度網(wǎng)訊科技有限公司、上海商湯智能科技有限公司和北京紅棉小冰科技有限公司。

北京百度網(wǎng)訊科技有限公司以19次的出現(xiàn)次數(shù)高居榜首,顯示了其在深度合成算法領域的廣泛布局和強大實力。百度在文本生成、圖像生成、語音生成、視頻生成、數(shù)字人生成等多個領域均有突出的算法表現(xiàn),如百度PLATO大模型算法、百度文生圖內(nèi)容生成算法、百度語音合成算法以及百度數(shù)字人驅動算法等。

上海商湯智能科技有限公司以12次的出現(xiàn)次數(shù)緊隨其后,其在圖像生成、代碼生成等領域擁有強大的技術實力。商湯的秒畫內(nèi)容生成算法、格物高精度重建算法以及AI代碼生成算法等,都展現(xiàn)了其在深度合成算法領域的創(chuàng)新能力和應用潛力。

北京紅棉小冰科技有限公司以7次的出現(xiàn)次數(shù)位列第三,其在語言模型、數(shù)字人生成和音頻生成等領域有著不俗的表現(xiàn)。小冰語言模型算法、數(shù)字人合成算法以及歌聲合成服務算法等,都體現(xiàn)了小冰在人工智能領域的深厚積累和獨特優(yōu)勢。紅棉小冰前身為微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能小冰團隊,是微軟全球最大的人工智能獨立產(chǎn)品研發(fā)團隊,該團隊于2013年12月在中國組建。

三、第一批次到第四批次發(fā)生了哪些變化?

在2023年6月至2024年2月期間,深度合成服務算法備案清單展現(xiàn)出了明顯的變化趨勢。

首先,備案數(shù)量呈現(xiàn)出持續(xù)增長的趨勢。從2023年6月的41個備案算法,到2024年2月的255個,備案數(shù)量在短短幾個月內(nèi)實現(xiàn)了大幅提升。這反映出深度合成技術在我國的快速發(fā)展和廣泛應用,同時也體現(xiàn)了監(jiān)管部門對于該領域日益嚴格的監(jiān)管要求。

其次,各類算法的備案數(shù)量也呈現(xiàn)出不同的增長態(tài)勢。文本生成類算法的增長尤為明顯,從2023年6月的較低占比增長到2024年2月的超過50%。這表明文本生成技術在自然語言處理、智能問答、內(nèi)容創(chuàng)作等領域的應用正在不斷深化和拓展。同時,圖像生成、語音生成、視頻生成、數(shù)字人生成、代碼生成和音頻生成等類型的算法也都有不同程度的增長,反映了深度合成技術在多個領域的全面發(fā)展。

最后放鏈接《國家互聯(lián)網(wǎng)信息辦公室關于發(fā)布第四批深度合成服務算法備案信息的公告》https://www.cac.gov.cn/2024-02/18/c_1709925427424332.htm

本文由 @AI營銷先鋒派 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!