中國生成式AI的“物種大爆炸”

0 評論 2560 瀏覽 11 收藏 12 分鐘

國內的生成式AI正在迅速地發展中,可以看到,算法備案的數量和頻率都在上升,并且,生成式AI在互聯網領域迅速擴展,同時在向更多垂直領域蔓延。更詳細的解讀,我們不妨來看看本文的梳理。

最近國外的Sora風頭正勁,讓不少國人產生了悲觀情緒。其實,國內生成式AI也在迅速的發展中,就在Sora發布后不久的2月18日,網信辦發布了第四批深度合成服務算法備案信息,從中可以一窺我國生成式AI的現狀。

什么是深度合成服務?是指利用深度學習、虛擬現實等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等網絡信息的技術,包括但不限于:

(一)篇章生成、文本風格轉換、問答對話等生成或者編輯文本內容的技術;

(二)文本轉語音、語音轉換、語音屬性編輯等生成或者編輯語音內容的技術;

(三)音樂生成、場景聲編輯等生成或者編輯非語音內容的技術;

(四)人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態操控等生成或者編輯圖像、視頻內容中生物特征的技術;

(五)圖像生成、圖像增強、圖像修復等生成或者編輯圖像、視頻內容中非生物特征的技術;

(六)三維重建、數字仿真等生成或者編輯數字人物、虛擬場景的技術。

《互聯網信息服務深度合成管理規定》是在2022年11月3日審議通過的,在不到一個月后的11月30日,ChatGPT就橫空出世了。

圖片來源:網信辦

不難發現,深度合成服務的概念與生成式AI有很大的重合——半年后我國發布的《生成式人工智能服務管理暫行辦法》中,定義生成式人工智能技術是指具有文本、圖片、音頻、視頻等內容生成能力的模型及相關技術。

按照規定,在我國境內提供深度合成服務,需要進行相應的備案,從2023年6月至今,已經有4批備案,合計546個算法,可以說是迎來了生成式AI的“物種大爆炸”。

從圖不難看到,算法備案的數量和頻率都在上升,第四批備案距離發布第三批備案僅有一個月,算法數量也從129個增長到了266個。其中,服務技術支持者和服務提供者累計下來分別為151和395個。(深度合成服務提供者,是指提供深度合成服務的組織、個人;深度合成服務技術支持者,是指為深度合成服務提供技術支持的組織、個人。)

一、大廠成為主力軍

在這些算法中,既有來自互聯網大廠的,也包括垂直領域的領軍企業,還有一眾的創業公司。

先看服務技術支持者,算法備案數量的前十名基本都來自大廠,在后面的榜單中,也有科大訊飛、京東科技、出門問問、360、獵戶星空等知名互聯網公司。相對來說,對外提供技術服務的門檻要高于自用,會出現這種情況也就不奇怪了。

去年大模型爆火,備案的546個算法中,大模型的算法足足有70個,不過大多數都是企業用于自身業務的,對外提供技術支持的僅有19個,并且包含多個垂類大模型,通用大模型為數并不多,可見“百模大戰”有些名不副實。

再來看服務提供者,由于數量過多(395個),就不一一列舉了,重點說一下大模型,表單中的內容和上表有些許重合,比如百度的文心大模型,因為有的大模型既可對外做技術支持,也可以用于自家的產品。

值得一提的是,2023年生成式AI的浪潮中,騰訊表現的較為低調,卻在技術支持者榜單中數量排名第一。除了技術力量強大外,大廠涉獵的行業多,因此有更多的落地場景,可以身兼“賣水人”和“掘金者”兩個角色,例如騰訊,深度合成服務算法備案中,囊括了人臉融合、語音合成、繪畫、P圖等多個領域。

與之類似的是網易,作為服務技術支持者,算法涉及圖像、語音生成、文本生成、三維場景等多個行業;作為服務提供者,算法則服務了有道詞典、逆水寒手游等應用。

但要說自身應用算法最廣泛的大廠,則莫過于阿里巴巴??赡茉从诮M織拆分的緣故,阿里巴巴對外提供技術支持的算法都來自達摩院,但淘寶、釘釘以及天貓等,又都有各自的算法備案。DoNews向達摩院了解到,淘寶、釘釘等大部分技術來自于自研,也有部分技術有達摩院提供或者聯合研發。

百度的文心大模型是目前國內大模型的領軍者,在數字人、語音合成及識別、文生文/圖、人臉融合等領域都有算法,不過在產品層面就明顯單調許多,只展現了文心一言大模型的App和網站。由此可見,單純看算法數量,并不能全面體現企業的AI能力。

華為云則是徹底走“2B”路線,目前擁有6個算法備案,全部作為服務技術支持者,主要分為兩類:盤古及MetaStudio(數字內容生產線)。

二、行業應用加速落地

通過整理算法備案的資料,我們還發現另一個情況,生成式AI在互聯網領域迅速擴展,并在向更多垂直領域蔓延。

比如,電商就是一個重點發展大模型的行業,阿里巴巴旗下的電商最積極擁抱AI。

短視頻領域也大量應用了生成式AI技術,抖音和快手一如既往是領頭羊,應用場景集中在特效、合成、換臉幾大方向。

傳統行業也在積極擁抱生成式AI,比如醫療健康,應用主要集中在健康咨詢、醫療內容生成上。

2024年開年,AI手機成為了熱點話題,OPPO和vivo都提前進行了大模型的算法備案。

此外,不少令人意想不到的行業,也在應用生成式AI。比如家電巨頭TCL,看似和生成式AI不沾邊,卻通過TCL智能文本生成算法,在APP中根據用戶輸入的文本內容,生成產品說明和使用指導。

在教育領域,好未來一共備案了多達8個算法,既有自用也有對外做輸出的,展現了強大的科技實力。母嬰行業,寶寶樹孕育(APP)應用的寶寶樹母嬰家庭領域大模型生成合成算法,可以根據用戶提出的備孕育兒問題,生成備孕育兒等相關知識內容,輸出文本內容回復。

還有一個重要的落地場景,就是汽車行業。年初的CES上,奔馳、寶馬、大眾等汽車廠商都展示了融合最新AI大模型技術的車機系統,比亞迪也在近期推出了全新的整車智能化架構“璇璣”及其AI大模型“璇璣AI大模型”,“智駕”正在成為新能源汽車標配。

通過深度合成服務算法備案信息,我們可以看到,生成式AI在中國蓬勃發展,雖然有只見廣度不見深度的嫌疑,但隨著生成式AI的不斷深入產業落地,未來我們也將看到更多和更好行業案例涌現。

作者:小不董;編輯:李信馬

微信公眾號:DoNews(ID:ilovedonews),不局限于對互聯網行業的追蹤與探索,更要向未來、向未知的方向邁進。

本文由人人都是產品經理合作媒體 @DoNews 授權發布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!