大模型六小虎,要撞上版權墻了
隨著AI技術的飛速發展,大模型的應用越來越廣泛,但隨之而來的版權問題也日益凸顯。本文聚焦于被稱為“AI六小虎”的六家中國大模型獨角獸公司,探討它們在視頻生成領域面臨的版權挑戰。
“幾乎沒有一家大模型公司的AI視頻生成訓練,會找視頻網站授權?!?/p>
2025年伊始,在視頻生成領域立志“追平Sora”的大模型公司,撞上了版權墻。
AI創業者陳臨告訴我們,這其中也包括被稱為“AI六小虎”的6家中國大模型獨角獸。而缺乏授權的模型訓練,勢必將成為大模型公司們的潛在風險。
如今,在熱度不減的AI視頻生成賽道,“視頻平臺訴大模型侵權”第一案已經出現。
日前,有報道稱愛奇藝起訴MiniMax旗下海螺AI侵犯著作權,據悉事由或為MiniMax未經授權使用了愛奇藝享有版權的素材進行模型訓練,目前正在走司法程序。對此,愛奇藝回復字母榜,確認案件正在審理中。MiniMax則尚無正式回應。
就在去年9月MiniMax剛剛推出視頻大模型時,其創始人閆俊杰對字母榜表示,MiniMax用于訓練的數據,除了語料公司的高質量數據,還有部分采購來的平臺化數據。
圖注:MiniMAX創始人閆俊文介紹海螺AI圖源:字母榜拍攝
大公司也屢屢因版權陷入糾紛。去年8月,OpenAI被超過100位YouTube主播集體訴訟,指控其擅自轉錄數百萬個YouTube 視頻來訓練大模型。英偉達、蘋果、Anthropic等巨頭也涉及其中。OpenAI的前任CEO Mira,曾在采訪中被記者提問是否拿YouTube的視頻訓練Sora,Mira選擇了拒絕回答。
雖然OpenAI已經和Politico、《大西洋月刊》《時代》《金融時報》等簽訂了付費協議用于訓練,但這類授權都屬于文字領域,陳臨告訴字母榜,在Sora視頻的訓練協議中,“OpenAI還沒有簽過相應的協議?!?/p>
數據、算法和算力是AI大模型的三大支柱,其中數據更是大模型進行訓練的根本??梢哉f,生成式AI的繁榮是建立在數據規模之上的。訓練數據越多,模型就越強大。數據賦予模型用于學習和思考的海量知識,數據也成了模型廠商技術壁壘的一部分。
不像BAT們,在圖文時代、移動互聯網時代早已積攢起巨量的私域數據庫,并且這些數據早已被不同平臺瓜分。晚來的大模型六小龍,被重重壁壘所環繞。
一旦愛奇藝的訴訟成功,或許預告著一場更大規模的大模型版權糾紛時代的來臨。
“愛奇藝成功了,優酷、騰訊視頻也可能會起訴,”陳臨表示,這無疑是兜頭澆了狂奔中的大模型公司們一盆冷水。對于獨立進行大模型訓練的公司來說,“視頻要版權費,圖片也要版權費,文字可能也要版權費,致使AI的訓練成本會比現在高出許多?!?/p>
如今,孰是孰非暫無定論,只是可以肯定的是,大模型的狂飆路上,正在豎起一面新的版權墻。
01
國內AI視頻生成第一個侵權案,已經出現了。
近日,據外媒報道,MiniMax被指控未經授權使用愛奇藝享有版權的素材進行模型訓練,愛奇藝已向上海市徐匯區人民法院提起訴訟,要求MiniMax立即停止侵權行為,并索賠約10萬元人民幣。
去年8月底,MiniMax推出視頻大模型,用戶登錄海螺AI就能體驗MiniMax的視頻生成模型。根據AI產品榜數據,去年9月,海螺AI搜索熱度暴漲,海螺AI網頁版9月訪問量增幅達860%,一舉登頂2024年9月全球及國內AI應用增速榜首。
不過,加入“追平Sora”大軍的MiniMax,也如同OpenAI被《紐約時報》起訴一樣,撞上了版權墻。
根據我國法律規定,生成式人工智能服務提供者必須采用“合法來源”的數據和基礎模型,以確保不侵犯他人的知識產權。
《互聯網法律評論》主編張穎告訴字母榜,在這場民事訴訟中,愛奇藝起訴,需要證明MiniMax存在未經其允許的情況下使用愛奇藝數據訓練,并且在生成內容中包含了其版權內容。此外,愛奇藝還需要證明被告在主觀上有過錯?,即故意或者未盡到注意義務。
也就是說,海螺AI的“侵權”存在兩種可能。
一種可能是MiniMax海螺AI視頻生成的訓練中,未經授權使用了愛奇藝享有版權的素材內容。
另一種可能,則是用戶使用海螺AI時,未經愛奇藝授權,上傳了版權素材做AI“魔改”。
圖注:AI魔改視頻,下方都備注內容疑似用AI技術合成圖源:字母榜截圖
《甄嬛傳》變槍戰片、《紅樓夢》變武打劇,用AI視頻工具就能讓爾康喝啤酒、甄嬛啃漢堡、林黛玉抄起加特林。陳臨表示,以上這些AI“魔改”經典影視劇的小視頻,都在社交平臺得到數百萬的播放量。
這些“沒有邏輯,只有搞笑”的AI“魔改”視頻,大多沒有授權,“部分是大模型公司推廣產品時,委托第三方投流公司的作品,更多的則是用戶的無厘頭腦洞。”去年12月,廣電網絡視聽司也發布了《管理提示》,提出要排查清理AI“魔改”影視劇的短視頻。這意味著生成式AI將面臨更細致的內容審核。
而作為被起訴方,如果MiniMax想證明自己沒有侵權,大概需要證明自身數據來源、生成內容與愛奇藝無關,或者沒有故意侵權。
在海螺AI的用戶協議中,也要求用戶保證不利用平臺制作的內容或用于相關用途,包括“未經授權自行剪切、改編電影、電視劇、網絡影視劇等各類視聽節目及片段”。
不過,值得注意的是,“10萬元賠償金對愛奇藝來說太少了?!睆埛f表示,盡管缺乏愛奇藝的起訴書作為依據,但從金額來看,推測MiniMax的侵權情況可能并不嚴重,雙方和解的可能性很大。 走向和解,對于MiniMax來說,不管是照價賠償10萬元,還是交上一筆不菲的版權費,都似乎免不了為版權墻“破財”了。
02
實際上,“國內AI從業者對于訓練數據沒有很高的版權意識,通常認為版權會阻礙AI訓練?!?/p>
離開某大廠開始AI應用創業后,陳臨發現,國內主動要求版權授權的AI訓練公司似乎并不多。原因不僅在于本身便高昂的AI訓練成本,也是由于一旦視頻、圖片,甚至文字都需要版權,對于AI創企來說,“模型就沒法訓練了。”
不少AI創企做視頻生成訓練的第一步,正是“從網上扒視頻訓練”。
為了規避版權風險,企業會通過關鍵詞過濾,盡量避免用戶輸入比如米老鼠這種版權字眼,來減少生成侵權內容。
圖注:以即夢AI為例,AI視頻生成自動過濾關鍵詞圖源:陳臨提供
新壹科技CEO雷濤告訴字母榜,作為To B的AIGC視頻生成公司,新壹科技用來訓練AI視頻大模型的數據,來自此前在秒拍、小咖秀等應用的數據積累,還有定向合作數據庫,以及依托原算法訓練的“從無到有”的素材。但只有AI視頻生成的足夠真實,才能起到訓練效果。
而對于既沒有攢夠數據,又付不起定向合作版權費的AI創企而言,想要坐上牌桌,撞上版權墻,或早或晚,都是必然的結果。
不過,這種爭議并不是新鮮事。
在圖文時代,圖片版權的糾紛一度讓創作者們“不敢配圖”。有自媒體大V被告知,歷史文章中有數十張來自搜索引擎的圖片涉嫌侵權,在刪除全部原創文章后,還支付了不菲的侵權費用于和解。有攝影師使用了自己拍攝的173張照片進行配圖,卻被視覺中國提起訴訟,指其侵權。
如今,輪到AI站上了被告席。
在國內,去年6月,4名畫師起訴小紅書AI大模型“Trik AI”侵權,這是國內第一起AI模型訓練數據集體侵權的案件,如今訴訟正在進行。
在國外,Meta、OpenAI都曾陷入版權糾紛。
去年4月底,《紐約每日新聞》《芝加哥論壇報》等美國八家知名報紙聯合起訴OpenAI和微軟,指控它們未經允許使用數百萬篇版權新聞文章訓練其AI聊天機器人。為此,OpenAI 與 Politico、《大西洋月刊》《時代》《金融時報》等新聞出版商達成付費協議,來使用并引用版權新聞文章。
早在2023年5月,OpenAI首席執行官奧特曼便公開承認,AI公司在不久的將來會耗盡互聯網上所有的數據。2024年6月,研究機構Epoch AI也發布研究預測,可用于AI語言模型公開訓練的數據,將在2026年到2032年間,被科技公司耗盡。
對于大模型創企來說,高質量的數據永遠稀缺,大模型公司間的算力戰、應用戰,也將拓展到數據戰。
只是OpenAI的訴訟或許傳達出了明確的信號,高質量的訓練數據不是免費的。對于大模型創企而言,不像Meta、BAT等公司,早已積累起近20年的社交媒體數據,它們或許只能“花錢開路”。
03
不過,想要解決版權這個絆腳石,大模型公司們需要回答一個問題,錢從哪里來?
對于尚未盈利的大模型創企而言,投資人的錢袋子越來越緊了。
根據字母榜統計,大模型六小虎(包括零一萬物、MiniMax、百川智能、智譜AI、階躍星辰、月之暗面)中,2024年有五家拿到億元級融資。目前,智譜、月之暗面、百川智能、階躍星辰的估值均已超200億元。
但根據《智能涌現》報道,隨著估值跨上200億元臺階,國內大模型公司最新的單輪次融資規模將卡在50億元左右。即估值越高,融資越難。根據華興資本數據,2024年前三季度國內全市場投融資總額為2603億元,不及近三年同期的40%。
以月之暗面為例,2024年2月份A+輪完成超10億美元融資,投后估值一路漲至25億美元。隨后的8月,首輪參投的小紅書、美團龍珠、紅杉中國已不見身影,月之暗面B輪的融資額為超3億美元。風波中的MiniMax,則在去年3月拿到6億美元B輪融資后,暫未等來新的融資消息。
對于大模型創企們而言,“等錢開干”的緊迫性無異于等米下鍋。
等來的數十億元融資,大模型創企不僅要分給持續堆參數的模型訓練,還要分給需要上億元投流燒錢營銷的AI應用,能留給大模型購買版權的錢,并不富裕。
而大模型創企的靈魂拷問遠不止版權糾紛這一點,高昂的研發投入和頗為有限的商業變現,才是懸在“六小虎”頭頂的達摩克利斯之劍。
馬斯克曾估算,GPT-5的訓練成本是3萬-5萬張H100,僅芯片成本就超過7億美元(約合50億元)。目前六小虎的收入均未透露,僅根據外媒爆料,MiniMax預計年收入7000萬美元。目前看來,哪怕是已經在海外靠Talkie賺到錢的MiniMax,也難以在短期內實現營收打正。
大模型水溫轉涼,最先感知到的或許是撲騰其中的從業者。
“有一家大模型公司裁員后人數已經降到500人,另一家直接放棄了預訓練和C端市場,剩下的幾家幾乎進入靜默狀態,不再開放HC(招聘名額)了?!?/p>
陳臨告訴字母榜,2024年年底幾乎已經拿不到70w+的AI offer了。2023年只要有AI相關經驗,就能有面試機會,現在過去一年,不僅要求有落地經驗,漲薪幅度也打了折扣。目前除了北京之外,其他城市的AI崗位招聘也是少的可憐。
可以肯定的是,2025年想要繼續留在牌桌上的大模型創企們,在模型訓練過程中為版權付費只是第一步,降本不是長久之計,想法子賺錢增效,才是關鍵。
(文中陳臨為化名)
撰文:馬舒葉 編輯:王靖
本文由人人都是產品經理作者【字母榜】,微信公眾號:【字母榜】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!