精品久久久久中文字幕日本 ,久久精品国产亚洲7777

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

AIGC“弄臟”互聯網，大模型“課本”遭污染

元宇宙日爆

2023-08-04

0 評論 1357 瀏覽 4 收藏

11 分鐘

AIGC的相關內容正在互聯網上泛濫，而在這一趨勢下，一些無意義、同質化的內容也開始出現，甚至對中文互聯網造成了“污染”。具體如何解讀這一現象？不妨一起來看看作者的分析和總結吧。

“AI制造”充斥互聯網，連“真人小姐姐”也可以批量生成。隨著生成式人工智能的爆發，一個可怕的現象出現：AI正在污染整個互聯網。

知乎成為生成無腦答案的重災區，這些內容描述簡短、概括性十足，細看邏輯混亂、錯誤百出。打開今日頭條，用ChatGPT生成的虛假新聞，內容聳人聽聞，足夠博人眼球。

AI加持下，虛假、無意義、同質化的內容呈指數級增長，獲得大量曝光。萊斯大學和斯坦福大學的科學家研究發現，這些低質、同質化、未經證實的“AI語言”如果不加以甄別，進一步被抓取作為訓練AI的語料，AI大模型將會走向崩潰。

一、AIGC“垃圾”泛濫，內容平臺成重災區

生成式AI越來越低成本化，伴生而來的是AI生成信息的“垃圾網站”。

外媒NewsGuard發布相關數據報告稱,目前已經追蹤到了大約277個且還在不斷增加的“垃圾網站”，這些網站生產了大量標題誘餌以優化廣告收入。

類似的情況也發生在國內，表現形式是AI生成的低質內容。

“中文互聯網高質量的問答社區和創作者聚集的原創內容平臺”知乎，如今成了AI無腦答案的重災區，不少答主的內容呈現明顯的“GPT風”，機器翻譯的文字感、混亂的邏輯撲面而來，有時還會出現事實錯誤，特別是在金融、醫學等專業領域，沒有經驗的人群很容易被誤導。

AIGC“弄臟”互聯網大模型“課本”遭污染

知乎上的“片兒湯話”答案

有知乎用戶使用AI每隔一兩分鐘就可以輸出一條幾百字的回答。盡管已經被禁言，但其產生的錯誤信息依然遺留在互聯網中。如果你足夠細心，你會發現，自帶AI問答功能的搜索引擎Bing在中文世界經常會引用知乎的內容。一些生成后就從未過人工核查的錯誤答案被Bing AI抓取，造成低質的中文信息蔓延。

AI對互聯網內容的侵蝕不僅限于文字。在小紅書、淘寶、抖音上，越來越多的“AI真人美女”的圖片和視頻被批量生產，還有大批“AI攝影”類賬號的出現。

AI魔法棒一揮，制作成本低、效率高的“AI美女”一時間成為電商眼中的香餑餑，AI模特、AI主播頻頻出現?！八齻儭弊銐蛭?，但也千篇一律，“網紅臉”的隊伍里又增加一類AI面孔。

如果只是用AIGC制造美圖供人評鑒、學習倒也還好，但AI生圖工具產生的內容開始侵犯直接與人們生活相關的領域。

淘寶上，有商家直接用AI生成圖來取代商品實物圖，一張由Midjourney生成的卡通少女圖，被商家打上“綠色襯衫”的標簽，售價218元。與之風格相似甚至完全相同的AI生成圖，在網上隨手就可以找到。利用Midjourney的墊圖功能，任何人都可以自己生成無數仿照圖，與賣家秀相差甚遠的買家秀將再添槽點。

AIGC“弄臟”互聯網大模型“課本”遭污染

淘寶商家用AIGC網圖（右）描述商品

在中文互聯網，AI大有無孔不入之勢，專門教人如何用“AI寫文賺錢”的課程層出不窮，賣課人號稱“一套教學視頻跟萬能模板，直接套用”。AI話題營造出的失業焦慮中，該類課程受到追捧，曾有人通過賣課月入百萬。

如今，學會了使用AI工具的人，將AI生成的內容上傳到知乎、今日頭條或者小紅書上，吸引了流量，但也制造了不少低質量、同質化甚至信息虛假的內容垃圾。

那么，這種AIGC內容“垃圾”會產生危害嗎？

二、靠AI識別真假，技術還不行

泛濫的AIGC內容加速污染互聯網環境，除了影響人類獲取有效信息的效率外，產出它們的工具“大語言模型”也會走向崩潰的邊緣。

萊斯大學和斯坦福大學的科學家研究證明，將人工智能生成的內容輸入人工智能模型，會導致輸出質量下跌。

研究人員將這一現象解釋為“模型自噬障礙”（MAD），即如果AI只學習其他AI生成的內容，在經過幾代訓練后，AI將輸出無意義的垃圾信息，最終走向“模型崩潰”這一結果。研究人員表示，對于大語言模型而言，“數據清潔”十分重要。

“世界正在奔向一個未來：生成式AI的爆發，導致了互聯網上的合成數據很快就會超過真實數據?！卑凑昭芯空叩恼f法，區分合成數據與真實數據，無論對人類本身還是大模型發展都變得勢在必行。

最近，中國首個AIGC監管文件《生成式人工智能服務管理暫行辦法》落地，該《辦法》明確指出AIGC服務提供者要“增強訓練數據的真實性、準確性、客觀性和多樣性”。

AIGC“弄臟”互聯網大模型“課本”遭污染

生成式人工智能服務者有義務保證數據質量

在《辦法》的指導下，國內的內容平臺也推出針對AI生成內容的管理措施，知乎、抖音、小紅書等平臺均已發布有關AIGC內容的規定。

《抖音關于人工智能生成內容的平臺規范暨行業倡議》稱，針對人工智能生成的視頻、圖片和衍生的虛擬人直播，發布者應對人工智能生成內容進行顯著標識，幫助其他用戶區分虛擬與現實，特別是易混淆場景。該《倡議》提到，平臺提供統一的人工智能生成內容標識能力，幫助創作者打標，方便用戶區分。同時，平臺提供用戶反饋渠道，方便用戶反饋違規的生成內容。

知乎也發布了《關于應用AIGC能力進行輔助創作的社區公告》，公告顯示，如果創作者發布AIGC生成的內容時，沒有主動使用“包含AI輔助創作”的標簽進行聲明，平臺會添加相關標識并限流，同時鼓勵知友對利用AIGC技術，擾亂社區秩序的內容和賬號進行舉報，舉報類型里新增了“AI生成內容”的選項。

規則出現了，但在實操中出現了Bug。

AIGC“弄臟”互聯網大模型“課本”遭污染