如何避免ChatGPT“騙人”?AIGC新規成了及時雨

0 評論 3659 瀏覽 3 收藏 22 分鐘

在ChatGPT引發全球范圍內的討論熱潮之后,有關AI管理、AI服務規范化的問題也被提上了日程,不少用戶在體驗過程中也感受到了AI的“失控”瞬間。這驅使著AI人工智能服務的規范管理盡快提上日程。一起來看看作者的分析和解讀。

ChatGPT在全球范圍掀起的AI熱潮正在引發越來越多的討論,AI該如何管理?AI該如何發展?一系列問題都成為人們熱議的焦點。此前,馬斯克等海外名人就在網絡上呼吁OpenAI暫停ChatGPT的模型訓練和迭代,等待企業與政府討論出一套行之有效的管理方法后再繼續。

顯然,此舉遭到了OpenAI的反對,不過OpenAI也認可馬斯克的部分說法:“AI確實需要管控”,在一次訪談中,OpenAI的創始人之一更是直言自己有時候會對ChatGPT感到恐懼,AI確實有可能對人類造成威脅。

當我們驚嘆于ChatGPT的強大時,確實不該忘記AI技術發展所帶來的“可能威脅”。4月11日,國家互聯網信息辦公室發布了關于《生成式人工智能服務管理辦法(征求意見稿)》的公開征求意見通知,國內有關生成式人工智能的第一個管理條例來了。

以下為《生成式人工智能服務管理辦法(征求意見稿)》的原文。

第一條 為促進生成式人工智能健康發展和規范應用,根據《中華人民共和國網絡安全法》《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》等法律、行政法規,制定本辦法。

第二條 研發、利用生成式人工智能產品,面向中華人民共和國境內公眾提供服務的,適用本辦法。本辦法所稱生成式人工智能,是指基于算法、模型、規則生成文本、圖片、聲音、視頻、代碼等內容的技術。

第三條 國家支持人工智能算法、框架等基礎技術的自主創新、推廣應用、國際合作,鼓勵優先采用安全可信的軟件、工具、計算和數據資源。

第四條 提供生成式人工智能產品或服務應當遵守法律法規的要求,尊重社會公德、公序良俗,符合以下要求:(一)利用生成式人工智能生成的內容應當體現社會主義核心價值觀,不得含有顛覆國家政權、推翻社會主義制度,煽動分裂國家、破壞國家統一,宣揚恐怖主義、極端主義,宣揚民族仇恨、民族歧視,暴力、淫穢色情信息,虛假信息,以及可能擾亂經濟秩序和社會秩序的內容。(二)在算法設計、訓練數據選擇、模型生成和優化、提供服務等過程中,采取措施防止出現種族、民族、信仰、國別、地域、性別、年齡、職業等歧視。(三)尊重知識產權、商業道德,不得利用算法、數據、平臺等優勢實施不公平競爭。(四)利用生成式人工智能生成的內容應當真實準確,采取措施防止生成虛假信息。(五)尊重他人合法利益,防止傷害他人身心健康,損害肖像權、名譽權和個人隱私,侵犯知識產權。禁止非法獲取、披露、利用個人信息和隱私、商業秘密。

第五條 利用生成式人工智能產品提供聊天和文本、圖像、聲音生成等服務的組織和個人(以下稱“提供者”),包括通過提供可編程接口等方式支持他人自行生成文本、圖像、聲音等,承擔該產品生成內容生產者的責任;涉及個人信息的,承擔個人信息處理者的法定責任,履行個人信息保護義務。

第六條 利用生成式人工智能產品向公眾提供服務前,應當按照《具有輿論屬性或社會動員能力的互聯網信息服務安全評估規定》向國家網信部門申報安全評估,并按照《互聯網信息服務算法推薦管理規定》履行算法備案和變更、注銷備案手續。

第七條 提供者應當對生成式人工智能產品的預訓練數據、優化訓練數據來源的合法性負責。用于生成式人工智能產品的預訓練、優化訓練數據,應滿足以下要求:(一)符合《中華人民共和國網絡安全法》等法律法規的要求;(二)不含有侵犯知識產權的內容;(三)數據包含個人信息的,應當征得個人信息主體同意或者符合法律、行政法規規定的其他情形;(四)能夠保證數據的真實性、準確性、客觀性、多樣性;(五)國家網信部門關于生成式人工智能服務的其他監管要求。

第八條 生成式人工智能產品研制中采用人工標注時,提供者應當制定符合本辦法要求,清晰、具體、可操作的標注規則,對標注人員進行必要培訓,抽樣核驗標注內容的正確性。

第九條 提供生成式人工智能服務應當按照《中華人民共和國網絡安全法》規定,要求用戶提供真實身份信息。

第十條 提供者應當明確并公開其服務的適用人群、場合、用途,采取適當措施防范用戶過分依賴或沉迷生成內容。

第十一條 提供者在提供服務過程中,對用戶的輸入信息和使用記錄承擔保護義務。不得非法留存能夠推斷出用戶身份的輸入信息,不得根據用戶輸入信息和使用情況進行畫像,不得向他人提供用戶輸入信息。法律法規另有規定的,從其規定。

第十二條 提供者不得根據用戶的種族、國別、性別等進行帶有歧視性的內容生成。

第十三條 提供者應當建立用戶投訴接收處理機制,及時處置個人關于更正、刪除、屏蔽其個人信息的請求;發現、知悉生成的文本、圖片、聲音、視頻等侵害他人肖像權、名譽權、個人隱私、商業秘密,或者不符合本辦法要求時,應當采取措施,停止生成,防止危害持續。

第十四條 提供者應當在生命周期內,提供安全、穩健、持續的服務,保障用戶正常使用。

第十五條 對于運行中發現、用戶舉報的不符合本辦法要求的生成內容,除采取內容過濾等措施外,應在3個月內通過模型優化訓練等方式防止再次生成。

第十六條 提供者應當按照《互聯網信息服務深度合成管理規定》對生成的圖片、視頻等內容進行標識。

第十七條 提供者應當根據國家網信部門和有關主管部門的要求,提供可以影響用戶信任、選擇的必要信息,包括預訓練和優化訓練數據的來源、規模、類型、質量等描述,人工標注規則,人工標注數據的規模和類型,基礎算法和技術體系等。

第十八條 提供者應當指導用戶科學認識和理性使用生成式人工智能生成的內容,不利用生成內容損害他人形象、名譽以及其他合法權益,不進行商業炒作、不正當營銷。用戶發現生成內容不符合本辦法要求時,有權向網信部門或者有關主管部門舉報。

第十九條 提供者發現用戶利用生成式人工智能產品過程中違反法律法規,違背商業道德、社會公德行為時,包括從事網絡炒作、惡意發帖跟評、制造垃圾郵件、編寫惡意軟件,實施不正當的商業營銷等,應當暫?;蛘呓K止服務。

第二十條 提供者違反本辦法規定的,由網信部門和有關主管部門按照《中華人民共和國網絡安全法》《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》等法律、行政法規的規定予以處罰。法律、行政法規沒有規定的,由網信部門和有關主管部門依據職責給予警告、通報批評,責令限期改正;拒不改正或者情節嚴重的,責令暫?;蛘呓K止其利用生成式人工智能提供服務,并處一萬元以上十萬元以下罰款。構成違反治安管理行為的,依法給予治安管理處罰;構成犯罪的,依法追究刑事責任。

第二十一條 本辦法自2023年 月 日起實施。

從內容來看,目前還只是一個初步的管理條例,對應的處罰及法律依據來自此前發布的《中華人民共和國網絡安全法》《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》等法律、行政法規。

看到管理條例的發布,不少網友都持肯定態度,AI的發展速度之迅猛超出了許多人的預料,并且已經開始對社會造成明顯的影響,確實需要對AI的發展與使用做出管理,避免對社會造成嚴重的危害。

不過也有網友認為,這份“管理辦法”的一些條例,或許會讓中國企業在AI賽道的競爭力減弱,因為其中的一些要求對于目前的AI模型來說,是很難確保100%符合規定的,勢必讓企業在開發過程中畏手畏腳。

現如今的AI,是否已經到了必須管控的地步呢?

一、“撒謊”的AI

在前段時間,我先后體驗和測試百度的文心一言與阿里巴巴的通義千問,作為國內首批開展內測的對話式AI大模型,兩者在體驗上雖然不如ChatGPT 4.0,不過也已經具備一定的能力,從測試結果來看也是各有千秋。

但是,不管是文心一言還是通義千問,都無法避免在一些回答中“撒謊”,或者換個說法,現階段的AI模型基本上避免不了根據已有信息生成虛構內容的問題,即使是ChatGPT 4.0也是如此。

甚至從測試來看,ChatGPT的虛構信息能力要遠超文心一言等較低等級的AI對話模型,有興趣的朋友可以在知乎、B站等平臺搜索相關內容,可以輕松查詢到不少ChatGPT一本正經地胡說八道的記錄。

在知乎上,用戶@何學源 就展示了ChatGPT是如何從0開始編造自己的人生經歷的,只需要給ChatGPT一定的關鍵詞,AI就會依據關鍵詞進行信息編造,將一些完全杜撰或是不屬于本人成就的信息拼接到一起,生成一份回答。

如何避免ChatGPT“騙人”?AIGC新規成了及時雨

圖源:知乎

從提供的ChatGPT對話截圖來看,AI不僅是生成了一系列編造的個人信息,在用戶要求提供相關的引用論文和文章時,AI更是直接生成了一系列不存在的網絡鏈接與論文標題,給用戶@何學源 帶來一些小小的AI震撼。

如何避免ChatGPT“騙人”?AIGC新規成了及時雨

圖源:知乎

在我的測試中,文心一言也有類似的問題,比如我在詢問它:“吃西瓜為什么不吐葡萄皮”時,文心一言不僅將西瓜與葡萄的關系混淆,甚至將歸屬于葫蘆科的西瓜變成了“葡萄科”的,接下來的內容都基于西瓜與葡萄是同一樣水果的邏輯進行解答,以至于錯漏百出。

只是相對于ChatGPT能夠以假亂真的“撒謊”行為來看,具有一定知識儲備的人可以輕松辨認出文心一言回答中的問題。但是,如果未來的文心一言經過迭代進步后達到ChatGPT的同等水平,人們又該如何分辨其中的問題?

再進一步,如果有人不懷好意地讓AI故意生成“謠言”,又該如何解決?實際上,互聯網上已經出現了不少利用AI生成的圖片、文字來進行詐騙、造謠的案例,前段時間就有人利用AI生成的模特圖片進行網絡詐騙,甚至還成功騙到了不少人。

圖源:微博

在我看來,對于AI的管控確實應該提上日程,不僅僅是國內在緊鑼密鼓地籌備相關法例法規,美國也將在近期召集微軟、谷歌、OpenAI等一系列相關企業,探討對AI的約束與規定,使其在使用和發展的過程中不會侵犯用戶的合法權益。

正是出于對AI的“撒謊”能力擔憂,《生成式人工智能服務管理辦法(征求意見稿)》中就明確寫明了“利用生成式人工智能生成的內容應當真實準確,采取措施防止生成虛假信息?!?,同時也使該條例引起了許多網友的爭議。

但就目前的AI能力來說,想要滿足“真實準確”的難度非常高,前面提到過ChatGPT都無法做到,國內的AI則更是如此。嚴格來說,甚至連人類自己其實也無法做到所有的回答、信息都真實準確,我們的記憶會出錯,對知識點、新聞的理解會出錯,而且網絡上本就充斥著大量的虛假信息,以網絡數據訓練出來的AI顯然不可避免地受其影響。

有網友甚至直言:“如果哪一天AI能夠完美規避錯誤答案,生成100%準確且真實的回答,那么人類就該擔心自己了”,言下之意就是這種程度的AI已經不再是普通的工具,而是具備獨立思維且擁有強大能力的“超級生命”。

當然,目前的AI離我們設想中的“完美AI”還有著非常遙遠的距離,但是對于AI“謊言”的管控確實該提上日程了。不過,一些網友則認為不應該對AI的回答準確率過早地做出嚴苛規定,否則以目前的錯誤率來看,國內的所有AI模型都可以停止對外運營。

實際上,這些網友的發言多少有點危言聳聽,對于阿里、百度等企業來說,處理錯誤答案與內容一直都是AI模型迭代中的重要工作,文心一言和通義千問在問答框中都有設置一鍵反饋按鈕,可以輕松對錯誤回答進行標記,幫助完善AI模型。

而且,從條例的細則來看,對企業的要求是在3個月采取措施修正生成錯誤回答的AI模型,確保同樣的錯誤不會再次發生,實際上也是給了企業不少的處理時間。對于阿里和百度來說,如果3個月都無法處理一個明顯的錯誤,那么或許該考慮一下是不是有工程師在“摸魚”了。

二、入局AI市場的門檻將更高

從條例本身來看,不少要求與規范其實都是AI企業已經在做的事情,比如對錯誤答案進行優化、限制非法內容的輸出等。在文心一言和通義千問上,對于違規或非法的問題基本上都只會得到一個類似的回復:“我是一個人工智能語言模型,無法對xxxx進行評價。我的目的是提供客觀和準確的信息,幫助人們解決問題”。

ChatGPT同樣如此,如果你使用的是通過官網API接口提供的服務及NEWBING,那么在涉及暴力、血腥、色情等方面的提問時,AI都會直接結束當前話題并提示用戶應該更換一個話題。

對于AI的規制其實一直都存著,公開的AI平臺本就不是法外之地,不少企業也在探討對AI模型進行修改,使其生成的圖片、視頻、音頻會自動附加可用于快速識別的標記,用以在網絡上對相關的AI生成內容進行快速標識。

圖源:網絡

在我看來,對AI行業最大的影響是切實地提高了入門門檻,隨著ChatGPT的大火,國內開始涌現出大量的AI企業和項目,除了阿里、百度、華為等科技巨頭外,還有不少的小企業和個人也在宣傳自己的項目,使得國內的AI市場變得十分混亂。

此次條例實施后,對于AI企業的規模、反饋處理等能力都提出了更高的要求,對于目前的大廠來說,滿足以上要求并不困難,倒不如說已經在做了。實際上,更大的難點在于訓練數據的獲取,目前的AI模型基本都是通過爬蟲等手段,大量抓取網絡信息進行訓練迭代。

由此引發了不少網友的指責,認為AI企業在訓練中使用了未經過授權的用戶個人數據,侵犯了個人隱私,意大利政府此前就公開要求ChatGPT完善數據爬取方式,以確保不會擅自使用未經授權的數據。

此外,三星此前也發布公告,要求嚴格管控企業內部的ChatGPT使用情況,避免企業機密外泄,因為ChatGPT將三星部分員工輸入的機密數據作為訓練數據,上傳到了ChatGPT的數據庫中,導致其他用戶可以通過問答的方式獲取這些數據,直接影響到三星的企業安全。

為了確保公民信息及個人數據的安全,未來AI企業在隱私保護等方面需要花費更多的成本來完善相關的保障系統。而且,對訓練數據的嚴格規范也會直接影響到AI企業的訓練成本,此前華為就聲稱,開發和訓練一個AI的成本高達1200萬元美元,而且還不包括后續的硬件、數據投入。

隨著相關管理的規范化,AI訓練的成本或許會將多數中小企業拒之門外,對于個人和中小企業來說,使用阿里等開放式AI訓練平臺將會是未來的主流。

編輯:TSknight;來源:雷科技互聯網組

來源公眾號:雷科技(ID:leitech),聚焦科技與生活。

本文由人人都是產品經理合作媒體 @雷科技 授權發布。未經許可,禁止轉載。

題圖來自 Unsplash ,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!