av黄色在线观看,亚洲av无码一区二区三区天堂

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

AI：連漫畫都看不懂，談什么毀滅世界？

腦極體

2017-11-23

4 評論 3714 瀏覽 3 收藏

9 分鐘

任何事物都有其局限性，AI也并非無所不能。

作為一個AI垂直自媒體的作者，我工作中的很大一部分就是替AI“帶路”，然后告訴人類讀者們，你們的這項和那項工作都要被AI替代了。

一直以來，人類似乎都站在一個毫無還手之力的弱勢地位，或許未來真的像一些悲觀者想象中那樣，我們有AI司機、AI售貨員、AI詩人，但人類自己卻成了可憐的乞討者。

直到今天，我第一次發現有一項工作AI在一段時間以內都無法超越人類，而這次勝利屬于二次元——不會被AI代替的工作，是漫畫家。

連漫畫都看不懂，談什么毀滅世界？

漫畫家不會AI代替的原因很簡單，因為馬里蘭大學的一位教授進行了一項研究，最終發現AI根本看不懂漫畫。

以上是一則非常簡單的四格漫畫，對于人類來說理解起來非常容易：小貓在思考創作素材，然后發現了小狗，要求小狗講個笑話，小狗說“你很漂亮”導致小貓非常憤怒。

實際上，在最后一個畫面中，小狗沒有入鏡，而“你很漂亮”本來是表揚，要和上一個畫面中的“笑話”連接起來，才能解釋出小貓的情緒。

對于AI來說，理解這些呈現在畫面之外的信息，簡直太困難了。

在馬里蘭大學的實驗中，研究者搭建了一個由120萬張漫畫畫格組成的數據集，并提取出了每個畫格中的文本，利用LSTM模型，希望AI能對漫畫進行一個連貫的了解。

關于LSTM（長短期記憶網絡）此前已經介紹過很多，這一模型的特點就是加入了記憶的概念，可以處理和預測時間序列較長元素。雖然在長文本、機器翻譯等等方面表現的都不錯，但在看漫畫這件事上，LSTM徹底挫敗了。

在經過大量訓練后，研究人員給了AI一組以前沒見過的漫畫，要求AI理解并預測下一個畫面中的文字信息或畫面內容，結果AI的成績一塌糊涂。而人類的預測正確程度，通常能達到80%的正確率。

視覺敘事？何必強人工智能所難

嚴格來說，漫畫這種東西屬于“視覺敘事”——把信息隱藏于圖像之中。同樣是視覺敘事，AI理解電影就比理解漫畫容易的多，電影的主角是人，而人臉長的都是一個樣子，想要訓練AI讀出人臉表情、識別情緒是件很簡單的事，更何況電影還會有詳細的劇本。

但漫畫最大的特點，就是視覺上不具有連貫性。就像上文的四格漫畫一樣，第三張圖小狗還在畫面中，第四張圖就不在了。人類可以很快的理解到，名為淡定狗的小狗扔下一句話就淡定的離開。可對于AI來說，讀出這種在畫面和文字之外的信息實在是強人工智能所難。

其次，不同漫畫的繪畫、敘事風格迥異，對于AI的訓練來說也是個難點。簡單的四格漫畫中，每一格的場景都是相同的，可在其他漫畫中，可能這一格是打斗的場景，下一格就是一張憤怒的人臉。能看懂四格漫畫AI，再去看那種有鏡頭切換感的漫畫，也是一頭霧水。至于畫風方面，不同漫畫家對于人臉描繪方式都有很大差異，換成AI來理解，難度又會加大了。

還有一點，視覺敘事這件事是建立在“邏輯”和“常識”兩個概念基礎之上的。比如小貓說講個笑話，小狗說“你好漂亮”，理解這個情節就需要“你說我漂亮是笑話=你說我丑”這一基礎的邏輯。又比如哆啦A夢中常見的老鼠梗也需要“貓通常不怕老鼠”這一基礎常識。這些東西對于人類來說都很簡單，可是AI是不具備這些常識和邏輯概念的，我們也不能像編百科全書那樣，把這些概念灌輸到AI的大腦之中。

圍棋界的大手，到了甄嬛傳里也是一集死

其實結合AI在圍棋領域的勝利和在漫畫上的失敗，我們可以看出，AI在完全信息信息領域中的表現和不完全信息領域中的表現完全不同。

完全信息本來是經濟學中的一個屬于，意思是參與者可以理解整個市場的所有信息。在這里，我們可以看做一項工作的數據集。在圍棋這項工作中，所有的信息都可以歸納為數據集：游戲的規則、每一步的打法。可在漫畫中，我們最多能把畫面中做上詳細的標注，把文本信息都提取出來?？呻[藏在圖片文字之外的邏輯關系、常識等等只可意會不可言傳的東西，是無法向AI提供的。

而AI做的最差的，就是read between the lines。

以此類推，AI在戲劇、歇后語、四國軍棋的暗棋（一種包含了欺騙的軍旗玩法）包括談戀愛等等一切充滿了不完全信息、欺騙與反欺騙、解讀意象、常識和邏輯的游戲中表現都不會太好。

這么看來，AI有點像《三體》里初期的智子，不會隱藏自己的想法，也不能明白隱瞞、欺騙這種概念。所以，我們真的不必對AI的勝利感到恐懼，它會是辦公室里人緣最差的那位同事和后宮里一集死的路人，某一項能力的突出并不能彌補它在不完全信息方面的短板。更何況意象、類比、反諷、隱喻這種東西，是人類最擅長的手段。

我相信，未來世界最好的樣子一定是人類和AI各司其職，做各自最擅長的事情。在視覺敘事這類AI特別不擅長的事情上，它們依然能給人類提供很多幫助。

比如用生成對抗神經網絡創造人物形象、用監督學習+卷積網絡來為線稿上色、甚至開發一款會自動放大文字的漫畫閱讀App。這些并不是幻想，而是正在發生的現實。當這些繁復的機械勞動被AI代勞后，我們也就能更多的投入到自己擅長的事情中來：利用不完全信息環境講好更多故事，讓這個世界保持應有的趣味。

本文由 @腦極體原創發布于人人都是產品經理。未經許可，禁止轉載。

題圖來自Pixabay，基于CC0協議

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App

腦極體

從技術協同到產業革新，從智能密鑰到已知盡頭

321篇作品 1232914總閱讀量

9字心法談產品架構該怎么設計？

03-226855 瀏覽

產品周報272期 | OpenAI 推出自定義版 ChatGPT，支付寶生活號全面開放UGC入口

11-102206 瀏覽

開收199元會員費，東方甄選是不是太急了？

10-201150 瀏覽

10分鐘騙走430萬，如何提防詐騙新技術？

05-26956 瀏覽

微信對公眾號廣告收“過路費”，不走官方互選平臺將被嚴懲？

05-292742 瀏覽

評論

正正

電影中講的人工智能威脅到人類是可能的事情，不過那是超強人工智能，我們現在處于弱人工智能時代，別說和人類一樣思考了，就算是寫首詩都得通過大量的數據大量的實驗，等真到了那一天也會有那一天的辦法。

最近來自浙江回復
想去鵝城

現在可能不會對人類帶來威脅，但如果以后的AI能像人一樣思考呢，漫畫電影的情節未必是危言聳聽

最近來自廣東回復
大表哥

毀滅世界的不是ai，只能是ai背后的人

最近回復