看完大模型們作答的高考作文,對AI的鼓吹與恐懼皆可緩一緩了
在今年的高考作文題目公布之后,多家科技公司嘗試展示自家生成式AI大模型的文學(xué)創(chuàng)作能力。不過在實(shí)際測試中,由AI大模型生成的作文卻表現(xiàn)出思辨性不足、論點(diǎn)論據(jù)不足、觀點(diǎn)不新穎等問題,而這些問題若想得到解決,還需一定時(shí)間。
一直以來,用AI工具進(jìn)行文學(xué)創(chuàng)作都是科技公司們樂于嘗試的事情,特別是在如“高考”這種全民關(guān)注的特殊時(shí)間節(jié)點(diǎn),用AI撰寫高考作文等就更被科技公司追捧。
今年,明爭暗斗或更勝以往。
核心原因當(dāng)然是自去年Open AI以生成式AI應(yīng)用ChatGPT以近乎于質(zhì)變的能力,引發(fā)全球生成式AI大模型狂熱,讓大家公認(rèn)AI技術(shù)來到了“iPhone”時(shí)刻。?
國內(nèi)科技互聯(lián)網(wǎng)公司們也紛紛跟進(jìn)并在今年拿出了自家的生成式AI大模型產(chǎn)品—— 據(jù)不完全統(tǒng)計(jì):從今年二月至今,國內(nèi)AI大模型發(fā)布會(huì)就開了接近20場,諸如百度文心一言、阿里巴巴通義千問、科大訊飛星火大模型等,并都幾乎對外宣稱 自家產(chǎn)品技術(shù)具備領(lǐng)先性。
在此,“高考作文”這一綜合考驗(yàn)考生材料理解能力、文字功底、思辨能力、文字創(chuàng)新能力的綜合考題,無疑也是檢驗(yàn)各家大模型技術(shù)創(chuàng)造能力的試金石。
也正是基于此,投身于生成式AI大模型的廠商們,也是摩拳擦掌,準(zhǔn)備一展自家生成式AI大模型的文學(xué)創(chuàng)作能力。
諸如周鴻祎在微博就分享了一篇由360智腦創(chuàng)作的今年全國甲卷高考作文。
但從最終結(jié)果來看,其表現(xiàn)是基本功不錯(cuò)但在思辨性層面則不足,也較難拿到高分。
語文特級教師王大績在微博中對360智腦生成的這篇AI作文點(diǎn)評稱:“作文語言曉暢,層次清晰,寫作基本功很好,在基礎(chǔ)等級的層面,表現(xiàn)不錯(cuò)。作文也談到了高科技,但是對科技發(fā)展條件下,本應(yīng)成為時(shí)間的主人,何以卻成為時(shí)間的仆人,未能抓住關(guān)鍵,思考不夠透徹。因此未形成鞭辟入里的辨析,題目所要求的時(shí)代感比較淡泊,在發(fā)展等級方面,表現(xiàn)一般?!?/p>
事實(shí)上,這種在文學(xué)創(chuàng)作層面思辨性不足的現(xiàn)實(shí),不止是360智腦一家,其實(shí)幾乎是當(dāng)前生成式AI大模型的“通病”。
在搜狐科技以高考作文全國卷(甲)為題,對百度文心一言、阿里通義千問、科大訊飛星火認(rèn)知大模型、360智腦、ChatGPT五款主流大語言模型產(chǎn)品進(jìn)行同題測試,并邀請到五位語文名師進(jìn)行點(diǎn)評各模型生成作文水平的活動(dòng)中,就不難發(fā)現(xiàn):五款大模型基本都理解到了高考作文全國卷(甲)的作文立意,沒有出現(xiàn)偏題、跑題現(xiàn)象,也都能在短時(shí)間內(nèi)生成相應(yīng)文章。
但同時(shí)大模型們也存在著對作文具體要求理解不清(諸如創(chuàng)作的文章字?jǐn)?shù)未達(dá)到不少于800字的要求)、行文死板、割裂感明顯、語言空洞、“理工味”明顯;并且更為重要的是它們創(chuàng)作的文章,都普遍存在著論點(diǎn)論據(jù)不足、觀點(diǎn)不新穎等在文學(xué)創(chuàng)作上最為致命的問題。這也導(dǎo)致這五款大模型創(chuàng)作的高考作文,綜合得分最高的ChatGPT,也只拿到了48分。
坦率來講,ChatGPT的48分和百度文心一言的46.5分,在高考作文得分中,其實(shí)也不算低,甚至可能會(huì)超過許多考生的作文得分,但也與優(yōu)秀作文沒有沾不上邊,只能說是較為普通的水準(zhǔn)。
而這些大模型在文學(xué)創(chuàng)作上暴露出的這些問題,也讓我們看到當(dāng)前生成式AI技術(shù)的不足。甚至可以說,那些叫囂著現(xiàn)在ChatGPT等生成式AI技術(shù)就能進(jìn)行文學(xué)創(chuàng)作,取代創(chuàng)意人員的話語,著實(shí)有些夸大其辭乃至危言聳聽了。
當(dāng)然,我們也不否認(rèn)ChatGPT等生成式AI技術(shù)在持續(xù)養(yǎng)料喂養(yǎng)下,能夠迅速成長的潛力,但要擺脫當(dāng)前大模型在文學(xué)創(chuàng)作中存在的創(chuàng)造性不足問題 ,可能也并不是大模型們一朝一夕就能搞定的事情,其可能還需要較長的時(shí)間。
在此,幾乎可以說:在看過用生成式AI作答的高考作文后,我認(rèn)為對AI取代文學(xué)創(chuàng)作的鼓吹也好,恐懼也罷,其實(shí)都可以暫時(shí)先緩一緩了。
寫在最后
ChatGPT等大模型技術(shù)所具備的郵件 & 新聞 & 論文撰寫、視頻腳本、文案、翻譯、代碼編寫等能力,讓生成式AI技術(shù)在很大程度上超越了過往這類AI應(yīng)用偏娛樂的屬性,進(jìn)入了真正的生產(chǎn)力乃至是創(chuàng)造性階段。
由此 也有不少業(yè)內(nèi)驚呼 : 創(chuàng)造性工作機(jī)會(huì),可能會(huì)被GPT們率先取代了,開始陷入悲觀預(yù)期。
事實(shí)上,對于生成式AI技術(shù)展現(xiàn)出的實(shí)力,我一直以來的觀點(diǎn)都是:既沒必要過度鼓吹,同時(shí)也沒必要過度恐懼,以一顆平常心去對待技術(shù)的發(fā)展更迭,或許會(huì)更好。
站在技術(shù)浪潮面前,我們更應(yīng)該做的事情是,及早的學(xué)會(huì)善用這些技術(shù),以助力我們工作效率與生活質(zhì)量的提升。
專欄作家
鄰章,微信公眾號(hào):TMT317,人人都是產(chǎn)品經(jīng)理專欄作家。專注科技互聯(lián)網(wǎng)評論,致力傳遞價(jià)值思考。關(guān)注電商、移動(dòng)互聯(lián)網(wǎng)、人工智能、智能手機(jī)等產(chǎn)業(yè)。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!