實(shí)測(cè)4款頭部PPT生成大模型:配圖錯(cuò)誤頻發(fā)、數(shù)據(jù)可視化集體翻車(chē)

2 評(píng)論 3377 瀏覽 7 收藏 23 分鐘

大模型從圖文、圖片、視頻卷到了PPT生成,但距離“一鍵生成”的終極目標(biāo)還有明顯距離,這就得看誰(shuí)能持續(xù)“燒錢(qián)”完成進(jìn)步了。

繼聊天機(jī)器人、文本創(chuàng)作、圖像生成、視頻生成之后,大模型高調(diào)“卷”入PPT生成中。

入局者既包括傳統(tǒng)辦公軟件開(kāi)發(fā)商,如金山辦公推出WPS AI、iSlide推出iSlide AI;也包括互聯(lián)網(wǎng)巨頭百度、阿里等攜百度文庫(kù)、夸克AI PPT出場(chǎng);還有科大訊飛、天工AI、月之暗面Kimi等AI領(lǐng)域的重量級(jí)選手。各家紛紛拿出看家本領(lǐng),爭(zhēng)相在PPT賽道上贏得先機(jī)。

比如,國(guó)產(chǎn)大模型Kimi聯(lián)合AiPPT推出PPT助手,而科大訊飛也不甘示弱,發(fā)布了訊飛智文2.0版本的智能文檔AI助理,一鍵生成PPT升級(jí)版。這些工具不僅能提煉文檔核心生成大綱,還能一鍵切換主題模板,甚至支持多文檔到PPT的轉(zhuǎn)換……每一個(gè)功能都寫(xiě)著“省時(shí)省力”,每一個(gè)營(yíng)銷(xiāo)點(diǎn)都體現(xiàn)著“卷”的決心。

畢竟“天下苦PPT久矣”,PPT制作一直是職場(chǎng)人士的一大痛點(diǎn),技術(shù)的較量若能推動(dòng)辦公生產(chǎn)力的革新,用戶(hù)自然喜聞樂(lè)見(jiàn)。但是,面對(duì)如此硬核的用戶(hù)真需求,如若企業(yè)只是打著AI的幌子交一份偽答卷,無(wú)疑將達(dá)到反效果,傷了用戶(hù)的心。

因此,「科技新知」本次將在國(guó)產(chǎn)大模型中挑選四名選手進(jìn)行實(shí)測(cè),包括Kimi、訊飛智文、百度文庫(kù)、WPS,以觀察大模型企業(yè)對(duì)打工人的誠(chéng)意幾何。

為確保測(cè)評(píng)結(jié)果的客觀性和參考價(jià)值,我們采用以下設(shè)定:

1.使用統(tǒng)一的中文提示詞,包括簡(jiǎn)易提示詞和復(fù)合提示詞;

2.每個(gè)大模型的測(cè)試項(xiàng)目都包括:輸入主題生成PPT、上傳文檔生成PPT;

3.統(tǒng)一使用電腦網(wǎng)頁(yè)版及其默認(rèn)設(shè)置;

4.統(tǒng)一呈現(xiàn)一次生成結(jié)果,不進(jìn)行二次調(diào)整優(yōu)化。

以下是各個(gè)模型表現(xiàn)情況:

生成方式1:輸入主題生成PPT

指令:你是一名經(jīng)驗(yàn)豐富的影視產(chǎn)業(yè)觀察者,被邀請(qǐng)至高校的課堂做分享,主題是2024年國(guó)內(nèi)五一檔電影及其票房分析,現(xiàn)在需要你據(jù)此做一份PPT,要求要有清晰的結(jié)構(gòu)和邏輯,精準(zhǔn)的數(shù)據(jù)支持,精美的視覺(jué)設(shè)計(jì),須包含圖表,總頁(yè)數(shù)不超過(guò)20頁(yè)。

指令說(shuō)明:作為一個(gè)信息溝通工具,PPT應(yīng)有效地在繁雜的信息中提煉要點(diǎn)、歸納總結(jié),并將多數(shù)據(jù)部分做可視化呈現(xiàn)。因此,為測(cè)試這幾款A(yù)I PPT的基本能力,本輪測(cè)試專(zhuān)門(mén)選用具備多主體、多數(shù)據(jù)主題。

WPS AI:

WPS AI:近900字的PPT大綱,層級(jí)分明、內(nèi)容全面,不禁讓人對(duì)這個(gè)匯報(bào)充滿(mǎn)期待,但最終生成的PPT卻只是把大綱填充進(jìn)用戶(hù)所挑選的模板中,具體內(nèi)容仍需用戶(hù)自行檢索、歸納、分析。

如“背景介紹”部分,WPS AI非常直白地留下一句“分析2024年國(guó)內(nèi)五一檔電影市場(chǎng),了解電影產(chǎn)業(yè)發(fā)展趨勢(shì)”,相當(dāng)于只給用戶(hù)提供一個(gè)思考思路,但相信不少讀者跟「科技新知」一樣,希望AI能完成到分析這一步;對(duì)于“影視產(chǎn)業(yè)現(xiàn)狀概覽的市場(chǎng)規(guī)?!币矁H有一句“高度概括”的表述:國(guó)內(nèi)影視產(chǎn)業(yè)持續(xù)增長(zhǎng),市場(chǎng)規(guī)模不斷擴(kuò)大——水得太明顯了。

Kimi

Kimi:1分鐘的時(shí)間里,Kimi生成了近2000字的大綱,試圖用20頁(yè)P(yáng)PT完成背景介紹、情況簡(jiǎn)介、票房數(shù)據(jù)分析、受眾分析、成敗因素分析、營(yíng)銷(xiāo)策略分析、政策環(huán)境與市場(chǎng)監(jiān)管、未來(lái)市場(chǎng)展望……只能說(shuō)全面,十分全面。但問(wèn)題也在于此——主題不突出,未能聚焦“2024年國(guó)內(nèi)五一檔電影及其票房分析”。

和WPS AI一樣,在“一鍵生成PPT”上,Kimi給到的也是一個(gè)思路框架、分析模板,如在“2024年票房數(shù)據(jù)分析”中,Kimi給出的回答是“詳細(xì)列出2024年五一檔期間各部影片的票房數(shù)據(jù),包括總票房、單日票房、觀影人次等關(guān)鍵指標(biāo)。分析票房數(shù)據(jù)背后的市場(chǎng)因素,如影片質(zhì)量、宣傳力度、觀眾口碑等?!辈坏貌怀姓J(rèn),這是一個(gè)相當(dāng)完整的分析思路,相較于WPS AI也更為詳細(xì)。

百度文庫(kù):

百度文庫(kù):如圖所示,百度文庫(kù)所生成的PPT目錄頁(yè)即其大綱的全部,看起來(lái)是位惜字如金的選手。意料之外的是,低期待等來(lái)了小驚喜,在前三個(gè)產(chǎn)品的測(cè)試中,百度文庫(kù)幾乎是最符合「科技新知」對(duì)“一鍵生成PPT”所設(shè)想的,包括結(jié)構(gòu)完整、詳略得當(dāng)、主題突出、能引用官方數(shù)據(jù)并做分析。

但在生成大綱環(huán)節(jié)上,百度文庫(kù)出現(xiàn)兩段100%重復(fù)的內(nèi)容,由此生成出來(lái)的PPT也同樣發(fā)生重復(fù)。但基于其在內(nèi)容上的優(yōu)異表現(xiàn),這點(diǎn)不足倒也影響不大,只增加了后期手動(dòng)刪除的步驟。

訊飛智文:

訊飛智文:出現(xiàn)多處排版疊字現(xiàn)象,但瑕不掩瑜,有別于WPS AI和Kimi的籠統(tǒng)和全面,訊飛智文對(duì)主題的把握更為準(zhǔn)確,能夠合理分配各部分內(nèi)容的比例,并能?chē)@主題對(duì)相關(guān)維度做有效分析,如不同影片類(lèi)型分布及特點(diǎn)、購(gòu)票渠道與觀影模式、重點(diǎn)城市票房數(shù)據(jù)等;信息抓取和文本生成能力較為突出,符合主題且有足夠的豐富度。

生成方式2:上傳文檔生成PPT

指令:你是一名大學(xué)生,要做一個(gè)課程期末匯報(bào),文檔名稱(chēng)為“電影《傲慢與偏見(jiàn)》人物形象分析匯報(bào)”,字?jǐn)?shù)1500,包含電影簡(jiǎn)介與創(chuàng)作者簡(jiǎn)介、故事梗概、主要角色人物形象分析、人物刻畫(huà)手法及小結(jié),請(qǐng)你根據(jù)這份匯報(bào)講稿生成一份PPT。

指令說(shuō)明:這項(xiàng)測(cè)試是為根據(jù)文檔生成一份匯報(bào)演講稿。按一般人平均語(yǔ)速約240字/分鐘計(jì)算,整個(gè)匯報(bào)約6分半。主要評(píng)估AI的語(yǔ)言和場(chǎng)景理解能力、文本閱讀能力、概括提煉能力等。

WPS AI:

WPS AI:整體而言,是名簡(jiǎn)約派選手,包含封面及尾圖,成品僅6頁(yè)。排版合理,但配圖毫無(wú)關(guān)聯(lián);對(duì)文檔內(nèi)容的處理中規(guī)中矩,只做了基于文檔本身的處理,沒(méi)有做文檔外的內(nèi)容補(bǔ)充。

Kimi:

Kimi:盡管上傳的文檔已經(jīng)是完成的一篇匯報(bào)演講稿,但Kimi似乎有自己另外的想法,它基于演講稿的框架和模板做排篇布局,提煉要點(diǎn),但沒(méi)有展開(kāi)分析,而是提供給用戶(hù)思考的方向,更像是一份“半成品”。用戶(hù)需再根據(jù)其指示自行填充內(nèi)容。此外,Kimi在本輪表現(xiàn)中竟存在內(nèi)容與小標(biāo)題顛倒(混淆?倒置?還是說(shuō)正文與小標(biāo)題識(shí)別錯(cuò)誤,位置顛倒之類(lèi)的會(huì)清晰一點(diǎn)?)的低級(jí)錯(cuò)誤。

百度文庫(kù):

百度文庫(kù):根據(jù)其提供的選項(xiàng),我們?cè)凇霸囊恢隆焙汀斑m當(dāng)擴(kuò)寫(xiě)”中選擇了后者,成稿確實(shí)有基于文檔內(nèi)容補(bǔ)充有效信息和完善,并且擴(kuò)充內(nèi)容能夠圍繞“人物形象”這個(gè)關(guān)鍵詞展開(kāi),邏輯合理。排版無(wú)太大問(wèn)題,較為致命的是配圖出現(xiàn)錯(cuò)誤,用成《小婦人》的電影截圖。

訊飛智文:

訊飛智文:排版依舊沒(méi)有將模板和文字內(nèi)容進(jìn)行合理編排,出現(xiàn)多處疊字現(xiàn)象,且PPT頁(yè)面字?jǐn)?shù)過(guò)多,不僅影響觀感,也不利于觀眾對(duì)信息的快速獲取。但通過(guò)聯(lián)網(wǎng)擴(kuò)寫(xiě),成品能基于演講稿對(duì)匯報(bào)內(nèi)容進(jìn)行有效地完善。此外,其提供的AI配圖是個(gè)亮點(diǎn),雖然圖文相關(guān)性還有待加強(qiáng),但已比前幾家的圖片表現(xiàn)要好。

生成方式3:其余相關(guān)維度測(cè)評(píng)

除整體成稿呈現(xiàn)外,我們還從以下幾個(gè)相關(guān)維度進(jìn)行測(cè)評(píng):響應(yīng)速度與效率、使用成本和價(jià)格、模板與樣式、用戶(hù)體驗(yàn)與交互、安全與隱私保護(hù)。

四款A(yù)I大模型PPT生成時(shí)間

“一鍵生成”無(wú)疑是被PPT硬控的打工人和學(xué)生黨夢(mèng)寐以求的功能。畢竟,一份精美的PPT從挑選模板開(kāi)始,就要耗費(fèi)大量的時(shí)間和精力。再到梳理結(jié)構(gòu)、確定文本、斟酌用詞、排版布局、設(shè)計(jì)優(yōu)化等,可稱(chēng)為繁瑣的集合??傮w來(lái)看,本期測(cè)試的四款產(chǎn)品無(wú)論是通過(guò)輸入主題生成還是上傳文檔生成,成品時(shí)間都控制在2.5分鐘內(nèi)。其背后考驗(yàn)的是高效的數(shù)據(jù)管理機(jī)制及算法系統(tǒng)等。

看起來(lái),速度與質(zhì)量有時(shí)難兼得。在輸入主題生成中,訊飛智文以整體時(shí)間1分鐘的優(yōu)異成績(jī)勝出,且內(nèi)容質(zhì)量高。在上傳文檔時(shí),WPS AI僅用了29s,但內(nèi)容在四家中墊底。

四款A(yù)I PPT測(cè)評(píng)對(duì)象對(duì)比表

在使用成本方面,AI新秀Kimi出手相當(dāng)闊綽,目前,其PPT助手功能均可免費(fèi)使用。其余三家均采用付費(fèi)會(huì)員權(quán)益。但在當(dāng)前拉新階段,三家也都設(shè)有免費(fèi)或低價(jià)限時(shí)體驗(yàn)包。

挑模板往往是PPT人艱難的第一步。整體來(lái)看,四款產(chǎn)品的PPT模板庫(kù)均以教育、職場(chǎng)辦公、科技、商務(wù)場(chǎng)景為主,適用場(chǎng)景及主題還有待進(jìn)一步豐富。Kimi的大手筆貫穿全程,免費(fèi)模板量居榜一,而百度文庫(kù)多數(shù)模板均為VIP權(quán)益,即使是免費(fèi)模板,生成后下載到本地電腦也需付費(fèi)。

從樣式上來(lái)看,各家生成的PPT在字體、動(dòng)畫(huà)效果和幻燈片切換上都以“基礎(chǔ)款”打底,支持在線編輯或下載后編輯。

WPS AI界面

Kimi界面

百度文檔界面

訊飛智文界面

從交互體驗(yàn)來(lái)看,四款產(chǎn)品注冊(cè)登錄方式便捷,均可通過(guò)手機(jī)驗(yàn)證碼注冊(cè)登錄;支持網(wǎng)頁(yè)操作;從界面上看,WPS AI、Kimi和訊飛智能走的是極簡(jiǎn)風(fēng),用戶(hù)能快速找到所需功能,百度文庫(kù)頁(yè)面則較為復(fù)雜,“AI生成PPT”則位于頁(yè)面最右的智能助手,操作界面只有整個(gè)首頁(yè)的五分之一。

在安全與隱私保護(hù)方面,四家均無(wú)明顯的隱私政策,未就如何收集、使用和保護(hù)用戶(hù)數(shù)據(jù)在顯眼處做相關(guān)說(shuō)明。

測(cè)評(píng)觀察:技術(shù)進(jìn)步與用戶(hù)期待的較量

不得不承認(rèn),在對(duì)四款A(yù)I PPT產(chǎn)品的測(cè)評(píng)中,我們見(jiàn)證了人工智能在內(nèi)容創(chuàng)作領(lǐng)域的重要進(jìn)步。僅需簡(jiǎn)單輸入指令、點(diǎn)擊生成,一雙無(wú)形的手便以驚人的速度開(kāi)始編排并“立即生成”,這對(duì)于被PPT綁架的用戶(hù)無(wú)疑是一種解脫。

速度固然重要,但質(zhì)量才是核心。對(duì)話(huà)、文本生成是大部分企業(yè)切入賽道的第一個(gè)發(fā)力點(diǎn),在日復(fù)一日的數(shù)據(jù)訓(xùn)練中,大模型的自然語(yǔ)言處理能力得到顯著提升,這也為其往多模態(tài)發(fā)展打下了堅(jiān)實(shí)的基礎(chǔ)?;诖耍诒敬螠y(cè)評(píng)中,四款產(chǎn)品在邏輯分析上都有相當(dāng)不錯(cuò)的表現(xiàn)。

但在文本內(nèi)容生成上,各家大部分還停留于“提供思路”的層次,在提取有效信息,生成準(zhǔn)確且有深度的文本上還有待加強(qiáng),如WPS AI和Kimi。相比較而言,百度文庫(kù)和訊飛智文在本次測(cè)試中表現(xiàn)出另一梯隊(duì)的水準(zhǔn)。如果說(shuō)WPS AI和Kimi可以一鍵生成一份合格率為50%的PPT,那百度文庫(kù)和訊飛智文基本是80%的水平,這或許也得益于其背后百度、百度文庫(kù)和科大訊飛在知識(shí)引擎和內(nèi)容數(shù)據(jù)上的積累。

欣喜有之,遺憾亦有之。在「科技新知」最期待的數(shù)據(jù)可視化部分,四名選手則無(wú)一例外地選擇“視而不見(jiàn)”。數(shù)據(jù)——懸在大廠人頭上的“達(dá)摩克利斯之劍”,同樣是PPT里的靈魂擔(dān)當(dāng),通常包含數(shù)據(jù)比對(duì),并以圖表、圖形等形式呈現(xiàn),使其更直觀、易懂。這也是當(dāng)代打工人做PPT的共識(shí)。為此,在“輸入主題生成”測(cè)試中,我們專(zhuān)門(mén)挑選了有數(shù)據(jù)信息的主題,并下達(dá)具體指令,要求成稿“須包含圖表”,結(jié)果卻沒(méi)有看到相應(yīng)內(nèi)容的生成。遺漏用戶(hù)需求,也反映出對(duì)PPT使用痛點(diǎn)和場(chǎng)景理解的不夠深刻。

另一個(gè)不容忽視的問(wèn)題是,PPT常見(jiàn)應(yīng)用場(chǎng)景既包括學(xué)校,也有科研機(jī)構(gòu)、政府及企業(yè)等,也意味著大量的數(shù)據(jù)隱私、商業(yè)秘密等。而當(dāng)前AI PPT大模型產(chǎn)品在數(shù)據(jù)隱私保護(hù)上還顯得標(biāo)準(zhǔn)不足、底氣不足,也都默契地在宣傳營(yíng)銷(xiāo)層面避而不談。

這么看來(lái),PPT離“一鍵生成”的終極目標(biāo)還有距離。各路玩家趕路之余,還需繼續(xù)練好內(nèi)功。

大模型綜合能力的提升,很大程度上依賴(lài)于海量數(shù)據(jù)的喂養(yǎng),其開(kāi)發(fā)與訓(xùn)練是一項(xiàng)需要全方位資源投入的復(fù)雜工程。它不僅依賴(lài)頂尖人才團(tuán)隊(duì)和前沿技術(shù),也離不開(kāi)豐富的高質(zhì)量語(yǔ)料庫(kù),這要求開(kāi)發(fā)者具備持續(xù)的數(shù)據(jù)采集和處理能力。同時(shí),還需投資大量硬件資源以提供必要的算力資源。

簡(jiǎn)而言之,大模型的開(kāi)發(fā)是一場(chǎng)對(duì)技術(shù)深度、數(shù)據(jù)廣度和算力強(qiáng)度的綜合考驗(yàn),而每一項(xiàng)技術(shù)進(jìn)步的背后都是“燒錢(qián)”。

“百模大戰(zhàn)”是過(guò)去式了,已經(jīng)到了求生的階段。解鎖新應(yīng)用場(chǎng)景,是大模型逐步走向商業(yè)化的必經(jīng)之路。據(jù)月狐數(shù)據(jù)測(cè)算,2024年6月智能PPT行業(yè)用戶(hù)規(guī)模已達(dá)到920萬(wàn),行業(yè)近3月用戶(hù)規(guī)模復(fù)合增速達(dá)21%。面對(duì)“PPT”這一需求龐大的內(nèi)容生成領(lǐng)域,誰(shuí)又甘心在這場(chǎng)爭(zhēng)奪賽中掉隊(duì)?

搶占剛需的市場(chǎng),企業(yè)務(wù)必要拿出實(shí)實(shí)在在的真本領(lǐng)了。除此之外,針對(duì)用戶(hù)的培育模式也值得考究,它關(guān)乎企業(yè)能否長(zhǎng)遠(yuǎn)地贏得市場(chǎng)與人心?;仡欉@幾年全球流行的在線辦公軟件發(fā)展歷程,從一開(kāi)始的免費(fèi)送福利造福上班族,到后來(lái)設(shè)置使用限制,逐步按功能收費(fèi)“割韭菜”,引來(lái)一片罵聲。至今為止,關(guān)于這些企業(yè)的實(shí)際產(chǎn)出回報(bào)率及用戶(hù)留存率的具體數(shù)據(jù)仍顯匱乏,使得外界難以全面評(píng)估其經(jīng)營(yíng)成效。

面對(duì)你我日益被AI重塑的生活,不管拷問(wèn)得多細(xì)致都不為過(guò)。畢竟每一個(gè)為科技買(mǎi)單的用戶(hù),都還要再付諸時(shí)間、隱私及信任。承載著打工人與學(xué)生黨厚望的PPT“幫手”,可別把好牌打得稀巴爛。

作者丨余寐 編輯丨賽柯

本文由人人都是產(chǎn)品經(jīng)理作者【科技新知】,微信公眾號(hào):【科技新知】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. iSlide也好用,就是得花錢(qián)

    來(lái)自天津 回復(fù)
  2. 試用過(guò)百度文庫(kù)的上傳文檔生成,只能說(shuō)能作為一個(gè)基礎(chǔ)底吧,還需要手動(dòng)大改

    來(lái)自山西 回復(fù)