大數據分析:王者榮耀英雄背景下的分詞報告
文章對王者榮耀英雄展開分詞分析,一起來看。
中文分詞在中文信息處理中是最最基礎的,無論機器翻譯亦或信息檢索還是其他相關應用,如果涉及中文,都離不開中文分詞,因此中文分詞具有極高的地位。
NLP剛入門,想找個東西練練手,于是便看到了手邊的農藥。。。
思路
- 使用Python爬取王者榮耀官網所有英雄的背景資料文本信息
- 使用RMM最大逆向匹配分詞算法對文本進行分詞處理,計算詞頻
- 使用Excel出具簡單的可視化報告
結果
爬取了王者榮耀官方網站-騰訊游戲71位英雄的英雄故事文本,共計59793個字符。
排名前20的高頻詞匯:
【自己】一詞出現了194次,詞頻為0.48%,高居榜首。
王者榮耀團隊在介紹英雄時,多以第一人稱視角進行故事敘述和情感宣泄。
有利于用戶更好地理解英雄背景,觸發共情效果,有利于提高用戶的整體游戲體驗。
如蘇烈的英雄故事中,【自己】就出現了4次,圖片所截區域不全,僅作展示說明。
男女詞匯比例
男性詞匯: 他 他們 男 男子 男人 少年 爹爹;出現次數704次,詞頻為1.74%。
女性詞匯: 她 她們 少女 女 妻子 太后 女媧 小女孩 女郎 女孩 女嬰 女戰士;出現次數263次,詞頻為0.65%。
男女詞匯比例為73:27,男女英雄數量比例為72:28,幾乎一致王者榮耀的英雄更迭與故事發展主要與男性英雄相關
如鎧的英雄背景中,【他】出現了31次,【她】出現了1次
在同為長城小隊隊員的花木蘭英雄背景中,【他】出現了12次,而【她】出現了1次
主要情節均由男性角色推動。
排名前20的地點詞匯:
【長安】、【長城】和【大唐】穩居榜首前三,占據了前20地名中46.67%的詞頻
繁華盛世和戰亂邊疆都是孕育無數英雄豪杰的好地方,兼容并蓄的社會環境和攘外安內的國家政策迸發出一批又一批的青年才俊。
王者榮耀的游戲策劃也是深諳此道。
目前所有的英雄均來自于王者大陸的魔幻土地之上,如城鎮、廢墟、地下、森林、深淵、寺院和戈壁等。
官方人員在設計新的英雄時,不妨把視角轉向浩渺的天空。
如Dota中的雙頭龍、精靈龍、寒冰飛龍、死靈飛龍和鳳凰等角色,來為游戲注入新的活力,進一步加強游戲本身的趣味性和可玩性。
正負面情感詞匯比例
正負面詞匯比例為65:35,英雄們多因外族入侵、魔道猖獗、國破家亡和希望破滅等因素,為了國家安定和夢想實現,不得不拿起手中刀劍,奔向戰場
天降大任于斯人也,必先苦其心志,勞其筋骨,餓其體膚,空乏其身,行指亂其所為,所以動心忍性,曾益其所不能。
正面詞匯: 愛 仁 和平 信任 勝利 希望 微笑 榮耀 偉大 輝煌 美麗 自信 等;出現次數425次,詞頻為1.04%。
負面詞匯: 魔 魔道 黑暗 憤怒 背叛 可怕 恐懼 失去 死亡 危險 吞噬 邪惡 殘忍 嘲笑 折磨 戰亂 等;出現次數780次,詞頻為1.91%。
看完了記得點個贊哦~
本文由 @Pt2017 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自PEXELS,基于CC0協議
為開始點個贊
謝謝~ ??
結論呢
寫PRD去了。。。有空再繼續補充哈 ?