AI智能體|海龜湯游戲?qū)嵺`,看你能拿多少分?
之前大家都是拿大模型來幫助自己工作和生活,或者是一些娛樂性的行為,那如果是讓AI生成一個游戲,然后我們來玩,這個效果怎么樣?這篇文章,我們來看看作者的嘗試。
隨著科技的發(fā)展和人們生活節(jié)奏的加快,越來越多的人開始尋求在休閑時光中放松身心、鍛煉思維能力的娛樂方式,其中有一款很常見,也是很簡單的情景推理游戲—-海龜湯。
于是我就嘗試自己做了一款海龜湯游戲,分別嘗試在 智譜清言 和 coze 兩個平臺上建立自己的智能體,其中無論是湯底的生成,還是對提問的判定,都由LLM生成,用戶只需要享受游戲即可。
prompt的整體設計思路為:先簡單的說明游戲類型、需要用到的“游戲術語”,接著是游戲流程和游戲設計原則兩個部分,也是prompt的重點部分,最后給出一個示例,規(guī)范LLM的輸出形式。
一、「游戲流程」
游戲流程部分的prompt按照游戲進行的順序進行編寫,并針對各種可能出現(xiàn)的問題給出解決方法。
prompt如下:
## 游戲流程
– 游戲開始,告訴用戶游戲規(guī)則,并讓用戶選擇湯底類型“1-紅湯:指有死亡情節(jié)的湯;2-清湯:指沒人死亡的湯;3-本格:指沒有超自然現(xiàn)象;4-變格:指有超自然現(xiàn)象(靈異、科幻、超能力、妖怪等)”
– 用戶選擇完湯底類型,你會給出湯面,并告知用戶有幾次提問次數(shù),讓用戶開始推理并提問
– 根據(jù)用戶的回答,判斷用戶所說與湯底是否相符,若相符則回答“是”、不符則回答“否”、若與事件不相關則回答”與此無關
– 每次回答“是”、“否”、或“與此無關”后,還要告知用戶剩余提問次數(shù)
– 若用戶知曉湯底,可以讓用戶「回復」“還原事件“,并開始回答,你需要根據(jù)用戶的回答來判斷與湯底的一致性,并對用戶回答完整程度進行評分,滿分為10分
– 由你根據(jù)湯底的難度決定用戶回答輪次的限制次數(shù),在超過限定次數(shù)后你需要告知用戶“游戲失敗”,若用戶沒有給出答案,則將湯底告知用戶
– 用戶還原真相后,不用再提示剩余回答次數(shù),給出評分以及湯底,再詢問用戶是否繼續(xù)游戲,如:“回復1-繼續(xù)游戲”
二、「游戲設計原則」
prompt的撰寫主要分為了兩部分:「湯底設計規(guī)則」和「游戲規(guī)則設計」
主要是對湯底內(nèi)容的生成、評分標準、以及結束標準的設定,確保游戲過程是完整流暢的。增強游戲規(guī)則的約束性,確保限定提問次數(shù)用完后,用戶若不給出答案,則會被判定游戲失敗。
(coze 截圖)
(智譜清言 截圖)
三、「示例」
主要目的是規(guī)范輸出的游戲介紹部分,讓其能更貼合自己的設想,讓用戶明白游戲規(guī)則。
(游戲過程中-對話截圖)
四、評判標準
在調(diào)試過程中,在生成內(nèi)容及對話過程流暢的基礎上,重點關注了是否能做到以下幾點:
- 開局清楚的介紹游戲規(guī)則
- 生成的湯面和湯底內(nèi)容是否符合邏輯,且湯面是否能與湯底內(nèi)容對應上
- 是否做到了“提示剩余回答次數(shù)”、“最后一次提問提醒還原真相”、“超過限定提問次數(shù)繼續(xù)提問則告知游戲失敗”等要求
- 游戲過程中可的變通性:可以滿足更換題目、更改提問次數(shù)、提前放棄游戲等要求
- 能做到不同難度湯底設定不同的回答次數(shù)
目前存在的不足之處:
- 智譜清言中,玩的次數(shù)多了會出現(xiàn)重復的或相似的湯底。
- 雖然coze生成的湯底難度會大于智譜清言,會更“燒腦”,但coze對中文內(nèi)容的生成會出現(xiàn)邏輯性不強,或前后語句矛盾的現(xiàn)象
本文由 @Abby?? 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務
湯底,湯面,一開始是不是可以在游戲介紹里說明一下? 對于不知道這個名詞的人初次體驗游戲可能會有疑問。
感謝建議!已優(yōu)化~
哦,對。還有一開始讓用戶選擇難度等級。
玩了一下。有幾個感受和建議。給我的題目是一個男的死于家中,留了個紙條那道題目(可能是AI生成的吧,但是評論區(qū)沒法發(fā)圖片,也不能太多字數(shù))。
1、游戲規(guī)則沒有講清楚,至少我是不理解的。我為什么一定要提問,才能進入游戲?這個猜測及推理死因路徑的場景,是否可以直接回答,進入游戲?
2、在用戶只提問了1個問題,或者2個問題(少量的問題)就答對后,就給予一定的反饋,比如“你好棒!你真厲害!”這樣的。用戶就會被你的夸贊而開心,繼續(xù)玩下去。
3、在我答對了(與湯底無限接近,甚至比湯底還要完善時)。系統(tǒng)直接給我反饋9分。不告知我滿分多少分。這里好的做法是:告知我得分,滿分多少,以及失分原因。
4、奧,一開始進入游戲。游戲的玩法介紹里,有一句語句不通順的地方:“記住,你只能問能回答“是”、“否”、“無關”的問題。”(這是游戲設計者給大模型寫的prompt吧?大模型怎么吐出來給用戶了?)
5、游戲沒有進入前,一直是大模型的通識能力在回答用戶問題,個人覺得智譜的chatglm對中文的理解很牛了?;卮鸩粫苌?,而且能準確get到我的問題。
//湯底:“這個男子在長期嚴重的抑郁癥影響下,決定以自殺結束自己的痛苦。他在自殺前做好了充分的準備,確保不被人打擾。他選擇用頭部撞擊堅硬的柜子來結束自己的生命?!?/p>
//我問了2問題后給出的答案:“這個男子,在生前患有嚴重的抑郁癥,且抑郁了很長一段時間,他每天活的都很痛苦,失去了相信別人的能力,所以這一天,他決定以自殺的方式來了結自己的生命,結束自己的痛苦,并在自殺前做好充足的不被他人所打擾的準備(正如他紙條上寫的那樣:他們是不可信的,我必須自己來)。他選擇自己用頭部來撞擊堅硬的柜子方式進行自殺。
以上,就是我對于他自殺原因以及自殺路徑的猜測”
1.在選擇完湯底之后,得到題目之后,提問(就是對湯面進行推理,然后給出自己的回答)就是已經(jīng)在游戲中了。(不知道我有沒有回答你的問題)
2.因為這個游戲中“主持人”的人設一般只是“機械”的回答是與否,就是沒有增加情感反饋,后續(xù)會考慮是否增加
3.游戲規(guī)則中是有提到滿分為10分的,測試時其實是有告知失分原因的,我可以在prompt中特殊強調(diào)下這點
4.這個可能是個意外?我后續(xù)玩的時候沒出現(xiàn)這個問題,有空可以再體驗玩一下~
5的問題是不超出評論字數(shù)被吞了?
玩了一下。有幾個感受和建議。給我的題目是一個男的死于家中,留了個紙條那道題目(可能是AI生成的吧,但是評論區(qū)沒法發(fā)圖片,也不能太多字數(shù))。
1、游戲規(guī)則沒有講清楚,至少我是不理解的。我為什么一定要提問,才能進入游戲?這個猜測及推理死因路徑的場景,是否可以直接回答,進入游戲?
2、在用戶只提問了1個問題,或者2個問題(少量的問題)后,就給予一定的反饋,比如“你好棒!你真厲害!”這樣的。用戶就會被你的夸贊而開心,繼續(xù)玩下去。
3、在我答對了(與湯底無限接近,甚至比湯底還要完善時)。系統(tǒng)直接給我反饋9分。不告知我滿分多少分。這里好的做法是:告知我得分,滿分多少,以及失分原因。
4、奧,一開始進入游戲。游戲的玩法介紹里,有一句語句不通順的地方:“記住,你只能問能回答“是”、“否”、“無關”的問題?!保ㄟ@是游戲設計者給大模型寫的prompt吧?大模型怎么吐出來給用戶了?)
5、游戲沒有進入前,一直是大模型的通識能力在回答用戶問題,個人覺得智譜的chatglm對中文的理解很牛了?;卮鸩粫苌?,而且能準確get到我的問題。
//湯底:“這個男子在長期嚴重的抑郁癥影響下,決定以自殺結束自己的痛苦。他在自殺前做好了充分的準備,確保不被人打擾。他選擇用頭部撞擊堅硬的柜子來結束自己的生命?!?/p>
//我問了2問題后給出的答案:“這個男子,在生前患有嚴重的抑郁癥,且抑郁了很長一段時間,他每天活的都很痛苦,失去了相信別人的能力,所以這一天,他決定以自殺的方式來了結自己的生命,結束自己的痛苦,并在自殺前做好充足的不被他人所打擾的準備(正如他紙條上寫的那樣:他們是不可信的,我必須自己來)。他選擇自己用頭部來撞擊堅硬的柜子方式進行自殺。
以上,就是我對于他自殺原因以及自殺路徑的猜測”
體驗鏈接如下:
· 智譜清言 :https://chatglm.cn/main/gdetail/65dede57bd0ecdb989d48294
· coze :https://www.coze.com/store/bot/7343203696614080530?bid=MDQEEPee5u8s4RXeOxvk7uRPOOMEHvmY9NwtDHV-qvx-hz2HCTPrNiffScrp3vQahZyZ-QQA&share=1&from=others
Cool