EP5 好回覆的公式:品質由什麼決定?
為什麼人家曬出來的 AI 回覆又長又貼角色,你的感覺就差很多?不是運氣,是有一套公式。而且公式裡,你自己的影響力比你想的大很多。
影片即將上線
本段影片將在 6/20 直播結束後上架。以下是文字重點摘要,可以配合影片一起看。
Take it away
第五幕三個重點
- 好回覆 = 提詞 × 設定 × 上下文 × 算力,是乘法,任何一項是零,整體就是零
- 你自己的輸入是最被低估的變因:AI 的文筆會鏡像你餵的料,你丟什麼它就接什麼
- 免費的代價砍在你看不見的地方:體驗到的「笨」常是商業省錢決策,不是模型極限
好回覆的公式
這是整個課程對 AI RP 玩家最實用的一個框架:
好回覆 = 好的提詞 × 好的設定 × 足夠的上下文 × 模型算力
注意這是乘法不是加法。
如果提詞(角色卡)很爛,其他三項再強,整體乘起來還是不好。任何一個變因接近零,最後出來的結果就接近零。反過來說,每一個變因都提升一點,效果是倍增的。
四個變因分別是什麼?
提詞(Prompts)
這包含了你的系統提詞、角色卡(character card)品質,以及預設(preset),也就是加在對話裡的各種引導指令。
角色卡寫得好,角色的個性、說話方式、情感反應就越精確;角色卡寫得模糊,AI 就只能按照「一般人物」的平均值在猜。
設定(Settings)
這是酒館裡的各種參數:Temperature(創意程度)、上下文長度、輸出長度等等。
初學者先用預設值就夠,不需要急著調這些。
上下文(Context)
就是桶子裡的全部內容(參考 EP3 記憶之桶)。桶子越大,AI 能參考的資料越多,回覆品質往往越穩定。
桶子太小的直接後果是:對話幾十回合之後,角色卡和世界書的設定被大量聊天紀錄稀釋,感覺角色越聊越走樣。
模型算力
也就是「請了哪個大廚,給他多少時間做菜」。大模型(如 Gemini 1.5 Pro、Claude Opus 等)的能力就是比小模型強,但也貴很多。
免費平台常見的做法是在尖峰時段把你分流到較小的模型,或是限制你能用的輸出長度。你感覺到的「今天 AI 好像變笨了」,很多時候是這個原因。
最被低估的變因:你自己的輸入
這是公式裡最少被討論的一項,也是影響力最大的一項。
AI 的文字接龍特性決定了:你給什麼料,它就接什麼龍。
你丟一句「嗯」,它只能就著「嗯」繼續;你給一段充滿細節的動作描述、情緒狀態、場景氛圍,它就照著你的水準繼續接。
你的最新一句話,正好在桶子最底部(影響力最大的位置)。你的訊息品質,直接決定了接下來 AI 的回覆品質。
這就是為什麼同樣的角色卡、同樣的模型、同樣的設定,不同玩家得到的體驗卻天差地遠。
你在社群上看到有人曬出神回覆,那不是運氣,是那個人餵的料品質高。
這也意味著一件好事:就算你現在用的模型不是最強的,光是提升自己的輸入品質,就能顯著改善回覆。
免費的代價:砍在看不見的地方
現在來談免費平台的現實面。
免費平台當然不是真的「免費」,它們是在你看不見的地方省成本。
常見的省法:
- 縮小上下文(桶子變小,失憶速度加快)
- 換用更小的模型(算力降低)
- 限制輸出長度(每次回覆被截短)
- 尖峰排隊或降速
你體驗到的「這個 AI 好笨」「為什麼老是講到一半就停」,很可能是商業決策的結果,不是這個模型本身的極限。
對照:自架酒館+自用 API
四個品質變因全部透明化、全部你自己決定:
- 角色卡你自己寫,或從社群挑高品質的
- 設定你自己調,或直接用社群預設
- 上下文大小你自己選(付多少費用對應多大的桶子)
- 模型你自己挑,想換就換
自架酒館之後,很多人說「感覺像用了全新的 AI」。其實不是 AI 變了,是這四個變因第一次全在你掌控裡。
常見問題
Q:初學者應該先調哪個設定?
先不要調,用預設就好。最快看到改善的方式是:提升你自己的輸入品質(寫更多細節)、找好的角色卡、裝社群推薦的預設。這三件事的投資報酬率遠高於手動調參數。
Q:Temperature 調高就會變得比較好嗎?
Temperature 控制的是「創意程度」,調高會讓輸出更隨機、更有創意,但也更可能出現胡說八道或跑偏。調低則輸出較保守穩定但容易重複。最好的做法是先用社群推薦的預設(preset),那些預設通常已經幫你調好了一個好的平衡點。
Q:為什麼用免費平台時,AI 有時候回覆非常短?
多半是免費方案的輸出長度限制。你可以在設定裡找「Response Length」或「Max tokens」,看能不能調高;但如果平台本身設了上限,你是改不了的。自架酒館用 API 之後,這個限制才真正由你決定。
下一步
EP6 為什麼酒館是最終點:現在你知道公式的四個變因了,為什麼酒館是唯一能把四個都拿回手上的方法?
