進階參數調整
用了一陣子,感覺 AI 的回覆哪裡怪怪的?這頁解釋那些進階採樣參數在幹嘛,讓你知道什麼時候該動、動哪個、大概調到哪。
新手請先跳過這頁
如果你剛架好酒館,推薦設定項照著設就夠用了。這頁是給「已經聊了一陣子、覺得某個地方不對勁」的人看的。等你有具體問題(AI 一直重複、回覆太隨機、思考過程漏出來),再回來找對應的參數。
Temperature(創意程度)
Temperature 控制 AI 選字的隨機性,數字越低越穩定可預測,數字越高越天馬行空。
把它想成廚師的發揮空間。調低等於照食譜做,調高就是讓廚師即興發揮。
| 範圍 | 效果 | 適合情境 |
|---|---|---|
| 0.1 – 0.5 | 穩定、可預測、容易重複 | 需要格式一致的輸出、不想要驚喜 |
| 0.7 – 1.0 | 平衡,大部分 RP 情境適用 | 日常角色扮演首選 |
| 1.2 – 2.0 | 天馬行空、文風多變、可能失控 | 需要強烈創意或隨機性,但容易亂掉 |
預設已經幫你調好了
大部分社群預設的 Temperature 都是根據預設作者的使用情境校調過的。改之前先確認預設裡是什麼值,不要直接蓋掉。改壞了記得回去看預設作者的設定說明。
Top P / Top K / Min P(取樣參數)
這三個都是篩選候選字的方式。AI 生成下一個字之前,先把一堆可能的字排好機率,再從裡面挑。
Top P(核心取樣)
從「累積機率加起來剛好到 P」的那些字裡選。比如 Top P = 0.9,就是從最可能的那些字裡選,直到它們加起來佔了 90% 的機率為止。
- 調低(0.5–0.8):選字更保守,詞彙較單一
- 調高(0.9–1.0):選字範圍更廣,文風更多元
- 設 1.0:不做 Top P 篩選,交給其他參數決定
Top K
從前 K 個最可能的字裡選,不管它們的機率是多少。
- 調低(10–30):每次只從少數幾個最常見的字裡選
- 調高(50–100):可選的字更多,文風更豐富
用 Google Vertex AI 的人注意
Vertex AI 對 Top K 有最小值限制,建議改成 64。預設值在 Vertex 上可能報錯。([需查證:確認 Vertex AI Top K 最小值限制現況])
Min P
過濾掉機率太低的字。只要某個字的機率低於「最高機率 × Min P」,就直接排除。
- 調高(0.05–0.1):過濾掉更多低機率的奇怪字,輸出更穩
- 設 0:不做 Min P 篩選
通常只需要動一兩個
Top P、Top K、Min P 三個同時開的話效果會互相抵消,不容易搞清楚誰在影響什麼。一次只改一個,改完聊幾輪感受看看,不對再換下一個調。
Frequency Penalty / Presence Penalty(防重複)
這兩個參數都是用來防止 AI 一直重複相同字詞的。
Frequency Penalty(頻率懲罰)
字出現越多次,之後再出現的機率越低。出現 5 次比出現 1 次受到更多懲罰。
Presence Penalty(存在懲罰)
只要這個字出現過,之後再出現的機率就降低,不管它出現了幾次,懲罰力道一樣。
兩個的差異:
- Frequency:越愛用某個字,越不讓它出現 → 對抗口頭禪、固定句式
- Presence:出現過就算,不讓同樣的話題反覆繞 → 對抗話題繞圈圈
通常預設值就夠了
大部分情況下,預設值(通常是 0 或接近 0)已經夠用。AI 明顯在重複字詞或繞圈子時,才考慮把這兩個調高到 0.5–1.0 試試看。調太高反而會讓 AI 硬是避開正常的常用字,回覆讀起來卡卡的。
Context Size 與 Response Length 的關係
這兩個數字放在一起才有意義。
- Context Size(上下文長度)= AI 這一次能讀的全部內容的上限(單位 Token)
- Response Length(回覆長度)= AI 這一次能寫的回覆的上限
關係很直接:Context Size 減掉 Response Length,剩下的才是 AI 讀輸入的空間。
舉個例:Context 32768、Response 2048,AI 能讀的輸入(角色卡 + 歷史對話 + 世界書)就是約 30720 Token。
開大一定比較好嗎?
不見得。
- Context 開太大:舊的對話都塞進去,但 AI 的注意力是有限的,太多資訊反而分心,重要設定容易被淡化。
- Response 開太大:每次回覆費的 Token 更多,費用增加,但 AI 不一定寫得那麼長。
推薦策略:先用預設,感覺對話太快失憶再考慮調大 Context;感覺回覆一直斷在一半再調大 Response Length。
推理(Thinking / CoT)
「推理」讓 AI 先在心裡打草稿,再給你正式回覆。有些模型(如 Gemini 2.5 系列)支援這個功能,效果是回覆品質提升,但速度稍慢、費 Token。
怎麼開關
在 AI 回應設定 Tab 裡找「推理耗費」(Thinking Budget),調整推理的 Token 上限,或完全關掉。
草稿漏出來怎麼辦
如果你看到 AI 回覆裡出現 <think>...</think> 這種奇怪的標籤,是推理標籤設定沒配好。
在 進階格式化 Tab 裡找「推理標籤」欄位,確認設定:
- 開始標籤:
thinking - 結束標籤:
thinking
Gemini 的推理標籤是 thinking,不是 think。設定對了,推理過程就會被正確包起來,不會顯示在你的聊天視窗裡。
預設裡的提示詞結構(快速帶過)
如果你有打開過預設(Preset)的編輯介面,會看到裡面有一堆名稱像是「System Prompt」「Jailbreak」「後指示」之類的區塊。這些是預設作者預先安排好的提示詞骨架。
簡單說一下它們的角色:
- System Prompt:最基礎的人格設定和行為準則,在所有對話之前送給 AI
- Jailbreak / Alignment Override:有些預設用來鬆開模型的保守傾向(俗稱「破限」),讓角色扮演更自由
- 後指示(Post-History / Final Instruction):放在所有對話記錄之後、AI 回覆之前的最後提醒
這些區塊的排列順序和具體內容是預設作者花時間校調的結果。新手不用自己動。如果你想深入了解怎麼寫提示詞,建議去 Discord 社群問,或直接看你用的預設作者的說明文件。
想換預設但不知道從哪開始?
看看預設怎麼找+怎麼裝,裡面有推薦的起步預設清單。
參數調完還是有問題?先到常見問題 → 聊天品質確認是不是其他原因,再回來微調參數。
