進階參數調整

用了一陣子，感覺 AI 的回覆哪裡怪怪的？這頁解釋那些進階採樣參數在幹嘛，讓你知道什麼時候該動、動哪個、大概調到哪。

新手請先跳過這頁

如果你剛架好酒館，推薦設定項照著設就夠用了。這頁是給「已經聊了一陣子、覺得某個地方不對勁」的人看的。等你有具體問題（AI 一直重複、回覆太隨機、思考過程漏出來），再回來找對應的參數。

Temperature（創意程度）

Temperature 控制 AI 選字的隨機性，數字越低越穩定可預測，數字越高越天馬行空。

把它想成廚師的發揮空間。調低等於照食譜做，調高就是讓廚師即興發揮。

範圍	效果	適合情境
0.1 – 0.5	穩定、可預測、容易重複	需要格式一致的輸出、不想要驚喜
0.7 – 1.0	平衡，大部分 RP 情境適用	日常角色扮演首選
1.2 – 2.0	天馬行空、文風多變、可能失控	需要強烈創意或隨機性，但容易亂掉

預設已經幫你調好了

大部分社群預設的 Temperature 都是根據預設作者的使用情境校調過的。改之前先確認預設裡是什麼值，不要直接蓋掉。改壞了記得回去看預設作者的設定說明。

Top P / Top K / Min P（取樣參數）

這三個都是篩選候選字的方式。AI 生成下一個字之前，先把一堆可能的字排好機率，再從裡面挑。

Top P（核心取樣）

從「累積機率加起來剛好到 P」的那些字裡選。比如 Top P = 0.9，就是從最可能的那些字裡選，直到它們加起來佔了 90% 的機率為止。

調低（0.5–0.8）：選字更保守，詞彙較單一
調高（0.9–1.0）：選字範圍更廣，文風更多元
設 1.0：不做 Top P 篩選，交給其他參數決定

Top K

從前 K 個最可能的字裡選，不管它們的機率是多少。

調低（10–30）：每次只從少數幾個最常見的字裡選
調高（50–100）：可選的字更多，文風更豐富

用 Google Vertex AI 的人注意

Vertex AI 對 Top K 有最小值限制，建議改成 64。預設值在 Vertex 上可能報錯。（[需查證：確認 Vertex AI Top K 最小值限制現況]）

Min P

過濾掉機率太低的字。只要某個字的機率低於「最高機率 × Min P」，就直接排除。

調高（0.05–0.1）：過濾掉更多低機率的奇怪字，輸出更穩
設 0：不做 Min P 篩選

通常只需要動一兩個

Top P、Top K、Min P 三個同時開的話效果會互相抵消，不容易搞清楚誰在影響什麼。一次只改一個，改完聊幾輪感受看看，不對再換下一個調。

Frequency Penalty / Presence Penalty（防重複）

這兩個參數都是用來防止 AI 一直重複相同字詞的。

Frequency Penalty（頻率懲罰）

字出現越多次，之後再出現的機率越低。出現 5 次比出現 1 次受到更多懲罰。

Presence Penalty（存在懲罰）

只要這個字出現過，之後再出現的機率就降低，不管它出現了幾次，懲罰力道一樣。

兩個的差異：

Frequency：越愛用某個字，越不讓它出現 → 對抗口頭禪、固定句式
Presence：出現過就算，不讓同樣的話題反覆繞 → 對抗話題繞圈圈

通常預設值就夠了

大部分情況下，預設值（通常是 0 或接近 0）已經夠用。AI 明顯在重複字詞或繞圈子時，才考慮把這兩個調高到 0.5–1.0 試試看。調太高反而會讓 AI 硬是避開正常的常用字，回覆讀起來卡卡的。

Context Size 與 Response Length 的關係

這兩個數字放在一起才有意義。

Context Size（上下文長度）= AI 這一次能讀的全部內容的上限（單位 Token）
Response Length（回覆長度）= AI 這一次能寫的回覆的上限

關係很直接：Context Size 減掉 Response Length，剩下的才是 AI 讀輸入的空間。

舉個例：Context 32768、Response 2048，AI 能讀的輸入（角色卡 + 歷史對話 + 世界書）就是約 30720 Token。

開大一定比較好嗎？

不見得。

Context 開太大：舊的對話都塞進去，但 AI 的注意力是有限的，太多資訊反而分心，重要設定容易被淡化。
Response 開太大：每次回覆費的 Token 更多，費用增加，但 AI 不一定寫得那麼長。

推薦策略：先用預設，感覺對話太快失憶再考慮調大 Context；感覺回覆一直斷在一半再調大 Response Length。

推理（Thinking / CoT）

「推理」讓 AI 先在心裡打草稿，再給你正式回覆。有些模型（如 Gemini 2.5 系列）支援這個功能，效果是回覆品質提升，但速度稍慢、費 Token。

怎麼開關

在 AI 回應設定 Tab 裡找「推理耗費」（Thinking Budget），調整推理的 Token 上限，或完全關掉。

草稿漏出來怎麼辦

如果你看到 AI 回覆裡出現 <think>...</think> 這種奇怪的標籤，是推理標籤設定沒配好。

在 進階格式化 Tab 裡找「推理標籤」欄位，確認設定：

開始標籤：thinking
結束標籤：thinking

Gemini 的推理標籤是 thinking，不是 think。設定對了，推理過程就會被正確包起來，不會顯示在你的聊天視窗裡。

預設裡的提示詞結構（快速帶過）

如果你有打開過預設（Preset）的編輯介面，會看到裡面有一堆名稱像是「System Prompt」「Jailbreak」「後指示」之類的區塊。這些是預設作者預先安排好的提示詞骨架。

簡單說一下它們的角色：

System Prompt：最基礎的人格設定和行為準則，在所有對話之前送給 AI
Jailbreak / Alignment Override：有些預設用來鬆開模型的保守傾向（俗稱「破限」），讓角色扮演更自由
後指示（Post-History / Final Instruction）：放在所有對話記錄之後、AI 回覆之前的最後提醒

這些區塊的排列順序和具體內容是預設作者花時間校調的結果。新手不用自己動。如果你想深入了解怎麼寫提示詞，建議去 Discord 社群問，或直接看你用的預設作者的說明文件。

想換預設但不知道從哪開始？

看看預設怎麼找＋怎麼裝，裡面有推薦的起步預設清單。

參數調完還是有問題？先到常見問題 → 聊天品質確認是不是其他原因，再回來微調參數。

進階參數調整 ​

Temperature（創意程度） ​

Top P / Top K / Min P（取樣參數） ​

Top P（核心取樣） ​

Top K ​

Min P ​

Frequency Penalty / Presence Penalty（防重複） ​

Frequency Penalty（頻率懲罰） ​

Presence Penalty（存在懲罰） ​

Context Size 與 Response Length 的關係 ​

開大一定比較好嗎？ ​

推理（Thinking / CoT） ​

怎麼開關 ​

草稿漏出來怎麼辦 ​

預設裡的提示詞結構（快速帶過） ​