連線與 API 常見問題
API 設定好了卻跑不動?從 key 貼錯位置、出現 429 錯誤、回應被安全過濾擋住,到試用額度用完怎麼辦、模型怎麼選,按問題找到對應段落,照做就好。
Key 貼了還是顯示「未連線」或「無法取得回應」
最常見的原因有三個,按順序排查:
1. 來源(Source)沒有選對。 酒館的 API 連線不是填一個框就好,要先在「API 來源」下拉選單選對服務商。Vertex AI 要選「Chat Completion → Google AI Studio / Vertex AI」,不是 OpenAI,也不是 KoboldAI。選錯來源,後面填什麼都沒用。
2. 憑證格式搞錯了。 Vertex AI 用的不是一串 API key,而是 Service Account 的 JSON 憑證檔,要把整個 JSON 內容貼進去(或上傳)。如果你貼的是一段像 AIza... 開頭的字串,那是 Google AI Studio 的 key,不是 Vertex 的,兩者不能互換。
3. 專案 ID 或地區填錯。 Vertex 還需要填 Google Cloud 的 Project ID 和服務地區(例如 us-central1)。Project ID 在 Google Cloud Console 左上方可以看到,不是「專案名稱」,也不是帳號 email。
照上面排查完還是不行,試試點酒館右上角的「連線測試」按鈕,看錯誤訊息的具體內容,通常會直接告訴你哪裡出問題。
出現「429」或「quota」字樣
這兩個錯誤代表你的 API 請求超出了限制:
429 Too Many Requests — 短時間內送太多請求,被暫時擋住。通常等幾秒到幾分鐘自然就好了。如果一直出現,可以在酒館設定裡把「Request Cooldown(請求冷卻時間)」調高一點。
quota exceeded / RESOURCE_EXHAUSTED — 你的 Google Cloud 專案用量超過了免費配額上限。Vertex AI 的免費配額是依每分鐘或每天計算的,不是試用期間無限用。碰到這個錯誤,等到隔天配額重置,或是在 Google Cloud Console 的「APIs & Services → Quotas」頁面確認哪項配額超了。
如果每天都在觸發 quota,表示用量已經超過免費額度能承擔的,可以考慮:
- 換用呼叫限制比較寬鬆的模型(例如 Flash 系列比 Pro 系列便宜很多)
- 開始付費或切換到 OpenRouter
回應空白、或每次都被截斷、或出現安全過濾訊息
這三種狀況原因不同:
回應完全空白(沒有任何文字):通常是安全過濾把整個回應擋掉了。Vertex AI 預設的內容安全設定比較嚴,某些角色扮演情境(特別是帶有衝突、黑暗主題的劇情)會被過濾。[需查證:Vertex AI Console 安全設定的調整位置與有效度] 暫時的解法是換一個設定比較寬鬆的模型,或調整角色卡裡的描述措辭。
回應講到一半就沒了(不是句子結尾):這是「最大回應長度」設定不夠長。在酒館的 AI 設定裡找「Max new tokens」或「Maximum length」,把數值調高(2048 以上)。詳情見 聊天品質:回覆講到一半斷掉。
出現明確的安全警告文字:大多是角色卡或聊天內容觸發了模型的安全機制。先試著繼續對話幾輪,或重新生成(🔄 按鈕)看看能不能繞開。長期解法是選用審查較寬鬆的模型,或透過預設(preset)調整系統提示的措辭。
90 天試用到期或額度用完了怎麼辦
Google Cloud Vertex AI 提供新帳號 90 天 US$300 試用額度 [需查證:2026 年活動現況],到期或用完後,有幾條路可以走:
選項 A:轉到 OpenRouter(推薦新手) OpenRouter 是一個 API 聚合服務,接入很多家模型,可以用少量美金按量計費,不需要綁信用卡也能先充值。酒館支援 OpenRouter,設定方式另見外部教學:OpenRouter API 申請教學(外部連結,非本站維護)。
選項 B:Vertex AI 升級付費 試用期結束後,Vertex AI 可以直接升級為正式付費帳號,繼續用同一個 Google Cloud 專案。費用依模型與使用量計算,輕度使用一個月大約幾塊美金到幾十塊,視模型選擇差異很大。開始付費前建議先設定 Cloud Billing 的費用上限警示。
選項 C:再開一個 Google 帳號 有些人會新開帳號再拿一次試用額度。這沒有明文禁止,但違反 Google 服務條款的灰色地帶,且不保證能無限制重複使用,自行斟酌。
不同模型怎麼選
一句話原則:先用免費配額內最新的 Flash 系列,覺得品質不夠再試 Pro 系列。
Flash 系列(例如 gemini-2.0-flash)速度快、費用低、免費配額多,日常聊天品質已經很夠用。Pro 系列品質更好但貴很多、配額也少得多。
選模型的實際考量:
- 試用期間:先從 Flash 開始,感受差距後再試 Pro
- 對話品質特別在意:Pro 系列,準備好接受更快消耗配額
- 主要目的是長篇創作、複雜劇情:Pro 系列的上下文掌握更穩定
- 預算優先:Flash 系列就好,搭配好的預設(preset)和角色卡可以彌補差距
模型名稱在「Chat Completion → 模型」下拉選單選,酒館會自動顯示你目前帳號可用的清單。
