APIMaster 部落格

如何修復 OpenAI「超出速率限制」(429) — RPM、TPM 與重試機制

修復 OpenAI 超出速率限制與 HTTP 429 錯誤。了解 RPM/TPM 限制、指數退避，以及具備多通道備援的 LLM 閘道如何讓您的應用程式持續運作。

API 錯誤速率限制OpenAI API429 錯誤LLM 閘道

發布於 2026-06-29

快速結論

OpenAI 超出速率限制（HTTP 429 Too Many Requests）表示您在模型完成呼叫之前，達到了吞吐量上限——每分鐘請求數 (RPM)、每分鐘 Token 數 (TPM) 或每日花費限制。此錯誤通常包含 Rate limit reached 或 rate_limit_exceeded 訊息。

快速修復方法： 使用指數退避減慢速度、批次處理或排隊請求、減少 max_tokens、升級您的 OpenAI 方案，或透過能自動故障轉移到備用上游通道的閘道路由。APIMaster 匯集多條路由，讓單一供應商的 429 錯誤不會中斷您的正式環境流量。

此錯誤的含義

在驗證成功後，OpenAI 會計量您消耗請求和 Token 的速度。一旦超過配額，API 就會返回 429：

{
  "error": {
    "message": "組織 org-xxx 在 gpt-4o 上已達到每分鐘請求數 (RPM) 的速率限制：限制 500，已使用 500，請求 1。",
    "type": "tokens",
    "code": "rate_limit_exceeded"
  }
}

第三方轉發服務可能顯示相同的字串或通用的 429 包裝。這與 API 金鑰無效 (401) 或內容被封鎖 (400) 不同——您的金鑰是有效的，只是對於當前的配額方案來說，速度太快或負載太重。

常見原因

突發流量 — 許多並行使用者或代理程式在同一秒內發送請求。
高 max_tokens 設定 — 即使 RPM 適中，大型回應也會快速消耗 TPM。
重試風暴 — 您的應用程式在遇到 429 時立即重試，沒有退避機制，反而使限制更糟。
共用組織金鑰 — 多個服務重複使用一個金鑰，共享同一個 RPM/TPM 配額。
免費 / 低階方案限制 — 新的 OpenAI 帳戶和便宜的轉發服務會嚴格限制吞吐量。
模型特定上限 — 前沿模型通常比 gpt-4o-mini 有更低的 RPM。
串流 + 工具使用 — 代理循環會為每個使用者操作產生多次呼叫。

如何修復

1. 讀取 429 回應標頭

OpenAI 通常會發送 x-ratelimit-limit-requests、x-ratelimit-remaining-requests 和 retry-after。在重試之前，請等待 retry-after 秒數過去。

2. 實作帶有抖動的指數退避

import time, random
from openai import OpenAI, RateLimitError

client = OpenAI()
for attempt in range(6):
    try:
        return client.chat.completions.create(
            model="gpt-4o-mini",
            messages=[{"role": "user", "content": "hello"}],
        )
    except RateLimitError:
        time.sleep(min(60, (2 ** attempt) + random.random()))

切勿在遇到 429 時緊密循環重試——這會延長服務中斷時間。

3. 減少負載

在可能的情況下降低 max_tokens。
快取相同的提示詞。
在伺服器端對請求進行排隊（使用 Worker + Redis），而不是無限制的客戶端並行。
對於分類或路由步驟，使用更便宜/更小的模型。

4. 提高官方限制

在 OpenAI 上：添加付款方式、申請方案升級，或負責任地將工作負載分散到多個專案/組織（仍須遵守政策）。

5. 使用具備自動備援功能的閘道

正式環境應用程式不應依賴單一上游 RPM 配額。一個 LLM 閘道 可以：

當一個通道返回 429 時，路由到另一個供應商或通道
在允許的情況下，將流量分散到多個金鑰或區域
在邊緣層進行排隊，讓您的應用程式看到更少的硬性失敗

APIMaster 是一個相容 OpenAI 的聚合器，具有多通道路由功能——當一個路徑被限流時，流量可以轉移到可用的替代路徑。從 $1 起儲值，將 SDK 指向 https://apimaster.ai/v1，繼續開發，無需手動調整每個供應商的限制。

立即開始使用 APIMaster →

APIMaster 如何提供幫助

經常遇到 429 錯誤嗎？APIMaster 在三個方面提供協助：

優勢	您將獲得
折扣	市集定價——比官方牌價最高節省約 90% / 約 85%；讓相同預算發揮更大效益。
穩定性	當一個上游達到 RPM/TPM 上限時自動備援——減少單一供應商的 429 停機時間（請搭配應用程式層級的退避機制）。
模型保真度	故障轉移後，使用模型測試器；使用金鑰測試器檢查金鑰。

https://apimaster.ai/v1 · 最低 $1 起儲值，隨用隨付。

註冊 APIMaster →

常見問題

什麼是 OpenAI 超出速率限制？ HTTP 429 狀態碼，表示您的組織和模型超出了 RPM、TPM 或相關配額。請等待並使用退避機制重試，或透過具有備援功能的閘道路由。

429 與 529 有何不同？ 429 通常是您的配額/速率（OpenAI RPM/TPM）。Anthropic 的 529 是伺服器超載——服務暫時達到容量上限。修復模式不同；請參閱我們的 529 指南。

升級 OpenAI 方案能解決所有 429 錯誤嗎？ 它可以提高上限，但突發的代理流量仍可能達到限制。對於正式環境，閘道加上排隊機制是持久的解決方案。

APIMaster 能完全消除速率限制嗎？ 沒有任何平台能提供無限的前沿模型吞吐量。APIMaster 透過在一個上游限流時跨通道路由來提高可用性——您仍應在應用程式中實作退避機制。