APIMaster.ai
Back to Blog
APIMaster Blog

OpenAI "Rate Limit Exceeded" (429) Hatası Nasıl Düzeltilir — RPM, TPM ve Yeniden Denemeler

OpenAI rate limit exceeded ve HTTP 429 hatalarını düzeltin. RPM/TPM limitlerini, üstel geri çekilmeyi ve çok kanallı yedekleme ile bir LLM ağ geçidinin uygulamanızı nasıl çalışır durumda tuttuğunu anlayın.

API hatasıhız sınırıOpenAI API429 hatasıLLM ağ geçidi

Published 2026-06-29

Quick Answer

OpenAI rate limit exceeded (HTTP 429 Too Many Requests), model çağrınızı tamamlayamadan bir işlem kapasitesi sınırına — dakikadaki istek sayısı (RPM), dakikadaki token sayısı (TPM) veya günlük harcama limitleri — ulaştığınız anlamına gelir. Hata genellikle Rate limit reached veya rate_limit_exceeded mesajını içerir.

Hızlı çözümler: üstel geri çekilme ile yavaşlayın, istekleri gruplayın veya kuyruğa alın, max_tokens değerini azaltın, OpenAI seviyenizi yükseltin veya alternatif yukarı akış kanallarına otomatik olarak geçiş yapan bir ağ geçidi kullanın. APIMaster, birden fazla rotayı birleştirir, böylece bir satıcının 429 hatası üretim trafiğini durdurmaz.

Bu Hata Ne Anlama Geliyor

Kimlik doğrulama başarılı olduktan sonra OpenAI, istekleri ve tokenları ne kadar hızlı tükettiğinizi ölçer. Kovayı aşarsanız API 429 döndürür:

{
  "error": {
    "message": "Rate limit reached for gpt-4o in organization org-xxx on requests per min (RPM): Limit 500, Used 500, Requested 1.",
    "type": "tokens",
    "code": "rate_limit_exceeded"
  }
}

Üçüncü taraf aktarıcılar aynı dizeyi veya genel bir 429 sarmalayıcısını gösterebilir. Bu, geçersiz bir API anahtarından (401) veya engellenen içerikten (400) farklıdır — anahtarınız geçerlidir, sadece mevcut kota seviyesi için çok hızlı veya çok ağırsınız.

Yaygın Nedenler

  1. Ani trafik patlaması — aynı saniyede istek gönderen çok sayıda paralel kullanıcı veya aracı.
  2. Yüksek max_tokens — büyük tamamlamalar, orta düzey RPM'de bile TPM'yi hızla tüketir.
  3. Yeniden deneme fırtınaları — uygulamanız 429'ları geri çekilme olmadan hemen yeniden dener ve limitleri daha da kötüleştirir.
  4. Paylaşılan organizasyon anahtarı — birden çok hizmet bir anahtarı yeniden kullanır ve tek bir RPM/TPM havuzunu paylaşır.
  5. Ücretsiz / düşük seviye limitleri — yeni OpenAI hesapları ve ucuz aktarıcılar, işlem kapasitesini agresif bir şekilde sınırlar.
  6. Modele özel limitler — öncü modeller genellikle `gpt-4o-mini'den daha düşük RPM'ye sahiptir.
  7. Akış + araçlar — aracı döngüleri, kullanıcı eylemi başına çağrıları çoğaltır.

Nasıl Düzeltilir

1. 429 yanıt başlıklarını okuyun

OpenAI genellikle x-ratelimit-limit-requests, x-ratelimit-remaining-requests ve retry-after gönderir. Yeniden denemeden önce retry-after saniyesi geçene kadar bekleyin.

2. Sıçrama ile üstel geri çekilme uygulayın

import time, random
from openai import OpenAI, RateLimitError

client = OpenAI()
for attempt in range(6):
    try:
        return client.chat.completions.create(
            model="gpt-4o-mini",
            messages=[{"role": "user", "content": "hello"}],
        )
    except RateLimitError:
        time.sleep(min(60, (2 ** attempt) + random.random()))

429'da asla sıkı döngü yapmayın — kesintiyi uzatırsınız.

3. Yükü azaltın

  • Mümkün olduğunda max_tokens değerini düşürün.
  • Aynı istemleri önbelleğe alın.
  • Sınırsız istemci paralelliği yerine istekleri sunucu tarafında (işçi + Redis) kuyruğa alın.
  • Sınıflandırma veya yönlendirme adımları için daha ucuz/küçük modeller kullanın.

4. Resmi limitleri yükseltin

OpenAI'da: fatura ekleyin, seviye yükseltme talep edin veya iş yüklerini projeler/organizasyonlar arasında sorumlu bir şekilde bölün (yine de politikaya tabidir).

5. Otomatik yedeklemeli bir ağ geçidi kullanın

Üretim uygulamaları tek bir yukarı akış RPM havuzuna bağlı olmamalıdır. Bir LLM ağ geçidi şunları yapabilir:

  • Biri 429 döndürdüğünde başka bir sağlayıcıya veya kanala yönlendirme
  • İzin verildiğinde trafiği anahtarlar veya bölgeler arasında dağıtma
  • Uçta kuyruğa alma işlemini yüzeye çıkararak uygulamanızın daha az sert hata görmesini sağlama

APIMaster, çok kanallı yönlendirme ile OpenAI uyumlu bir toplayıcıdır — bir yol kısıtlandığında trafik mevcut alternatiflere geçebilir. 1$'dan başlayan bakiye yükleme, SDK'ları https://apimaster.ai/v1 adresine yönlendirin ve her satıcı limitini elle ayarlamadan geliştirmeye devam edin.

APIMaster'da başlayın →

APIMaster Nasıl Yardımcı Olur

Çok sık 429 hatası mı alıyorsunuz? APIMaster üç cephede yardımcı olur:

Avantaj Ne elde edersiniz
İndirim Pazar Yeri fiyatlandırması — resmi liste fiyatlarına göre ~%90 / ~%85'e varan indirim; aynı bütçeyi daha da ileriye taşıyın.
Kararlılık Bir yukarı akış RPM/TPM limitlerine ulaştığında otomatik yedekleme — daha az tek satıcılı 429 kesintisi (uygulama düzeyinde geri çekilme ile eşleştirin).
Model doğruluğu Yedeklemeden sonra, Model Test Cihazı'nı kullanın; anahtarları Anahtar Test Cihazı ile kontrol edin.

https://apimaster.ai/v1 · 1$'dan başlayan bakiye, kullandıkça öde.

APIMaster'a kaydolun →

İlgili API Hataları

SSS

OpenAI rate limit exceeded nedir? Organizasyonunuz ve modeliniz için RPM, TPM veya ilgili kotaları aştığınızı belirten HTTP 429. Bekleyin ve geri çekilme ile yeniden deneyin veya yedeklemeli bir ağ geçidi üzerinden yönlendirin.

429 ve 529 arasındaki fark nedir? 429 genellikle sizin kotanız / hızınızdır (OpenAI RPM/TPM). Anthropic'teki 529 ise sunucu aşırı yüküdür — hizmet geçici olarak kapasite dolu. Düzeltme desenleri farklıdır; 529 kılavuzumuza bakın.

OpenAI seviyesini yükseltmek tüm 429'ları düzeltir mi? Limitleri yükseltir ancak ani aracı trafiği yine de sınırlara takılabilir. Üretim için kalıcı çözüm, ağ geçitleri artı kuyruğa almadır.

APIMaster hız sınırlarını tamamen kaldırır mı? Hiçbir platform sınırsız öncü model işlem kapasitesi sunmaz. APIMaster, bir yukarı akış kısıtladığında kanallar arasında yönlendirme yaparak kullanılabilirliği artırır — uygulamanızda yine de geri çekilme uygulamalısınız.