Ana içeriğe atla
OpenAI

API Müşterileri için Öncelikli İşlem

Öncelikli işlem hizmeti, kullandıkça ödeme esnekliği ile birlikte güvenilir ve yüksek hızlı performans sunar.

Öncelikli işlemi tercih ettiğinizde şu avantajları elde edebilirsiniz:

  • Öngörülebilir ölçüde düşük gecikme süresi: Öncelikli işlem, talebin en yoğun olduğu saatlerde bile Standart işlem hizmetinden daha hızlı ve daha tutarlı bir hızda token üretir.
  • Kullanımı kolay esneklik: Standart işlemde olduğu gibi Öncelikli işleme de önceden kaynak ayırma gerektirmeyen, esnek ve kullandıkça ödeme esasına dayalı bir modelle erişilebilir.
1 milyon girdi tokeni başına fiyat1 milyon girdi tokeni başına fiyat (önbelleğe alınmış)1 milyon çıktı tokeni başına fiyatÇalışma Süresi SLA’sı3Gecikme Süresi SLA’sı3
GPT-5.2
uzun bağlam hariç1
$3,50$0,350$28,00%99,9%99 > saniye başına 50 token2
GPT-5.1
uzun bağlam hariç1
$2,50$0,250$20,00%99,9%99 > saniye başına 50 token2
GPT-5
uzun bağlam hariç1
$2,50$0,250$20,00%99,9%99 > saniye başına 50 token2
GPT-5 mini
uzun bağlam hariç1
$0,45$0,045$3,60%99,9%99 > saniye başına 80 token2
GPT-5.1 codex
uzun bağlam hariç1
$2,50$0,250$20,00%99,9%99 > saniye başına 50 token2
GPT-5 codex
uzun bağlam hariç1
$2,50$0,250$20,00%99,9%99 > saniye başına 50 token2
GPT-4.1
uzun bağlam hariç1
$3,50$0,875$14,00%99,9%99 > saniye başına 80 token2
GPT-4.1 mini
uzun bağlam hariç1
$0,70$0,175$2,80%99,9%99 > saniye başına 90 token2
GPT-4.1 nano
uzun bağlam hariç1
$0,20$0,050$0,80%99,9%99 > saniye başına 100 token2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
$4,25$2,125$17,00%99,9%99 > saniye başına 80 token2
gpt-4o-2024-05-13
$8,75$26,25%99,9%99 > saniye başına 80 token2
GPT-4o mini
$0,25$0,125$1,00%99,9%99 > saniye başına 90 token2
o3
$3,50$0,875$14,00%99,9%99 > saniye başına 80 token2
o4-mini
$2,00$0,500$8,00%99,9%99 > saniye başına 90 token2
1Tahmini talep >128.000 istem tokeni
25 dakika başına p50 talep gecikme süresi olarak hesaplanır. Dakika başına p50 talep gecikme süresi olarak hesaplanan gecikme SLA’larına sahip mevcut kurumsal sözleşmeleri olan müşteriler için önceki SLA’lar da hala geçerlidir.
3Bu sadece Enterprise müşterileri için geçerlidir

Çalışma biçimi

Müşteriler, mevcut service_tier parametresinde service_tier = “priority” seçeneğini kullanarak trafiği istek bazında Öncelikli işleme yönlendirebilir.

Öncelikli işlem ile işlenen token'lar, Standart işlem ücretlerine kıyasla daha yüksek bir fiyata token başına faturalanır. 

Talep düzeyinde yapılandırmanın yanı sıra, Proje ayarları → Varsayılan Hizmet Kademesi: Öncelikli bölümünde bir projeyi varsayılan olarak Öncelikli işleme ayarlayabilirsiniz. Gerektiğinde her bir istek için bu ayarı geçersiz kılabilirsiniz.

Sınırlamalar

  • Öncelikli işlem limitleri diğer hizmet kademeleriyle paylaşılır. 
  • Nadir durumlarda, Öncelikli işlem Token'larınızın dakika başına kullanımının hızlı bir şekilde artması, artış hızı limitlerinin aşılmasına yol açabilir. Artış hızı limitini aşarsanız ek trafik, Standart işlemeye yönlendirilebilir.

Fiyatlandırma

Scale Tier kademesi, Öncelikli işlemden ayrı kalır.

Öncelikli işleme gönderilen talepler ayrı olarak faturalanır ve satın aldığınız Scale Tier TPM paketlerinden düşülmez.

Modeller

Şimdilik hayır. En son modellerimizin dışındaki diğer ürünlerde Öncelikli işlem hizmeti sunup sunmayacağımızı ileride değerlendireceğiz.

Hız limitleri

Öncelikli işlem tüketimi, hız limitleri için standart API trafiğiyle aynı şekilde ele alınır.

Güvenilirlik

(Enterprise müşterileri için) Lütfen herhangi bir sorunuz veya endişeniz varsa hesap yöneticinizle iletişime geçebilirsiniz. 

Öncelikli işleme SLA'ları, Scale Tier SLA'ları ile aynı şekilde yönetilir; belirli bir zaman aralığında kurumsal anlaşmalar kapsamındaki müşteriler için bu SLA'ları karşılayamadığımız durumlarda hizmet kredileri sunacağız.

Politikalar

Evet