Ana içeriğe atla
OpenAI

API Müşterileri için Öncelikli İşleme

Bu teklif Enterprise müşterileri içindir. Daha fazla bilgi almak için satış ekibimiz ile iletişime geçin.

Öncelikli işleme hizmeti, kullandıkça ödeme esnekliği ile birlikte güvenilir ve yüksek hızlı performans sunar.

Öncelikli işlemeyi tercih ettiğinizde, şu avantajları kazanırsınız:

  • Öngörülebilir ölçüde düşük gecikme süresi: Öncelikli işleme, talebin en yoğun olduğu saatlerde bile Standart işleme hizmetinden daha hızlı ve daha tutarlı bir hızda token üretir.
  • Kullanımı kolay esneklik: Standart işleme gibi, Öncelikli işleme hizmetine de önceden kaynak ayırma gerektirmeyen esnek, kullandıkça ödeme esasına göre erişilebilir.
1 milyon girdi tokeni başına fiyat1 milyon girdi tokeni başına fiyat (önbelleğe alınmış)1 milyon çıktı tokeni başına fiyatÇalışma Süresi SLA’sı3Gecikme Süresi SLA’sı3
GPT-5.1
uzun bağlam hariç1
$2,50$0,250$20,00%99,9%99 > saniye başına 50 token2
GPT-5
uzun bağlam hariç1
$2,50$0,250$20,00%99,9%99 > saniye başına 50 token2
GPT-5 mini
uzun bağlam hariç1
$0,45$0,045$3,60%99,9%99 > saniye başına 80 token2
GPT-5.1 codex
uzun bağlam hariç1
$2,50$0,250$20,00%99,9%99 > saniye başına 50 token2
GPT-5 codex
uzun bağlam hariç1
$2,50$0,250$20,00%99,9%99 > saniye başına 50 token2
GPT-4.1
uzun bağlam hariç1
$3,50$0,875$14,00%99,9%99 > saniye başına 80 token2
GPT-4.1 mini
uzun bağlam hariç1
$0,70$0,175$2,80%99,9%99 > saniye başına 90 token2
GPT-4.1 nano
uzun bağlam hariç1
$0,20$0,050$0,80%99,9%99 > saniye başına 100 token2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
$4,25$2,125$17,00%99,9%99 > saniye başına 80 token2
gpt-4o-2024-05-13
$8,75$26,25%99,9%99 > saniye başına 80 token2
GPT-4o mini
$0,25$0,125$1,00%99,9%99 > saniye başına 90 token2
o3
$3,50$0,875$14,00%99,9%99 > saniye başına 80 token2
o4-mini
$2,00$0,500$8,00%99,9%99 > saniye başına 90 token2
1Tahmini talep >128.000 istem tokeni
25 dakika başına p50 talep gecikme süresi olarak hesaplanır. Dakika başına p50 talep gecikme süresi olarak hesaplanan gecikme SLA’larına sahip mevcut kurumsal sözleşmeleri olan müşteriler için önceki SLA’lar da hala geçerlidir.
3Bu sadece Enterprise müşterileri için geçerlidir

Nasıl çalışır

Müşteriler, mevcut service_tier parametresinde service_tier = “priority” seçeneğini kullanarak trafiği istek bazında Öncelikli işlemeye yönlendirebilir.

Öncelikli işleme ile işlenen tokenler, Standart işleme ücretlerine kıyasla daha yüksek bir fiyata token başına faturalanır. 

Çok yakında, talep düzeyinde yapılandırmanın yanı sıra proje düzeyinde katılım olanağı da eklemeyi planlıyoruz.

Sınırlamalar

  • Öncelikli işleme limitleri diğer hizmet kademeleriyle paylaşılır. 
  • Nadir durumlarda, Öncelikli işleme Tokenlerinizin dakika başına kullanımının hızlı bir şekilde artması, artış hızı limitlerinin aşılmasına yol açabilir. Artış hızı limitini aşarsanız, oluşan ek trafik Standart işlemeye gönderilebilir.

Fiyatlandırma

Scale Tier kademesi, Öncelikli işlemeden ayrı kalır.

Öncelikli işlemeye gönderilen talepler ayrı olarak faturalanır ve satın aldığınız Scale Tier TPM paketlerinden düşülmez.

Modeller

Şimdilik hayır. En son modellerimizin dışındaki diğer ürünlerde Öncelikli işleme hizmeti sunup sunmayacağımızı ileride değerlendireceğiz.

Hız limitleri

Öncelikli işleme tüketimi, hız limitleri için standart API trafiğiyle aynı şekilde ele alınır.

Güvenilirlik

Sorularınız veya merak ettiğiniz konular varsa AD’niz ile iletişime geçin. 

Öncelikli işleme SLA’ları, Scale Tier SLA’ları ile aynı şekilde yönetilir; belirli bir zaman aralığında kurumsal anlaşmalar kapsamındaki müşteriler için bu SLA’ları karşılayamadığımız durumlarda hizmet kredileri sunacağız.

Politikalar

Evet