API Müşterileri için Öncelikli İşlem
Öncelikli işlem hizmeti, kullandıkça ödeme esnekliği ile birlikte güvenilir ve yüksek hızlı performans sunar.
Öncelikli işlemi tercih ettiğinizde şu avantajları elde edebilirsiniz:
- Öngörülebilir ölçüde düşük gecikme süresi: Öncelikli işlem, talebin en yoğun olduğu saatlerde bile Standart işlem hizmetinden daha hızlı ve daha tutarlı bir hızda token üretir.
- Kullanımı kolay esneklik: Standart işlemde olduğu gibi Öncelikli işleme de önceden kaynak ayırma gerektirmeyen, esnek ve kullandıkça ödeme esasına dayalı bir modelle erişilebilir.
| 1 milyon girdi tokeni başına fiyat | 1 milyon girdi tokeni başına fiyat (önbelleğe alınmış) | 1 milyon çıktı tokeni başına fiyat | Çalışma Süresi SLA’sı3 | Gecikme Süresi SLA’sı3 | |
|---|---|---|---|---|---|
GPT-5.2 uzun bağlam hariç1 | $3,50 | $0,350 | $28,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5.1 uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5 uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5 mini uzun bağlam hariç1 | $0,45 | $0,045 | $3,60 | %99,9 | %99 > saniye başına 80 token2 |
GPT-5.1 codex uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5 codex uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-4.1 uzun bağlam hariç1 | $3,50 | $0,875 | $14,00 | %99,9 | %99 > saniye başına 80 token2 |
GPT-4.1 mini uzun bağlam hariç1 | $0,70 | $0,175 | $2,80 | %99,9 | %99 > saniye başına 90 token2 |
GPT-4.1 nano uzun bağlam hariç1 | $0,20 | $0,050 | $0,80 | %99,9 | %99 > saniye başına 100 token2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | $4,25 | $2,125 | $17,00 | %99,9 | %99 > saniye başına 80 token2 |
gpt-4o-2024-05-13 | $8,75 | — | $26,25 | %99,9 | %99 > saniye başına 80 token2 |
GPT-4o mini | $0,25 | $0,125 | $1,00 | %99,9 | %99 > saniye başına 90 token2 |
o3 | $3,50 | $0,875 | $14,00 | %99,9 | %99 > saniye başına 80 token2 |
o4-mini | $2,00 | $0,500 | $8,00 | %99,9 | %99 > saniye başına 90 token2 |
Çalışma biçimi
Müşteriler, mevcut service_tier parametresinde service_tier = “priority” seçeneğini kullanarak trafiği istek bazında Öncelikli işleme yönlendirebilir.
Öncelikli işlem ile işlenen token'lar, Standart işlem ücretlerine kıyasla daha yüksek bir fiyata token başına faturalanır.
Talep düzeyinde yapılandırmanın yanı sıra, Proje ayarları → Varsayılan Hizmet Kademesi: Öncelikli bölümünde bir projeyi varsayılan olarak Öncelikli işleme ayarlayabilirsiniz. Gerektiğinde her bir istek için bu ayarı geçersiz kılabilirsiniz.
Sınırlamalar
- Öncelikli işlem limitleri diğer hizmet kademeleriyle paylaşılır.
- Nadir durumlarda, Öncelikli işlem Token'larınızın dakika başına kullanımının hızlı bir şekilde artması, artış hızı limitlerinin aşılmasına yol açabilir. Artış hızı limitini aşarsanız ek trafik, Standart işlemeye yönlendirilebilir.
Fiyatlandırma
Scale Tier kademesi, Öncelikli işlemden ayrı kalır.
Öncelikli işleme gönderilen talepler ayrı olarak faturalanır ve satın aldığınız Scale Tier TPM paketlerinden düşülmez.
Modeller
Şimdilik hayır. En son modellerimizin dışındaki diğer ürünlerde Öncelikli işlem hizmeti sunup sunmayacağımızı ileride değerlendireceğiz.
Hız limitleri
Öncelikli işlem tüketimi, hız limitleri için standart API trafiğiyle aynı şekilde ele alınır.
Güvenilirlik
(Enterprise müşterileri için) Lütfen herhangi bir sorunuz veya endişeniz varsa hesap yöneticinizle iletişime geçebilirsiniz.
Öncelikli işleme SLA'ları, Scale Tier SLA'ları ile aynı şekilde yönetilir; belirli bir zaman aralığında kurumsal anlaşmalar kapsamındaki müşteriler için bu SLA'ları karşılayamadığımız durumlarda hizmet kredileri sunacağız.
Politikalar
Evet