API Müşterileri için Öncelikli İşleme
Bu teklif Enterprise müşterileri içindir. Daha fazla bilgi almak için satış ekibimiz ile iletişime geçin.
Öncelikli işleme hizmeti, kullandıkça ödeme esnekliği ile birlikte güvenilir ve yüksek hızlı performans sunar.
Öncelikli işlemeyi tercih ettiğinizde, şu avantajları kazanırsınız:
- Öngörülebilir ölçüde düşük gecikme süresi: Öncelikli işleme, talebin en yoğun olduğu saatlerde bile Standart işleme hizmetinden daha hızlı ve daha tutarlı bir hızda token üretir.
- Kullanımı kolay esneklik: Standart işleme gibi, Öncelikli işleme hizmetine de önceden kaynak ayırma gerektirmeyen esnek, kullandıkça ödeme esasına göre erişilebilir.
| 1 milyon girdi tokeni başına fiyat | 1 milyon girdi tokeni başına fiyat (önbelleğe alınmış) | 1 milyon çıktı tokeni başına fiyat | Çalışma Süresi SLA’sı3 | Gecikme Süresi SLA’sı3 | |
|---|---|---|---|---|---|
GPT-5.1 uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5 uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5 mini uzun bağlam hariç1 | $0,45 | $0,045 | $3,60 | %99,9 | %99 > saniye başına 80 token2 |
GPT-5.1 codex uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-5 codex uzun bağlam hariç1 | $2,50 | $0,250 | $20,00 | %99,9 | %99 > saniye başına 50 token2 |
GPT-4.1 uzun bağlam hariç1 | $3,50 | $0,875 | $14,00 | %99,9 | %99 > saniye başına 80 token2 |
GPT-4.1 mini uzun bağlam hariç1 | $0,70 | $0,175 | $2,80 | %99,9 | %99 > saniye başına 90 token2 |
GPT-4.1 nano uzun bağlam hariç1 | $0,20 | $0,050 | $0,80 | %99,9 | %99 > saniye başına 100 token2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | $4,25 | $2,125 | $17,00 | %99,9 | %99 > saniye başına 80 token2 |
gpt-4o-2024-05-13 | $8,75 | — | $26,25 | %99,9 | %99 > saniye başına 80 token2 |
GPT-4o mini | $0,25 | $0,125 | $1,00 | %99,9 | %99 > saniye başına 90 token2 |
o3 | $3,50 | $0,875 | $14,00 | %99,9 | %99 > saniye başına 80 token2 |
o4-mini | $2,00 | $0,500 | $8,00 | %99,9 | %99 > saniye başına 90 token2 |
Nasıl çalışır
Müşteriler, mevcut service_tier parametresinde service_tier = “priority” seçeneğini kullanarak trafiği istek bazında Öncelikli işlemeye yönlendirebilir.
Öncelikli işleme ile işlenen tokenler, Standart işleme ücretlerine kıyasla daha yüksek bir fiyata token başına faturalanır.
Çok yakında, talep düzeyinde yapılandırmanın yanı sıra proje düzeyinde katılım olanağı da eklemeyi planlıyoruz.
Sınırlamalar
- Öncelikli işleme limitleri diğer hizmet kademeleriyle paylaşılır.
- Nadir durumlarda, Öncelikli işleme Tokenlerinizin dakika başına kullanımının hızlı bir şekilde artması, artış hızı limitlerinin aşılmasına yol açabilir. Artış hızı limitini aşarsanız, oluşan ek trafik Standart işlemeye gönderilebilir.
Fiyatlandırma
Scale Tier kademesi, Öncelikli işlemeden ayrı kalır.
Öncelikli işlemeye gönderilen talepler ayrı olarak faturalanır ve satın aldığınız Scale Tier TPM paketlerinden düşülmez.
Modeller
Şimdilik hayır. En son modellerimizin dışındaki diğer ürünlerde Öncelikli işleme hizmeti sunup sunmayacağımızı ileride değerlendireceğiz.
Hız limitleri
Öncelikli işleme tüketimi, hız limitleri için standart API trafiğiyle aynı şekilde ele alınır.
Güvenilirlik
Sorularınız veya merak ettiğiniz konular varsa AD’niz ile iletişime geçin.
Öncelikli işleme SLA’ları, Scale Tier SLA’ları ile aynı şekilde yönetilir; belirli bir zaman aralığında kurumsal anlaşmalar kapsamındaki müşteriler için bu SLA’ları karşılayamadığımız durumlarda hizmet kredileri sunacağız.
Politikalar
Evet