Priority Processing kanggo Pelanggan API
Priority processing nawakake kinerja sing andal lan kacepetan dhuwur kanthi keluwesan bayar miturut panggunaan.
Kanthi milih Priority processing, sampeyan bisa entuk:
- Latensi rendah sing bisa diprediksi: Priority processing ngasilake token luwih cepet lan kanthi kacepetan sing luwih konsisten tinimbang layanan Standard processing, sanajan nalika panjaluk puncak.
- Keluwesan sing gampang digunakake: Kaya Standard processing, Priority processing bisa diakses kanthi cara fleksibel, bayar miturut panggunaan, tanpa perlu provisioning luwih dhisik.
| Rega saben 1 yuta token input | Rega saben 1 yuta token input (cached) | Rega saben 1 yuta token output | SLA wektu aktif3 | SLA Latensi3 | |
|---|---|---|---|---|---|
GPT-5.5 ora kalebu konteks dawa1 | US$ 12,50 | US$ 1,250 | US$ 75,00 | 99,9% | 99% > 50 token saben detik2 |
GPT-5.4 mini ora kalebu konteks dawa1 | US$ 1,50 | US$ 0,150 | US$ 9,00 | 99,9% | 99% > 100 token saben detik2 |
GPT-5.4 ora kalebu konteks dawa1 | US$ 5,00 | US$ 0,500 | US$ 30,00 | 99,9% | 99% > 50 token saben detik2 |
GPT-5.2 ora kalebu konteks dawa1 | US$ 3,50 | US$ 0,350 | US$ 28,00 | 99,9% | 99% > 50 token saben detik2 |
GPT-5.1 ora kalebu konteks dawa1 | US$ 2,50 | US$ 0,250 | US$ 20,00 | 99,9% | 99% > 50 token saben detik2 |
GPT-5 ora kalebu konteks dawa1 | US$ 2,50 | US$ 0,250 | US$ 20,00 | 99,9% | 99% > 50 token saben detik2 |
GPT-5 mini ora kalebu konteks dawa1 | US$ 0,45 | US$ 0,045 | US$ 3,60 | 99,9% | 99% > 80 token saben detik2 |
GPT-5.1 codex ora kalebu konteks dawa1 | US$ 2,50 | US$ 0,250 | US$ 20,00 | 99,9% | 99% > 50 token saben detik2 |
GPT-5 codex ora kalebu konteks dawa1 | US$ 2,50 | US$ 0,250 | US$ 20,00 | 99,9% | 99% > 50 token saben detik2 |
GPT-4.1 ora kalebu konteks dawa1 | US$ 3,50 | US$ 0,875 | US$ 14,00 | 99,9% | 99% > 80 token saben detik2 |
GPT-4.1 mini ora kalebu konteks dawa1 | US$ 0,70 | US$ 0,175 | US$ 2,80 | 99,9% | 99% > 90 token saben detik2 |
GPT-4.1 nano ora kalebu konteks dawa1 | US$ 0,20 | US$ 0,050 | US$ 0,80 | 99,9% | 99% > 100 token saben detik2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | US$ 4,25 | US$ 2,125 | US$ 17,00 | 99,9% | 99% > 80 token saben detik2 |
gpt-4o-2024-05-13 | US$ 8,75 | — | US$ 26,25 | 99,9% | 99% > 80 token saben detik2 |
GPT-4o mini | US$ 0,25 | US$ 0,125 | US$ 1,00 | 99,9% | 99% > 90 token saben detik2 |
o3 | US$ 3,50 | US$ 0,875 | US$ 14,00 | 99,9% | 99% > 80 token saben detik2 |
o4-mini | US$ 2,00 | US$ 0,500 | US$ 8,00 | 99,9% | 99% > 90 token saben detik2 |
1Panjaluk sing diprakirakaké >128K prompt token
2Diitung minangka latensi panjalukan p50 adhedhasar saben 5 menit. Kanggo pelanggan sing nduwèni perjanjian enterprise sing wis ana lan nduwèni SLA latensi sing diitung minangka latensi panjaluk p50 adhedhasar saben menit, SLA sadurungé uga isih tetep ditrapaké.
3Iki mung ditrapake kanggo pelanggan Enterprise wae
Cara kerjane
Pelanggan bisa ngarahake trafik menyang Priority processing saben request nganggo parameter service_tier sing wis ana, nganggo opsi service_tier = “priority”.
Token sing dilayani dening Priority processing bakal ditagih saben token, kanthi rega premium dibandhingake tarif Standard processing.
Saliyane diatur ing level request, sampeyan uga bisa nyetel default project menyang Priority ing Setelan Project → Default Service Tier: Priority. Sampeyan isih bisa ngowahi saben request.
Watesan
- Wates tarif Priority processing dienggo bareng karo service tier liyane.
- Ing kasus langka, kenaikan cepet ing Tokens per Minute Priority processing sampeyan bisa nyebabake kena wates ramp rate. Yen sampeyan ngluwihi wates ramp rate, trafik tambahan bisa dikirim menyang Standard processing.