Liwati menyang isi utama
OpenAI

Priority Processing kanggo Pelanggan API

Priority processing nawakake kinerja sing andal lan kacepetan dhuwur kanthi keluwesan bayar miturut panggunaan.

Kanthi milih Priority processing, sampeyan bisa entuk:

  • Latensi rendah sing bisa diprediksi: Priority processing ngasilake token luwih cepet lan kanthi kacepetan sing luwih konsisten tinimbang layanan Standard processing, sanajan nalika panjaluk puncak.
  • Keluwesan sing gampang digunakake: Kaya Standard processing, Priority processing bisa diakses kanthi cara fleksibel, bayar miturut panggunaan, tanpa perlu provisioning luwih dhisik.
Rega saben 1 yuta token inputRega saben 1 yuta token input (cached)Rega saben 1 yuta token outputSLA wektu aktif3SLA Latensi3
GPT-5.5
ora kalebu konteks dawa1
US$ 12,50US$ 1,250US$ 75,0099,9%99% > 50 token saben detik2
GPT-5.4 mini
ora kalebu konteks dawa1
US$ 1,50US$ 0,150US$ 9,0099,9%99% > 100 token saben detik2
GPT-5.4
ora kalebu konteks dawa1
US$ 5,00US$ 0,500US$ 30,0099,9%99% > 50 token saben detik2
GPT-5.2
ora kalebu konteks dawa1
US$ 3,50US$ 0,350US$ 28,0099,9%99% > 50 token saben detik2
GPT-5.1
ora kalebu konteks dawa1
US$ 2,50US$ 0,250US$ 20,0099,9%99% > 50 token saben detik2
GPT-5
ora kalebu konteks dawa1
US$ 2,50US$ 0,250US$ 20,0099,9%99% > 50 token saben detik2
GPT-5 mini
ora kalebu konteks dawa1
US$ 0,45US$ 0,045US$ 3,6099,9%99% > 80 token saben detik2
GPT-5.1 codex
ora kalebu konteks dawa1
US$ 2,50US$ 0,250US$ 20,0099,9%99% > 50 token saben detik2
GPT-5 codex
ora kalebu konteks dawa1
US$ 2,50US$ 0,250US$ 20,0099,9%99% > 50 token saben detik2
GPT-4.1
ora kalebu konteks dawa1
US$ 3,50US$ 0,875US$ 14,0099,9%99% > 80 token saben detik2
GPT-4.1 mini
ora kalebu konteks dawa1
US$ 0,70US$ 0,175US$ 2,8099,9%99% > 90 token saben detik2
GPT-4.1 nano
ora kalebu konteks dawa1
US$ 0,20US$ 0,050US$ 0,8099,9%99% > 100 token saben detik2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
US$ 4,25US$ 2,125US$ 17,0099,9%99% > 80 token saben detik2
gpt-4o-2024-05-13
US$ 8,75US$ 26,2599,9%99% > 80 token saben detik2
GPT-4o mini
US$ 0,25US$ 0,125US$ 1,0099,9%99% > 90 token saben detik2
o3
US$ 3,50US$ 0,875US$ 14,0099,9%99% > 80 token saben detik2
o4-mini
US$ 2,00US$ 0,500US$ 8,0099,9%99% > 90 token saben detik2
1Panjaluk sing diprakirakaké >128K prompt token
2Diitung minangka latensi panjalukan p50 adhedhasar saben 5 menit. Kanggo pelanggan sing nduwèni perjanjian enterprise sing wis ana lan nduwèni SLA latensi sing diitung minangka latensi panjaluk p50 adhedhasar saben menit, SLA sadurungé uga isih tetep ditrapaké.
3Iki mung ditrapake kanggo pelanggan Enterprise wae

Cara kerjane

Pelanggan bisa ngarahake trafik menyang Priority processing saben request nganggo parameter service_tier sing wis ana, nganggo opsi service_tier = “priority”.

Token sing dilayani dening Priority processing bakal ditagih saben token, kanthi rega premium dibandhingake tarif Standard processing. 

Saliyane diatur ing level request, sampeyan uga bisa nyetel default project menyang Priority ing Setelan Project → Default Service Tier: Priority. Sampeyan isih bisa ngowahi saben request.

Watesan

  • Wates tarif Priority processing dienggo bareng karo service tier liyane. 
  • Ing kasus langka, kenaikan cepet ing Tokens per Minute Priority processing sampeyan bisa nyebabake kena wates ramp rate. Yen sampeyan ngluwihi wates ramp rate, trafik tambahan bisa dikirim menyang Standard processing.

Rega

Model

Wates tarif

Keandalan

Kebijakan