Priority Processing kanggo Pelanggan API

Priority processing nawakake kinerja sing andal lan kacepetan dhuwur kanthi keluwesan bayar miturut panggunaan.

Kanthi milih Priority processing, sampeyan bisa entuk:

Latensi rendah sing bisa diprediksi: Priority processing ngasilake token luwih cepet lan kanthi kacepetan sing luwih konsisten tinimbang layanan Standard processing, sanajan nalika panjaluk puncak.
Keluwesan sing gampang digunakake: Kaya Standard processing, Priority processing bisa diakses kanthi cara fleksibel, bayar miturut panggunaan, tanpa perlu provisioning luwih dhisik.

	Rega saben 1 yuta token input	Rega saben 1 yuta token input (cached)	Rega saben 1 yuta token output	SLA wektu aktif³	SLA Latensi³
GPT-5.5 ora kalebu konteks dawa¹	US$ 12,50	US$ 1,250	US$ 75,00	99,9%	99% > 50 token saben detik²
GPT-5.4 mini ora kalebu konteks dawa¹	US$ 1,50	US$ 0,150	US$ 9,00	99,9%	99% > 100 token saben detik²
GPT-5.4 ora kalebu konteks dawa¹	US$ 5,00	US$ 0,500	US$ 30,00	99,9%	99% > 50 token saben detik²
GPT-5.2 ora kalebu konteks dawa¹	US$ 3,50	US$ 0,350	US$ 28,00	99,9%	99% > 50 token saben detik²
GPT-5.1 ora kalebu konteks dawa¹	US$ 2,50	US$ 0,250	US$ 20,00	99,9%	99% > 50 token saben detik²
GPT-5 ora kalebu konteks dawa¹	US$ 2,50	US$ 0,250	US$ 20,00	99,9%	99% > 50 token saben detik²
GPT-5 mini ora kalebu konteks dawa¹	US$ 0,45	US$ 0,045	US$ 3,60	99,9%	99% > 80 token saben detik²
GPT-5.1 codex ora kalebu konteks dawa¹	US$ 2,50	US$ 0,250	US$ 20,00	99,9%	99% > 50 token saben detik²
GPT-5 codex ora kalebu konteks dawa¹	US$ 2,50	US$ 0,250	US$ 20,00	99,9%	99% > 50 token saben detik²
GPT-4.1 ora kalebu konteks dawa¹	US$ 3,50	US$ 0,875	US$ 14,00	99,9%	99% > 80 token saben detik²
GPT-4.1 mini ora kalebu konteks dawa¹	US$ 0,70	US$ 0,175	US$ 2,80	99,9%	99% > 90 token saben detik²
GPT-4.1 nano ora kalebu konteks dawa¹	US$ 0,20	US$ 0,050	US$ 0,80	99,9%	99% > 100 token saben detik²
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06	US$ 4,25	US$ 2,125	US$ 17,00	99,9%	99% > 80 token saben detik²
gpt-4o-2024-05-13	US$ 8,75	—	US$ 26,25	99,9%	99% > 80 token saben detik²
GPT-4o mini	US$ 0,25	US$ 0,125	US$ 1,00	99,9%	99% > 90 token saben detik²
o3	US$ 3,50	US$ 0,875	US$ 14,00	99,9%	99% > 80 token saben detik²
o4-mini	US$ 2,00	US$ 0,500	US$ 8,00	99,9%	99% > 90 token saben detik²

1Panjaluk sing diprakirakaké >128K prompt token

2Diitung minangka latensi panjalukan p50 adhedhasar saben 5 menit. Kanggo pelanggan sing nduwèni perjanjian enterprise sing wis ana lan nduwèni SLA latensi sing diitung minangka latensi panjaluk p50 adhedhasar saben menit, SLA sadurungé uga isih tetep ditrapaké.

3Iki mung ditrapake kanggo pelanggan Enterprise wae

Cara kerjane

Pelanggan bisa ngarahake trafik menyang Priority processing saben request nganggo parameter service_tier sing wis ana, nganggo opsi service_tier = “priority”.

Token sing dilayani dening Priority processing bakal ditagih saben token, kanthi rega premium dibandhingake tarif Standard processing.

Saliyane diatur ing level request, sampeyan uga bisa nyetel default project menyang Priority ing Setelan Project → Default Service Tier: Priority. Sampeyan isih bisa ngowahi saben request.

Watesan

Wates tarif Priority processing dienggo bareng karo service tier liyane.
Ing kasus langka, kenaikan cepet ing Tokens per Minute Priority processing sampeyan bisa nyebabake kena wates ramp rate. Yen sampeyan ngluwihi wates ramp rate, trafik tambahan bisa dikirim menyang Standard processing.

Priority Processing kanggo Pelanggan API

Cara kerjane

Watesan

Rega

Model

Wates tarif

Keandalan

Kebijakan