Hopp til hovedinnhold
OpenAI

Prioritert behandling for API-kunder

Prioritert behandling gir pålitelig, høyhastighetsytelse med fleksibiliteten til å betale etter hvert som du bruker.

Ved å velge prioritert behandling, kan du låse opp:

  • Forutsigbart lav forsinkelse: Prioritert behandling genererer tokens raskere og med en mer konsekvent hastighet enn Standard behandlingstjeneste, selv under høy etterspørsel.
  • Enkel å bruke fleksibilitet: I likhet med standard behandling kan prioritert behandling benyttes på en fleksibel, betal-etter-bruk basis, i stedet for å kreve klargjøring.
Pris per 1 mill. inndatatokenerPris per 1 mill. inndatatokener (bufret)Pris per 1 mill. utdatatokenerTjenesteavtale – oppetid3Tjenesteavtale – forsinkelse3
GPT-5.2
uten long-context1
3,50 USD0,350 USD28,00 USD99,9 %99 % > 50 tokener per sekund2
GPT-5.1
uten long-context1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 tokener per sekund2
GPT-5
uten long-context1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 tokener per sekund2
GPT-5 mini
uten long-context1
0,45 USD0,045 USD3,60 USD99,9 %99 % > 80 tokener per sekund2
GPT-5.1 codex
uten long-context1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 tokener per sekund2
GPT-5 codex
uten long-context1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 tokener per sekund2
GPT-4.1
uten long-context1
3,50 USD0,875 USD14,00 USD99,9 %99 % > 80 tokener per sekund2
GPT-4.1 mini
uten long-context1
0,70 USD0,175 USD2,80 USD99,9 %99 % > 90 tokener per sekund2
GPT-4.1 nano
uten long-context1
0,20 USD0,050 USD0,80 USD99,9 %99 % > 100 tokener per sekund2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
4,25 USD2,125 USD17,00 USD99,9 %99 % > 80 tokener per sekund2
gpt-4o-2024-05-13
8,75 USD26,25 USD99,9 %99 % > 80 tokener per sekund2
GPT-4o mini
0,25 USD0,125 USD1,00 USD99,9 %99 % > 90 tokener per sekund2
o3
3,50 USD0,875 USD14,00 USD99,9 %99 % > 80 tokener per sekund2
o4-mini
2,00 USD0,500 USD8,00 USD99,9 %99 % > 90 tokener per sekund2
1Forespørsler estimert ved >128 000 meldingstokener
2Beregnet som p50-meldingsforsinkelse på en per 5 minutter-basis. For kunder med eksisterende bedriftsavtaler som har tjenesteavtaler om forsinkelse beregnet som p50-meldingsforsinkelse på en per minutt-basis, gjelder også de tidligere tjenesteavtalene.
3Dette gjelder kun Enterprise-kunder

Slik fungerer det

Kunder kan dirigere trafikk til prioritert behandling per forespørsel ved å bruke den eksisterende parameteren service_tier, med alternativet service_tier = “priority”.

Token som behandles med prioritert behandling, faktureres per token til en pris som er høyere enn standard behandlingssatser. 

I tillegg til å bli konfigurert på forespørselsnivå, kan du også sette et prosjekt til Prioritet som standard i prosjektinnstillinger → standard tjenestenivå: Prioritet. Du kan fortsatt overstyre per forespørsel.

Begrensninger

  • Prioritetsbehandlingshastighetsgrenser deles med andre tjenestenivåer. 
  • I sjeldne tilfeller kan raske økninger i antall Tokens per minutt for prioritert behandling føre til at ramp rate-grenser nås. Hvis du overskrider ramp rate-grensen, kan ekstra trafikk bli sendt til standardbehandling i stedet.

Priser

Skalanivå vil forbli adskilt fra prioritert behandling.

Forespørsler sendt til prioritert behandling vil bli fakturert separat og vil ikke bli trukket fra de kjøpte skalanivå TPM-pakkene dine.

Modeller

Ikke akkurat nå. Vi vil i fremtiden vurdere om vi skal tilby prioritert behandling på flere produkter utover de nyeste modellene våre.

Hastighetsgrenser

Forbruk av prioritert behandling behandles på samme måte som standard API-trafikk når det gjelder hastighetsgrenser.

Pålitelighet

For Enterprise-kunder, vennligst ta kontakt med din AD for eventuelle spørsmål eller bekymringer. 

Prioritetsbehandlings-SLA-er vil bli behandlet på samme måte som skalanivå-SLA-er; tjenestekreditter vil bli tilbudt dersom vi ikke oppfyller disse SLA-ene for kunder med bedriftsavtaler i løpet av et gitt tidsvindu.

Retningslinjer

Ja