Hopp til hovedinnhold
OpenAI

Prioritert behandling for API-kunder

Dette tilbudet er tilgjengelig for Enterprise-kunder. Kontakt salgsteamet vårt⁠⁠ for å finne ut mer.

Prioritert behandling gir pålitelig ytelse med høy hastighet og fleksibilitet til å betale etter bruk.

Ved å velge prioritert behandling låser du opp:

  • Forutsigbar lav forsinkelse: Prioritert behandling genererer tokener raskere og i en mer konsekvent hastighet enn standard behandling-tjenesten, selv i perioder med høy etterspørsel.
  • Enkel fleksibilitet: I likhet med standard behandling kan prioritert behandling benyttes på en fleksibel, bruksbasert basis, i stedet for å kreve klargjøring på forhånd.
Pris per 1 mill. inndatatokenerPris per 1 mill. inndatatokener (bufret)Pris per 1 mill. utdatatokenerTjenesteavtale – oppetid3Tjenesteavtale – forsinkelse3
GPT-5.1
uten long-context1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 tokener per sekund2
GPT-5
uten long-context1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 tokener per sekund2
GPT-5 mini
uten long-context1
0,45 USD0,045 USD3,60 USD99,9 %99 % > 80 tokener per sekund2
GPT-5.1 codex
uten long-context1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 tokener per sekund2
GPT-5 codex
uten long-context1
2,50 USD0,250 USD20,00 USD99,9 %99 % > 50 tokener per sekund2
GPT-4.1
uten long-context1
3,50 USD0,875 USD14,00 USD99,9 %99 % > 80 tokener per sekund2
GPT-4.1 mini
uten long-context1
0,70 USD0,175 USD2,80 USD99,9 %99 % > 90 tokener per sekund2
GPT-4.1 nano
uten long-context1
0,20 USD0,050 USD0,80 USD99,9 %99 % > 100 tokener per sekund2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
4,25 USD2,125 USD17,00 USD99,9 %99 % > 80 tokener per sekund2
gpt-4o-2024-05-13
8,75 USD26,25 USD99,9 %99 % > 80 tokener per sekund2
GPT-4o mini
0,25 USD0,125 USD1,00 USD99,9 %99 % > 90 tokener per sekund2
o3
3,50 USD0,875 USD14,00 USD99,9 %99 % > 80 tokener per sekund2
o4-mini
2,00 USD0,500 USD8,00 USD99,9 %99 % > 90 tokener per sekund2
1Forespørsler estimert ved >128 000 meldingstokener
2Beregnet som p50-meldingsforsinkelse på en per 5 minutter-basis. For kunder med eksisterende bedriftsavtaler som har tjenesteavtaler om forsinkelse beregnet som p50-meldingsforsinkelse på en per minutt-basis, gjelder også de tidligere tjenesteavtalene.
3Dette gjelder kun Enterprise-kunder

Slik fungerer det

Kunder kan dirigere trafikk til prioritert behandling på forespørsel ved å bruke den eksisterende parameteren service_tier, med alternativet service_tier = “priority”.

Tokener som leveres med prioritet behandling, faktureres per token til en pris som er høyere enn prisen for standard behandling. 

I tillegg til å kunne konfigureres på forespørselsnivå, planlegger vi også å legge til muligheten for å velge dette på prosjektnivå i nær fremtid.

Begrensninger

  • Bruksgrensene for prioritert behandling deles med andre tjenestenivåer. 
  • I sjeldne tilfeller kan en rask økning i antall tokener per minutt for prioritert behandling føre til at økningsbruksgrenser nås. Hvis du overskrider økningsbruksgrensene, kan det være at ekstra trafikk sendes til standard behandling i stedet.

Priser

Skalanivå forblir separat fra prioritert behandling.

Forespørsler sendt til prioritert behandling faktureres separat og trekkes ikke fra de kjøpte skalanivå TPM-pakkene dine.

Modeller

Ikke for øyeblikket. Vi vil i fremtiden vurdere om vi skal tilby prioritert behandling for flere produkter utover de nyeste modellene våre.

Bruksgrenser

Forbruk av prioritert behandling behandles på samme måte som standard API-trafikk når det gjelder bruksgrenser.

Pålitelighet

Ta kontakt med AD for eventuelle spørsmål eller bekymringer. 

Tjenestenivåavtaler (SLA) for prioritert behandling blir behandlet på samme måte som tjenestenivåavtaler for skalanivå. Tjenestekreditter tilbys dersom vi ikke oppfyller disse SLA-ene for kunder med bedriftsavtaler i løpet av et gitt tidsvindu.

Retningslinjer

Ja