Prioritert behandling for API-kunder

Dette tilbudet er tilgjengelig for Enterprise-kunder. Kontakt salgsteamet vårt⁠⁠⁠ for å finne ut mer.

Prioritert behandling gir pålitelig ytelse med høy hastighet og fleksibilitet til å betale etter bruk.

Ved å velge prioritert behandling låser du opp:

Forutsigbar lav forsinkelse: Prioritert behandling genererer tokener raskere og i en mer konsekvent hastighet enn standard behandling-tjenesten, selv i perioder med høy etterspørsel.
Enkel fleksibilitet: I likhet med standard behandling kan prioritert behandling benyttes på en fleksibel, bruksbasert basis, i stedet for å kreve klargjøring på forhånd.

	Pris per 1 mill. inndatatokener	Pris per 1 mill. inndatatokener (bufret)	Pris per 1 mill. utdatatokener	Tjenesteavtale – oppetid³	Tjenesteavtale – forsinkelse³
GPT-5.1 uten long-context¹	2,50 USD	0,250 USD	20,00 USD	99,9 %	99 % > 50 tokener per sekund²
GPT-5 uten long-context¹	2,50 USD	0,250 USD	20,00 USD	99,9 %	99 % > 50 tokener per sekund²
GPT-5 mini uten long-context¹	0,45 USD	0,045 USD	3,60 USD	99,9 %	99 % > 80 tokener per sekund²
GPT-5.1 codex uten long-context¹	2,50 USD	0,250 USD	20,00 USD	99,9 %	99 % > 50 tokener per sekund²
GPT-5 codex uten long-context¹	2,50 USD	0,250 USD	20,00 USD	99,9 %	99 % > 50 tokener per sekund²
GPT-4.1 uten long-context¹	3,50 USD	0,875 USD	14,00 USD	99,9 %	99 % > 80 tokener per sekund²
GPT-4.1 mini uten long-context¹	0,70 USD	0,175 USD	2,80 USD	99,9 %	99 % > 90 tokener per sekund²
GPT-4.1 nano uten long-context¹	0,20 USD	0,050 USD	0,80 USD	99,9 %	99 % > 100 tokener per sekund²
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06	4,25 USD	2,125 USD	17,00 USD	99,9 %	99 % > 80 tokener per sekund²
gpt-4o-2024-05-13	8,75 USD	—	26,25 USD	99,9 %	99 % > 80 tokener per sekund²
GPT-4o mini	0,25 USD	0,125 USD	1,00 USD	99,9 %	99 % > 90 tokener per sekund²
o3	3,50 USD	0,875 USD	14,00 USD	99,9 %	99 % > 80 tokener per sekund²
o4-mini	2,00 USD	0,500 USD	8,00 USD	99,9 %	99 % > 90 tokener per sekund²

1Forespørsler estimert ved >128 000 meldingstokener

2Beregnet som p50-meldingsforsinkelse på en per 5 minutter-basis. For kunder med eksisterende bedriftsavtaler som har tjenesteavtaler om forsinkelse beregnet som p50-meldingsforsinkelse på en per minutt-basis, gjelder også de tidligere tjenesteavtalene.

3Dette gjelder kun Enterprise-kunder

Slik fungerer det

Kunder kan dirigere trafikk til prioritert behandling på forespørsel ved å bruke den eksisterende parameteren service_tier, med alternativet service_tier = “priority”.

Tokener som leveres med prioritet behandling, faktureres per token til en pris som er høyere enn prisen for standard behandling.

I tillegg til å kunne konfigureres på forespørselsnivå, planlegger vi også å legge til muligheten for å velge dette på prosjektnivå i nær fremtid.

Begrensninger

Bruksgrensene for prioritert behandling deles med andre tjenestenivåer.
I sjeldne tilfeller kan en rask økning i antall tokener per minutt for prioritert behandling føre til at økningsbruksgrenser nås. Hvis du overskrider økningsbruksgrensene, kan det være at ekstra trafikk sendes til standard behandling i stedet.

Priser

Skalanivå forblir separat fra prioritert behandling.

Forespørsler sendt til prioritert behandling faktureres separat og trekkes ikke fra de kjøpte skalanivå TPM-pakkene dine.

Modeller

Ikke for øyeblikket. Vi vil i fremtiden vurdere om vi skal tilby prioritert behandling for flere produkter utover de nyeste modellene våre.

Bruksgrenser

Forbruk av prioritert behandling behandles på samme måte som standard API-trafikk når det gjelder bruksgrenser.

Prioritert behandling har økningsbruksgrenser for å sikre jevn høy ytelse for alle kunder, samtidig som det fortsatt tilbys fleksible priser på forespørsel. Hvis (a) ytelsen for prioritert behandling er redusert OG (b) en kundes trafikk øker for raskt, kan noen prioriterte forespørsler nedgraderes til standard behandling i stedet.

Den gjeldende økningsbruksgrensen for prioritert behandling er definert som behandling av minst 100 000 TPM og en økning i trafikk med >50 % tokener per minutt på mindre enn 15 minutter.

Forespørsler som behandles av standard-tjenestenivået, faktureres til standardpriser og er ikke berettiget til prioritert behandling i henhold til målene for tjenestenivå.

Forespørsler behandlet av standard-tjenestenivået inkluderer service_tier=”Defualt” i svaret.

Beste praksis for å holde seg innenfor økningsbruksgrensen

Øk trafikken gradvis når du bytter modell. Hvis applikasjonen din for eksempel går fra et tidligere snapshot til et nytt, kan du bruke et funksjonsflagg for å overføre trafikken i løpet av noen timer i stedet for alt på en gang.
Unngå å kjøre store databehandlingsoppgaver eller asynkrone jobber i prioritert behandling. Disse jobbene kan øke trafikken veldig raskt og trenger ofte ikke den forbedrede ytelsen som prioritert behandling gir.
Hvis du regelmessig støter på økningsbruksgrenser, bør du vurdere å kjøpe skalanivåkapasitet i stedet for eller i tillegg til det du allerede har.

Pålitelighet

Ta kontakt med AD for eventuelle spørsmål eller bekymringer.

Tjenestenivåavtaler (SLA) for prioritert behandling blir behandlet på samme måte som tjenestenivåavtaler for skalanivå. Tjenestekreditter tilbys dersom vi ikke oppfyller disse SLA-ene for kunder med bedriftsavtaler i løpet av et gitt tidsvindu.

Prioritert behandling for API-kunder

Slik fungerer det

Begrensninger

Priser

Hvordan fungerer dette med skalanivå?

Kan jeg automatisk sende overskuddsstrafikk fra skalanivå til prioritert behandling?

Er den årlige forpliktelsen min knyttet til en spesifikk behandlingsmodus?

Får jeg fremdeles rabatt på bufrede inndatatokener?

Hvordan ser jeg bruken og utgiftene for prioritert behandling?

Modeller

Er prioritert behandling tilgjengelig for lange kontekster, finjusterte modeller, innebygginger osv.?

Hvordan fungerer andre modaliteter med prioritert behandling?

Kommer fremtidige modeller til å bli støttet?

Bruksgrenser

Hva er bruksgrensene?

Hva er økningsbruksgrensene?

Er økningsbruksgrenser felles på tvers av prosjekter eller organisasjoner?

Pålitelighet

Hva skjer hvis forsinkelsesmålet ikke oppfylles?

Retningslinjer

Er prioritert behandling kompatibelt med oppbevaring av data?

Er prioritert behandling kompatibelt med null oppbevaring av data (ZDR) og forretningspartneravtalen (BAA)?