Prioritert behandling for API-kunder
Dette tilbudet er tilgjengelig for Enterprise-kunder. Kontakt salgsteamet vårt for å finne ut mer.
Prioritert behandling gir pålitelig ytelse med høy hastighet og fleksibilitet til å betale etter bruk.
Ved å velge prioritert behandling låser du opp:
- Forutsigbar lav forsinkelse: Prioritert behandling genererer tokener raskere og i en mer konsekvent hastighet enn standard behandling-tjenesten, selv i perioder med høy etterspørsel.
- Enkel fleksibilitet: I likhet med standard behandling kan prioritert behandling benyttes på en fleksibel, bruksbasert basis, i stedet for å kreve klargjøring på forhånd.
| Pris per 1 mill. inndatatokener | Pris per 1 mill. inndatatokener (bufret) | Pris per 1 mill. utdatatokener | Tjenesteavtale – oppetid3 | Tjenesteavtale – forsinkelse3 | |
|---|---|---|---|---|---|
GPT-5.1 uten long-context1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9 % | 99 % > 50 tokener per sekund2 |
GPT-5 uten long-context1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9 % | 99 % > 50 tokener per sekund2 |
GPT-5 mini uten long-context1 | 0,45 USD | 0,045 USD | 3,60 USD | 99,9 % | 99 % > 80 tokener per sekund2 |
GPT-5.1 codex uten long-context1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9 % | 99 % > 50 tokener per sekund2 |
GPT-5 codex uten long-context1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9 % | 99 % > 50 tokener per sekund2 |
GPT-4.1 uten long-context1 | 3,50 USD | 0,875 USD | 14,00 USD | 99,9 % | 99 % > 80 tokener per sekund2 |
GPT-4.1 mini uten long-context1 | 0,70 USD | 0,175 USD | 2,80 USD | 99,9 % | 99 % > 90 tokener per sekund2 |
GPT-4.1 nano uten long-context1 | 0,20 USD | 0,050 USD | 0,80 USD | 99,9 % | 99 % > 100 tokener per sekund2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | 4,25 USD | 2,125 USD | 17,00 USD | 99,9 % | 99 % > 80 tokener per sekund2 |
gpt-4o-2024-05-13 | 8,75 USD | — | 26,25 USD | 99,9 % | 99 % > 80 tokener per sekund2 |
GPT-4o mini | 0,25 USD | 0,125 USD | 1,00 USD | 99,9 % | 99 % > 90 tokener per sekund2 |
o3 | 3,50 USD | 0,875 USD | 14,00 USD | 99,9 % | 99 % > 80 tokener per sekund2 |
o4-mini | 2,00 USD | 0,500 USD | 8,00 USD | 99,9 % | 99 % > 90 tokener per sekund2 |
Slik fungerer det
Kunder kan dirigere trafikk til prioritert behandling på forespørsel ved å bruke den eksisterende parameteren service_tier, med alternativet service_tier = “priority”.
Tokener som leveres med prioritet behandling, faktureres per token til en pris som er høyere enn prisen for standard behandling.
I tillegg til å kunne konfigureres på forespørselsnivå, planlegger vi også å legge til muligheten for å velge dette på prosjektnivå i nær fremtid.
Begrensninger
- Bruksgrensene for prioritert behandling deles med andre tjenestenivåer.
- I sjeldne tilfeller kan en rask økning i antall tokener per minutt for prioritert behandling føre til at økningsbruksgrenser nås. Hvis du overskrider økningsbruksgrensene, kan det være at ekstra trafikk sendes til standard behandling i stedet.
Priser
Skalanivå forblir separat fra prioritert behandling.
Forespørsler sendt til prioritert behandling faktureres separat og trekkes ikke fra de kjøpte skalanivå TPM-pakkene dine.
Modeller
Ikke for øyeblikket. Vi vil i fremtiden vurdere om vi skal tilby prioritert behandling for flere produkter utover de nyeste modellene våre.
Bruksgrenser
Forbruk av prioritert behandling behandles på samme måte som standard API-trafikk når det gjelder bruksgrenser.
Pålitelighet
Ta kontakt med AD for eventuelle spørsmål eller bekymringer.
Tjenestenivåavtaler (SLA) for prioritert behandling blir behandlet på samme måte som tjenestenivåavtaler for skalanivå. Tjenestekreditter tilbys dersom vi ikke oppfyller disse SLA-ene for kunder med bedriftsavtaler i løpet av et gitt tidsvindu.
Retningslinjer
Ja