Overslaan naar hoofdinhoud
OpenAI

Prioriteitsverwerking voor API-klanten

Dit aanbod is beschikbaar voor Enterprise-klanten. Neem contact op met ons sales-team⁠ voor meer info.

Prioriteitsverwerking biedt betrouwbare, snelle prestaties met de flexibiliteit van pay-as-you-go.

Door te kiezen voor prioriteitsverwerking kun je het volgende ontgrendelen:

  • Voorspelbaar lage latentie: Prioriteitsverwerking genereert tokens sneller en met een consistentere snelheid dan de standaard verwerkingsservice, zelfs tijdens de piekvraag.
  • Gebruiksvriendelijke flexibiliteit: Net als standaardverwerking is prioriteitsverwerking toegankelijk op een flexibele, pay-as-you-go-basis in plaats van dat er vooraf provisie moet worden betaald.
Prijs per miljoen invoertokensPrijs per miljoen invoertokens (uit de cache)Prijs per miljoen uitvoertokensBeschikbaarheid SLA3Latentie SLA3
GPT-5.1
sluit lange context uit1
US$ 2,50US$ 0,250US$ 20,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-5
sluit lange context uit1
US$ 2,50US$ 0,250US$ 20,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-5 mini
sluit lange context uit1
US$ 0,45US$ 0,045US$ 3,6099,9%In 99% van de gevallen meer dan 80 tokens per seconde2
GPT-5.1 codex
sluit lange context uit1
US$ 2,50US$ 0,250US$ 20,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-5 codex
sluit lange context uit1
US$ 2,50US$ 0,250US$ 20,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-4.1
sluit lange context uit1
US$ 3,50US$ 0,875US$ 14,0099,9%In 99% van de gevallen meer dan 80 tokens per seconde2
GPT-4.1 mini
sluit lange context uit1
US$ 0,70US$ 0,175US$ 2,8099,9%In 99% van de gevallen meer dan 90 tokens per seconde2
GPT-4.1 nano
sluit lange context uit1
US$ 0,20US$ 0,050US$ 0,8099,9%In 99% van de gevallen meer dan 100 tokens per seconde2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
US$ 4,25US$ 2,125US$ 17,0099,9%In 99% van de gevallen meer dan 80 tokens per seconde2
gpt-4o-2024-05-13
US$ 8,75US$ 26,2599,9%In 99% van de gevallen meer dan 80 tokens per seconde2
GPT-4o mini
US$ 0,25US$ 0,125US$ 1,0099,9%In 99% van de gevallen meer dan 90 tokens per seconde2
o3
US$ 3,50US$ 0,875US$ 14,0099,9%In 99% van de gevallen meer dan 80 tokens per seconde2
o4-mini
US$ 2,00US$ 0,500US$ 8,0099,9%In 99% van de gevallen meer dan 90 tokens per seconde2
1Verzoeken waarbij het geschatte aantal prompttokens meer dan 128.000 is
2Wordt berekend als p50-latentie (responstijd) in blokken van vijf minuten. Ben je al klant met een bestaand Enterprise-contract waarin de SLA voor de p50-latentie per minuut wordt berekend? Dan blijft die SLA ook gewoon gelden.
3Dit is alleen van toepassing op Enterprise-klanten

Hoe het werkt

Klanten kunnen per verzoek verkeer naar prioriteitsverwerking leiden met behulp van de bestaande parameter service_tier , met de optie service_tier = 'priority'.

Tokens die worden afgehandeld via prioriteitsverwerking worden gefactureerd per token en hebben een hogere prijs dan de standaard verwerkingstarieven. 

Naast de mogelijkheid om dit per verzoek in te stellen, zijn we ook van plan om op korte termijn ondersteuning toe te voegen voor aanmelding op projectniveau.

Beperkingen

  • De tarieflimieten voor prioriteitsverwerking worden gedeeld met andere serviceniveaus. 
  • In zeldzame gevallen kunnen snelle stijgingen van het aantal tokens voor prioriteitsverwerking per minuut ertoe leiden dat je de tarieflimieten overschrijdt. Als je de tarieflimieten overschrijdt, kan extra verkeer in plaats daarvan worden doorgestuurd naar standaardverwerking.

Prijzen

Scale Tier blijft gescheiden van prioriteitsverwerking.

Verzoeken die naar prioriteitsverwerking worden gestuurd, worden apart gefactureerd en tellen niet mee voor je aangeschafte Scale Tier TPM-bundels.

Modellen

Op dit moment niet. We zullen in de toekomst evalueren of we prioriteitsverwerking kunnen aanbieden op andere producten dan onze nieuwste modellen.

Tarieflimieten

Het verbruik van prioriteitsverwerking wordt voor tarieflimieten op dezelfde manier behandeld als standaard API-verkeer.

Betrouwbaarheid

Neem bij vragen of zorgen contact op met je accountdirecteur (AD). 

De SLA’s voor prioriteitsverwerking worden op dezelfde manier behandeld als die van de Scale Tier; servicecredits worden aangeboden als we deze SLA’s niet halen voor klanten met een enterprise-overeenkomst binnen een bepaald tijdsvenster.

Beleidsregels

Ja