Prioriteitsverwerking voor API-klanten
Dit aanbod is beschikbaar voor Enterprise-klanten. Neem contact op met ons sales-team voor meer info.
Prioriteitsverwerking biedt betrouwbare, snelle prestaties met de flexibiliteit van pay-as-you-go.
Door te kiezen voor prioriteitsverwerking kun je het volgende ontgrendelen:
- Voorspelbaar lage latentie: Prioriteitsverwerking genereert tokens sneller en met een consistentere snelheid dan de standaard verwerkingsservice, zelfs tijdens de piekvraag.
- Gebruiksvriendelijke flexibiliteit: Net als standaardverwerking is prioriteitsverwerking toegankelijk op een flexibele, pay-as-you-go-basis in plaats van dat er vooraf provisie moet worden betaald.
| Prijs per miljoen invoertokens | Prijs per miljoen invoertokens (uit de cache) | Prijs per miljoen uitvoertokens | Beschikbaarheid SLA3 | Latentie SLA3 | |
|---|---|---|---|---|---|
GPT-5.1 sluit lange context uit1 | US$ 2,50 | US$ 0,250 | US$ 20,00 | 99,9% | In 99% van de gevallen meer dan 50 tokens per seconde2 |
GPT-5 sluit lange context uit1 | US$ 2,50 | US$ 0,250 | US$ 20,00 | 99,9% | In 99% van de gevallen meer dan 50 tokens per seconde2 |
GPT-5 mini sluit lange context uit1 | US$ 0,45 | US$ 0,045 | US$ 3,60 | 99,9% | In 99% van de gevallen meer dan 80 tokens per seconde2 |
GPT-5.1 codex sluit lange context uit1 | US$ 2,50 | US$ 0,250 | US$ 20,00 | 99,9% | In 99% van de gevallen meer dan 50 tokens per seconde2 |
GPT-5 codex sluit lange context uit1 | US$ 2,50 | US$ 0,250 | US$ 20,00 | 99,9% | In 99% van de gevallen meer dan 50 tokens per seconde2 |
GPT-4.1 sluit lange context uit1 | US$ 3,50 | US$ 0,875 | US$ 14,00 | 99,9% | In 99% van de gevallen meer dan 80 tokens per seconde2 |
GPT-4.1 mini sluit lange context uit1 | US$ 0,70 | US$ 0,175 | US$ 2,80 | 99,9% | In 99% van de gevallen meer dan 90 tokens per seconde2 |
GPT-4.1 nano sluit lange context uit1 | US$ 0,20 | US$ 0,050 | US$ 0,80 | 99,9% | In 99% van de gevallen meer dan 100 tokens per seconde2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | US$ 4,25 | US$ 2,125 | US$ 17,00 | 99,9% | In 99% van de gevallen meer dan 80 tokens per seconde2 |
gpt-4o-2024-05-13 | US$ 8,75 | — | US$ 26,25 | 99,9% | In 99% van de gevallen meer dan 80 tokens per seconde2 |
GPT-4o mini | US$ 0,25 | US$ 0,125 | US$ 1,00 | 99,9% | In 99% van de gevallen meer dan 90 tokens per seconde2 |
o3 | US$ 3,50 | US$ 0,875 | US$ 14,00 | 99,9% | In 99% van de gevallen meer dan 80 tokens per seconde2 |
o4-mini | US$ 2,00 | US$ 0,500 | US$ 8,00 | 99,9% | In 99% van de gevallen meer dan 90 tokens per seconde2 |
Hoe het werkt
Klanten kunnen per verzoek verkeer naar prioriteitsverwerking leiden met behulp van de bestaande parameter service_tier , met de optie service_tier = 'priority'.
Tokens die worden afgehandeld via prioriteitsverwerking worden gefactureerd per token en hebben een hogere prijs dan de standaard verwerkingstarieven.
Naast de mogelijkheid om dit per verzoek in te stellen, zijn we ook van plan om op korte termijn ondersteuning toe te voegen voor aanmelding op projectniveau.
Beperkingen
- De tarieflimieten voor prioriteitsverwerking worden gedeeld met andere serviceniveaus.
- In zeldzame gevallen kunnen snelle stijgingen van het aantal tokens voor prioriteitsverwerking per minuut ertoe leiden dat je de tarieflimieten overschrijdt. Als je de tarieflimieten overschrijdt, kan extra verkeer in plaats daarvan worden doorgestuurd naar standaardverwerking.
Prijzen
Scale Tier blijft gescheiden van prioriteitsverwerking.
Verzoeken die naar prioriteitsverwerking worden gestuurd, worden apart gefactureerd en tellen niet mee voor je aangeschafte Scale Tier TPM-bundels.
Modellen
Op dit moment niet. We zullen in de toekomst evalueren of we prioriteitsverwerking kunnen aanbieden op andere producten dan onze nieuwste modellen.
Tarieflimieten
Het verbruik van prioriteitsverwerking wordt voor tarieflimieten op dezelfde manier behandeld als standaard API-verkeer.
Betrouwbaarheid
Neem bij vragen of zorgen contact op met je accountdirecteur (AD).
De SLA’s voor prioriteitsverwerking worden op dezelfde manier behandeld als die van de Scale Tier; servicecredits worden aangeboden als we deze SLA’s niet halen voor klanten met een enterprise-overeenkomst binnen een bepaald tijdsvenster.
Beleidsregels
Ja