API-asiakkaiden Prioriteettikäsittely (ensisijainen käsittely)
Tämä tarjous on saatavilla Enterprise-asiakkaille. Ota yhteyttä myyntitiimiimme saadaksesi lisätietoja.
Prioriteettikäsittely tarjoaa luotettavan, nopean suorituskyvyn ja joustavuutta laskutukseen käytön mukaan.
Prioriteettikäsittely avaa seuraavat ominaisuudet:
- Ennustettavasti vähäinen viive: Prioriteettikäsittely luo tunnisteita nopeammin ja tasaisemmin kuin vakiokäsittelypalvelu, jopa huippukysynnän aikana.
- Helppokäyttöinen joustavuus: Kuten vakiokäsittelyä, myös Prioriteettikäsittelyä voidaan käyttää joustavasti ja maksuperusteisesti sen sijaan, että se edellyttäisi etukäteiskäsittelyä.
| Hinta per 1M syötetunnistetta | Hinta per 1M syötetunnistetta (välimuistissa olevaa) | Hinta per 1M tuotostunnistetta | Käytettävyysajan palvelutasosopimus (SLA)3 | Viiveen palvelutasosopimus (SLA)3 | |
|---|---|---|---|---|---|
GPT-5.1 ei sisällä pitkää kontekstia1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-5 ei sisällä pitkää kontekstia1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-5 mini ei sisällä pitkää kontekstia1 | 0,45 $ | 0,045 $ | 3,60 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
GPT-5.1 codex ei sisällä pitkää kontekstia1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-5 codex ei sisällä pitkää kontekstia1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-4.1 ei sisällä pitkää kontekstia1 | 3,50 $ | 0,875 $ | 14,00 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
GPT-4.1 mini ei sisällä pitkää kontekstia1 | 0,70 $ | 0,175 $ | 2,80 $ | 99,9 % | 99 % > 90 tunnistetta sekunnissa2 |
GPT-4.1 nano ei sisällä pitkää kontekstia1 | 0,20 $ | 0,050 $ | 0,80 $ | 99,9 % | 99 % > 100 tunnistetta sekunnissa2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | 4,25 $ | 2,125 $ | 17,00 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
gpt-4o-2024-05-13 | 8,75 $ | — | 26,25 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
GPT-4o mini | 0,25 $ | 0,125 $ | 1,00 $ | 99,9 % | 99 % > 90 tunnistetta sekunnissa2 |
o3 | 3,50 $ | 0,875 $ | 14,00 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
o4-mini | 2,00 $ | 0,500 $ | 8,00 $ | 99,9 % | 99 % > 90 tunnistetta sekunnissa2 |
Miten se toimii
Asiakkaat voivat ohjata liikennettä Prioriteettikäsittelyyn pyyntökohtaisesti käyttämällä olemassa olevaa service_tier-parametria, jossa on vaihtoehtona service_tier = "prioriteetti".
Prioriteettikäsittelyn kautta toimitetut tunnisteet laskutetaan tunnistekohtaisesti, ja niiden hinta on korkeampi verrattuna vakiokäsittelyn hintoihin.
Pyyntökohtaisen määrityksen lisäksi aiomme pian tarjota mahdollisuuden ottaa ominaisuus käyttöön projektitasolla.
Rajoitukset
- Prioriteettikäsittelyn käyttörajat jaetaan muiden palvelutasojen kanssa.
- Jos Prioriteettikäsittelyn tunnisteiden määrä minuutissa kasvaa nopeasti, se voi harvinaisissa tilanteissa ylittää nousunopeuden rajoitukset. Jos ylität nousunopeuden rajoitukset, ylimääräinen liikenne saatetaan lähettää sen sijaan vakiokäsittelyyn.
Hinnoittelu
Scale Tier pysyy erillään Prioriteettikäsittelystä.
Prioriteettikäsittelyyn lähetetyt pyynnöt laskutetaan erikseen, eikä niitä lasketa ostamistasi Scale Tier TPM -paketeista.
Mallit
Ei tällä hetkellä. Arvioimme jatkossa, voimmeko tarjota Prioriteettikäsittelyä uusimpien mallien lisäksi muillekin tuotteille.
Käyttörajat
Prioriteettikäsittelyssä sovelletaan samoja käyttörajoja kuin tavallisessa API-liikenteessä.
Luotettavuus
Ota yhteyttä asiakkuusvastaavaasi (AD), jos sinulla on kysyttävää tai huolenaiheita.
Prioriteettikäsittelyn palvelutasosopimuksia käsitellään samalla tavoin kuin Scale Tierin palvelutasosopimuksia, mikäli emme saavuta sovittuja tasoja yritysasiakkaiden kohdalla tietyn aikajakson aikana, tarjoamme hyvityksiä.
Käytännöt
Kyllä