Siirry pääsisältöön
OpenAI

API-asiakkaiden Prioriteettikäsittely (ensisijainen käsittely)

Tämä tarjous on saatavilla Enterprise-asiakkaille. Ota yhteyttä myyntitiimiimme saadaksesi lisätietoja.

Prioriteettikäsittely tarjoaa luotettavan, nopean suorituskyvyn ja joustavuutta laskutukseen käytön mukaan.

Prioriteettikäsittely avaa seuraavat ominaisuudet:

  • Ennustettavasti vähäinen viive: Prioriteettikäsittely luo tunnisteita nopeammin ja tasaisemmin kuin vakiokäsittelypalvelu, jopa huippukysynnän aikana.
  • Helppokäyttöinen joustavuus: Kuten vakiokäsittelyä, myös Prioriteettikäsittelyä voidaan käyttää joustavasti ja maksuperusteisesti sen sijaan, että se edellyttäisi etukäteiskäsittelyä.
Hinta per 1M syötetunnistettaHinta per 1M syötetunnistetta (välimuistissa olevaa)Hinta per 1M tuotostunnistettaKäytettävyysajan palvelutasosopimus (SLA)3Viiveen palvelutasosopimus (SLA)3
GPT-5.1
ei sisällä pitkää kontekstia1
2,50 $0,250 $20,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-5
ei sisällä pitkää kontekstia1
2,50 $0,250 $20,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-5 mini
ei sisällä pitkää kontekstia1
0,45 $0,045 $3,60 $99,9 %99 % > 80 tunnistetta sekunnissa2
GPT-5.1 codex
ei sisällä pitkää kontekstia1
2,50 $0,250 $20,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-5 codex
ei sisällä pitkää kontekstia1
2,50 $0,250 $20,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-4.1
ei sisällä pitkää kontekstia1
3,50 $0,875 $14,00 $99,9 %99 % > 80 tunnistetta sekunnissa2
GPT-4.1 mini
ei sisällä pitkää kontekstia1
0,70 $0,175 $2,80 $99,9 %99 % > 90 tunnistetta sekunnissa2
GPT-4.1 nano
ei sisällä pitkää kontekstia1
0,20 $0,050 $0,80 $99,9 %99 % > 100 tunnistetta sekunnissa2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
4,25 $2,125 $17,00 $99,9 %99 % > 80 tunnistetta sekunnissa2
gpt-4o-2024-05-13
8,75 $26,25 $99,9 %99 % > 80 tunnistetta sekunnissa2
GPT-4o mini
0,25 $0,125 $1,00 $99,9 %99 % > 90 tunnistetta sekunnissa2
o3
3,50 $0,875 $14,00 $99,9 %99 % > 80 tunnistetta sekunnissa2
o4-mini
2,00 $0,500 $8,00 $99,9 %99 % > 90 tunnistetta sekunnissa2
1Pyyntöjä arviolta yli 128k kehotemerkkiä
2Lasketaan p50-pyynnön viiveenä 5 minuutin välein. Asiakkailla, joilla on voimassa oleva yrityssopimus, jossa viiveen SLA lasketaan p50-pyynnön viiveenä minuutin välein, aiemmat SLA-määritykset ovat yhä voimassa.
3Sovellettavissa vain Enterprise-asiakkaille

Miten se toimii

Asiakkaat voivat ohjata liikennettä Prioriteettikäsittelyyn pyyntökohtaisesti käyttämällä olemassa olevaa service_tier-parametria, jossa on vaihtoehtona service_tier = "prioriteetti".

Prioriteettikäsittelyn kautta toimitetut tunnisteet laskutetaan tunnistekohtaisesti, ja niiden hinta on korkeampi verrattuna vakiokäsittelyn hintoihin. 

Pyyntökohtaisen määrityksen lisäksi aiomme pian tarjota mahdollisuuden ottaa ominaisuus käyttöön projektitasolla.

Rajoitukset

  • Prioriteettikäsittelyn käyttörajat jaetaan muiden palvelutasojen kanssa. 
  • Jos Prioriteettikäsittelyn tunnisteiden määrä minuutissa kasvaa nopeasti, se voi harvinaisissa tilanteissa ylittää nousunopeuden rajoitukset. Jos ylität nousunopeuden rajoitukset, ylimääräinen liikenne saatetaan lähettää sen sijaan vakiokäsittelyyn.

Hinnoittelu

Scale Tier pysyy erillään Prioriteettikäsittelystä.

Prioriteettikäsittelyyn lähetetyt pyynnöt laskutetaan erikseen, eikä niitä lasketa ostamistasi Scale Tier TPM -paketeista.

Mallit

Ei tällä hetkellä. Arvioimme jatkossa, voimmeko tarjota Prioriteettikäsittelyä uusimpien mallien lisäksi muillekin tuotteille.

Käyttörajat

Prioriteettikäsittelyssä sovelletaan samoja käyttörajoja kuin tavallisessa API-liikenteessä.

Luotettavuus

Ota yhteyttä asiakkuusvastaavaasi (AD), jos sinulla on kysyttävää tai huolenaiheita. 

Prioriteettikäsittelyn palvelutasosopimuksia käsitellään samalla tavoin kuin Scale Tierin palvelutasosopimuksia, mikäli emme saavuta sovittuja tasoja yritysasiakkaiden kohdalla tietyn aikajakson aikana, tarjoamme hyvityksiä.

Käytännöt

Kyllä