Przetwarzanie priorytetowe dla klientów API
Przetwarzanie priorytetowe zapewnia niezawodność, szybkie działanie oraz elastyczność płatności za użycie.
Korzyści płynące z przetwarzania priorytetowego:
- Przewidywalnie niskie opóźnienia: Przetwarzanie priorytetowe generuje tokeny szybciej i z bardziej stabilną prędkością niż przetwarzanie standardowe, nawet w okresach szczytowego zapotrzebowania.
- Wygodna elastyczność: Podobnie jak przetwarzanie standardowe przetwarzanie priorytetowe można uzyskać na elastycznych zasadach płatności za wykorzystanie, bez konieczności wcześniejszej aprowizacji.
| Cena za 1 mln tokenów wejściowych | Cena za 1 mln tokenów wejściowych (buforowane) | Cena za 1 mln tokenów wyjściowych | Umowa SLA dotycząca czasu dostępności3 | Umowa SLA dotycząca opóźnienia3 | |
|---|---|---|---|---|---|
GPT-5.2 z wykluczeniem długiego kontekstu1 | 3,50 USD | 0,350 USD | 28,00 USD | 99,9% | 99% > 50 tokenów na sekundę2 |
GPT-5.1 z wykluczeniem długiego kontekstu1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9% | 99% > 50 tokenów na sekundę2 |
GPT-5 z wykluczeniem długiego kontekstu1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9% | 99% > 50 tokenów na sekundę2 |
GPT-5 mini z wykluczeniem długiego kontekstu1 | 0,45 USD | 0,045 USD | 3,60 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
GPT-5.1 codex z wykluczeniem długiego kontekstu1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9% | 99% > 50 tokenów na sekundę2 |
GPT-5 codex z wykluczeniem długiego kontekstu1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9% | 99% > 50 tokenów na sekundę2 |
GPT-4.1 z wykluczeniem długiego kontekstu1 | 3,50 USD | 0,875 USD | 14,00 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
GPT-4.1 mini z wykluczeniem długiego kontekstu1 | 0,70 USD | 0,175 USD | 2,80 USD | 99,9% | 99% > 90 tokenów na sekundę2 |
GPT-4.1 nano z wykluczeniem długiego kontekstu1 | 0,20 USD | 0,050 USD | 0,80 USD | 99,9% | 99% > 100 tokenów na sekundę2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | 4,25 USD | 2,125 USD | 17,00 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
gpt-4o-2024-05-13 | 8,75 USD | — | 26,25 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
GPT-4o mini | 0,25 USD | 0,125 USD | 1,00 USD | 99,9% | 99% > 90 tokenów na sekundę2 |
o3 | 3,50 USD | 0,875 USD | 14,00 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
o4-mini | 2,00 USD | 0,500 USD | 8,00 USD | 99,9% | 99% > 90 tokenów na sekundę2 |
Jak ten model działa?
Klienci mogą kierować ruch do przetwarzania priorytetowego dla poszczególnych żądań przy użyciu istniejącego parametru service_tier, opcja service_tier = "priority".
Tokeny obsługiwane przez przetwarzanie priorytetowe będą rozliczane według liczby tokenów, a ich cena będzie wyższa niż w przypadku stawek za przetwarzanie standardowe.
Oprócz konfiguracji na poziomie żądania, możesz również ustawić projekt domyślnie z opcją Priorytet w Ustawieniach projektu → Domyślny poziom usługi: Priorytet. Możesz nadal nadpisywać na żądanie.
Ograniczenia
- Limity zapytań przetwarzania priorytetowego są współdzielone z innymi poziomami usług.
- W rzadkich przypadkach gwałtowny wzrost liczby tokenów na minutę przetwarzania priorytetowego może spowodować napotkanie limitów narastania liczby zapytań. W przypadku przekroczenia limitu narastania liczby zapytań dodatkowy ruch może zostać przekierowany do przetwarzania standardowego.
Cennik
Oferta Scale Tier funkcjonuje niezależenie od usługi przetwarzania priorytetowego.
Żądania wysyłane do przetwarzania priorytetowego będą rozliczane oddzielnie i nie będą wliczane do zakupionych pakietów liczby tokenów na minutę Scale Tier.
Modele
Obecnie nie jest. W przyszłości zdecydujemy, czy przetwarzanie priorytetowe zostanie udostępnione dla dodatkowych produktów, a nie tylko najnowszych modeli.
Limity
Użycie w ramach przetwarzania priorytetowego jest traktowane tak samo jak standardowy ruch API w zakresie limitów zapytań.
Niezawodność
Dla klientów Enterprise, w przypadku pytań lub uwag należy skontaktować się ze swoim Opiekunem konta.
Umowy SLA dotyczące przetwarzania priorytetowego będą traktowane tak samo jak umowy SLA dotyczące oferty Scale Tier. W przypadku niedotrzymania tych umów SLA w odniesieniu do klientów z umowami korporacyjnymi w danym okresie zostaną zaoferowane środki do wykorzystania na usługę.
Polityki
Tak