Oferta Priority Processing dla klientów korzystających z interfejsów API
Ta oferta jest dostępna dla klientów korzystających z planu Enterprise. Aby dowiedzieć się więcej, skontaktuj się z naszym zespołem ds. sprzedaży.
Priority Processing to oferta przetwarzania priorytetowego, która zapewnia niezawodność, szybkie działanie oraz elastyczność płatności za użycie.
Korzyści płynące z przetwarzania priorytetowego:
- Przewidywalnie niskie opóźnienia reakcji: w ramach oferty Priority Processing tokeny są generowane z większą i bardziej stabilną prędkością w porównaniu do usługi przetwarzania standardowego, nawet w okresach szczytowego zapotrzebowania.
- Elastyczność użycia: przetwarzanie priorytetowe, podobnie jak przetwarzanie standardowe, obsługuje elastyczny model płatności za wykorzystanie i nie wymaga wcześniejszej aprowizacji.
| Cena za 1 mln tokenów wejściowych | Cena za 1 mln tokenów wejściowych (buforowane) | Cena za 1 mln tokenów wyjściowych | Umowa SLA dotycząca czasu dostępności3 | Umowa SLA dotycząca opóźnienia3 | |
|---|---|---|---|---|---|
GPT-5.1 z wykluczeniem długiego kontekstu1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9% | 99% > 50 tokenów na sekundę2 |
GPT-5 z wykluczeniem długiego kontekstu1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9% | 99% > 50 tokenów na sekundę2 |
GPT-5 mini z wykluczeniem długiego kontekstu1 | 0,45 USD | 0,045 USD | 3,60 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
GPT-5.1 codex z wykluczeniem długiego kontekstu1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9% | 99% > 50 tokenów na sekundę2 |
GPT-5 codex z wykluczeniem długiego kontekstu1 | 2,50 USD | 0,250 USD | 20,00 USD | 99,9% | 99% > 50 tokenów na sekundę2 |
GPT-4.1 z wykluczeniem długiego kontekstu1 | 3,50 USD | 0,875 USD | 14,00 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
GPT-4.1 mini z wykluczeniem długiego kontekstu1 | 0,70 USD | 0,175 USD | 2,80 USD | 99,9% | 99% > 90 tokenów na sekundę2 |
GPT-4.1 nano z wykluczeniem długiego kontekstu1 | 0,20 USD | 0,050 USD | 0,80 USD | 99,9% | 99% > 100 tokenów na sekundę2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | 4,25 USD | 2,125 USD | 17,00 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
gpt-4o-2024-05-13 | 8,75 USD | — | 26,25 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
GPT-4o mini | 0,25 USD | 0,125 USD | 1,00 USD | 99,9% | 99% > 90 tokenów na sekundę2 |
o3 | 3,50 USD | 0,875 USD | 14,00 USD | 99,9% | 99% > 80 tokenów na sekundę2 |
o4-mini | 2,00 USD | 0,500 USD | 8,00 USD | 99,9% | 99% > 90 tokenów na sekundę2 |
Jak to działa
Klienci mogą kierować ruch do przetwarzania priorytetowego dla poszczególnych żądań przy użyciu istniejącego parametru service_tier, opcja service_tier = “priority”.
Tokeny obsługiwane przez przetwarzanie priorytetowe będą rozliczane według liczby tokenów, a ich cena będzie wyższa niż w przypadku stawek za przetwarzanie standardowe.
Oprócz konfiguracji na poziomie żądania, w najbliższym czasie planujemy również dodać aktywacji na poziomie całego projektu.
Ograniczenia
- Limity zapytań przetwarzania priorytetowego są współdzielone z innymi poziomami usług.
- W rzadkich przypadkach, gwałtowny wzrost liczby tokenów na minutę przetwarzania priorytetowego może spowodować napotkanie limitów narastania liczby zapytań. W przypadku przekroczenia limitu narastania liczby zapytań dodatkowy ruch może zostać przekierowany do przetwarzania standardowego.
Cennik
Oferta Scale Tier funkcjonuje niezależenie od usługi przetwarzania priorytetowego.
Żądania wysyłane do przetwarzania priorytetowego będą rozliczane oddzielnie i nie będą wliczane do zakupionych pakietów liczby tokenów na minutę Scale Tier.
Modele
Obecnie nie jest. W przyszłości zdecydujemy, czy przetwarzanie priorytetowe zostanie udostępnione dla dodatkowych produktów, a nie tylko najnowszych modeli.
Limity zapytań
Użycie w ramach przetwarzania priorytetowego jest traktowane tak samo jak standardowy ruch API w zakresie limitów zapytań.
Niezawodność:
W przypadku pytań lub uwag należy skontaktować się ze swoim Opiekunem Konta.
Umowy SLA dotyczące przetwarzania priorytetowego będą traktowane tak samo jak umowy SLA dotyczące oferty Scale Tier. W przypadku niedotrzymania tych umów SLA w odniesieniu do klientów z umowami korporacyjnymi w danym okresie zostaną zaoferowane środki do wykorzystania na usługę.
Zasady
Tak