Przejdź do treści głównej
OpenAI

Oferta Priority Processing dla klientów korzystających z interfejsów API

Ta oferta jest dostępna dla klientów korzystających z planu Enterprise. Aby dowiedzieć się więcej, skontaktuj się z naszym zespołem ds. sprzedaży⁠⁠.

Priority Processing to oferta przetwarzania priorytetowego, która zapewnia niezawodność, szybkie działanie oraz elastyczność płatności za użycie.

Korzyści płynące z przetwarzania priorytetowego:

  • Przewidywalnie niskie opóźnienia reakcji: w ramach oferty Priority Processing tokeny są generowane z większą i bardziej stabilną prędkością w porównaniu do usługi przetwarzania standardowego, nawet w okresach szczytowego zapotrzebowania.
  • Elastyczność użycia: przetwarzanie priorytetowe, podobnie jak przetwarzanie standardowe, obsługuje elastyczny model płatności za wykorzystanie i nie wymaga wcześniejszej aprowizacji.
Cena za 1 mln tokenów wejściowychCena za 1 mln tokenów wejściowych (buforowane)Cena za 1 mln tokenów wyjściowychUmowa SLA dotycząca czasu dostępności3Umowa SLA dotycząca opóźnienia3
GPT-5.1
z wykluczeniem długiego kontekstu1
2,50 USD0,250 USD20,00 USD99,9%99% > 50 tokenów na sekundę2
GPT-5
z wykluczeniem długiego kontekstu1
2,50 USD0,250 USD20,00 USD99,9%99% > 50 tokenów na sekundę2
GPT-5 mini
z wykluczeniem długiego kontekstu1
0,45 USD0,045 USD3,60 USD99,9%99% > 80 tokenów na sekundę2
GPT-5.1 codex
z wykluczeniem długiego kontekstu1
2,50 USD0,250 USD20,00 USD99,9%99% > 50 tokenów na sekundę2
GPT-5 codex
z wykluczeniem długiego kontekstu1
2,50 USD0,250 USD20,00 USD99,9%99% > 50 tokenów na sekundę2
GPT-4.1
z wykluczeniem długiego kontekstu1
3,50 USD0,875 USD14,00 USD99,9%99% > 80 tokenów na sekundę2
GPT-4.1 mini
z wykluczeniem długiego kontekstu1
0,70 USD0,175 USD2,80 USD99,9%99% > 90 tokenów na sekundę2
GPT-4.1 nano
z wykluczeniem długiego kontekstu1
0,20 USD0,050 USD0,80 USD99,9%99% > 100 tokenów na sekundę2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
4,25 USD2,125 USD17,00 USD99,9%99% > 80 tokenów na sekundę2
gpt-4o-2024-05-13
8,75 USD26,25 USD99,9%99% > 80 tokenów na sekundę2
GPT-4o mini
0,25 USD0,125 USD1,00 USD99,9%99% > 90 tokenów na sekundę2
o3
3,50 USD0,875 USD14,00 USD99,9%99% > 80 tokenów na sekundę2
o4-mini
2,00 USD0,500 USD8,00 USD99,9%99% > 90 tokenów na sekundę2
1Żądania szacowane na >128 tys. tokenów poleceń
2Obliczone jako opóźnienie żądania p50 w odstępach 5-minutowych. W przypadku klientów z istniejącymi umowami korporacyjnymi i umowami SLA dotyczącymi opóźnienia obliczonego jako opóźnienie żądania p50 na minutę wcześniejsze umowy SLA także obowiązują.
3Dotyczy to tylko klientów korzystających z planu Enterprise

Jak to działa

Klienci mogą kierować ruch do przetwarzania priorytetowego dla poszczególnych żądań przy użyciu istniejącego parametru service_tier, opcja service_tier = “priority”.

Tokeny obsługiwane przez przetwarzanie priorytetowe będą rozliczane według liczby tokenów, a ich cena będzie wyższa niż w przypadku stawek za przetwarzanie standardowe. 

Oprócz konfiguracji na poziomie żądania, w najbliższym czasie planujemy również dodać aktywacji na poziomie całego projektu.

Ograniczenia

  • Limity zapytań przetwarzania priorytetowego są współdzielone z innymi poziomami usług. 
  • W rzadkich przypadkach, gwałtowny wzrost liczby tokenów na minutę przetwarzania priorytetowego może spowodować napotkanie limitów narastania liczby zapytań. W przypadku przekroczenia limitu narastania liczby zapytań dodatkowy ruch może zostać przekierowany do przetwarzania standardowego.

Cennik

Oferta Scale Tier funkcjonuje niezależenie od usługi przetwarzania priorytetowego.

Żądania wysyłane do przetwarzania priorytetowego będą rozliczane oddzielnie i nie będą wliczane do zakupionych pakietów liczby tokenów na minutę Scale Tier.

Modele

Obecnie nie jest. W przyszłości zdecydujemy, czy przetwarzanie priorytetowe zostanie udostępnione dla dodatkowych produktów, a nie tylko najnowszych modeli.

Limity zapytań

Użycie w ramach przetwarzania priorytetowego jest traktowane tak samo jak standardowy ruch API w zakresie limitów zapytań.

Niezawodność:

W przypadku pytań lub uwag należy skontaktować się ze swoim Opiekunem Konta. 

Umowy SLA dotyczące przetwarzania priorytetowego będą traktowane tak samo jak umowy SLA dotyczące oferty Scale Tier. W przypadku niedotrzymania tych umów SLA w odniesieniu do klientów z umowami korporacyjnymi w danym okresie zostaną zaoferowane środki do wykorzystania na usługę.

Zasady

Tak