Langsung ke konten utama
OpenAI

Pemrosesan Prioritas untuk Pelanggan API

Penawaran ini tersedia untuk pelanggan Enterprise. Hubungi tim penjualan kami untuk mempelajari selengkapnya.

Pemrosesan prioritas menawarkan kinerja andal dan kecepatan tinggi dengan fleksibilitas bayar sesuai pemakaian.

Dengan memilih Pemrosesan prioritas, Anda dapat membuka:

  • Latensi rendah yang dapat diprediksi: Pemrosesan prioritas membuat token lebih cepat dan dengan kecepatan yang lebih konsisten dibandingkan dengan layanan Pemrosesan standar, bahkan saat permintaan puncak.
  • Fleksibilitas yang mudah digunakan: Seperti Pemrosesan standar, Pemrosesan prioritas dapat diakses dengan basis bayar sesuai permintaan yang fleksibel bukannya mewajibkan penyediaan lanjutan.
Harga per 1JT token masukanHarga per 1JT token masukan (dengan cache)Harga per 1JT token keluaranSLA Waktu aktif3SLA Latensi3
GPT-5.1
mengecualikan konteks panjang1
US$2,50US$0,250US$20,0099,9%99% > 50 token per detik2
GPT-5
mengecualikan konteks panjang1
US$2,50US$0,250US$20,0099,9%99% > 50 token per detik2
GPT-5 mini
mengecualikan konteks panjang1
US$0,45US$0,045US$3,6099,9%99% > 80 token per detik2
GPT-5.1 codex
mengecualikan konteks panjang1
US$2,50US$0,250US$20,0099,9%99% > 50 token per detik2
GPT-5 codex
mengecualikan konteks panjang1
US$2,50US$0,250US$20,0099,9%99% > 50 token per detik2
GPT-4.1
mengecualikan konteks panjang1
US$3,50US$0,875US$14,0099,9%99% > 80 token per detik2
GPT-4.1 mini
mengecualikan konteks panjang1
US$0,70US$0,175US$2,8099,9%99% > 90 token per detik2
GPT-4.1 nano
mengecualikan konteks panjang1
US$0,20US$0,050US$0,8099,9%99% > 100 token per detik2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
US$4,25US$2,125US$17,0099,9%99% > 80 token per detik2
gpt-4o-2024-05-13
US$8,75US$26,2599,9%99% > 80 token per detik2
GPT-4o mini
US$0,25US$0,125US$1,0099,9%99% > 90 token per detik2
o3
US$3,50US$0,875US$14,0099,9%99% > 80 token per detik2
o4-mini
US$2,00US$0,500US$8,0099,9%99% > 90 token per detik2
1Permintaan diestimasikan pada token prompt >128K
2Dihitung sebagai latensi permintaan p50 per 5 menit. Untuk pelanggan dengan perjanjian enterprise yang ada, dengan SLA latensi yang dihitung sebagai latensi permintaan p50 per menit, SLA sebelumnya juga masih berlaku.
3Ini hanya berlaku bagi pelanggan Enterprise

Cara kerjanya

Pelanggan dapat mengarahkan Pemrosesan prioritas dengan dasar per permintaan menggunakan parameter service_tier yang sudah ada, dengan opsi service_tier = “priority”.

Token yang dilayani Pemrosesan prioritas akan ditagih dengan dasar per token, dengan harga premium dibandingkan dengan tarif Pemrosesan standar. 

Selain dikonfigurasi pada tingkat permintaan, kami juga berencana untuk menambahkan kemampuan untuk memasukkannya ke tingkat proyek dalam jangka waktu dekat.

Keterbatasan

  • Batasan laju pemrosesan prioritas adalah dibagikan dengan berbagai jenjang layanan lainnya. 
  • Dalam kasus yang jarang, peningkatan cepat terhadap Token per Menit Pemrosesan prioritas dapat mengakibatkan tercapainya batas laju perubahan. Jika Anda melewati batas laju perubahan, maka lalu lintas tambahan mungkin dikirimkan ke Pemrosesan standar.

Harga

Jenjang Skala akan tetap terpisah dari Pemrosesan prioritas.

Permintaan yang dikirim ke Pemrosesan prioritas akan ditagih terpisah dan tidak akan dihitung terhadap pembelian paket TPM Jenjang Skala.

Model

Tidak untuk saat ini. Kami akan melakukan evaluasi di masa mendatang apakah akan menawarkan Pemrosesan prioritas pada produk-produk tambahan di luar dari model terbaru kami.

Batas laju

Konsumsi pemrosesan prioritas diperlakukan seperti lalu lintas API standar untuk batas lajunya.

Keandalan

Hubungi AD Anda dengan pertanyaan atau masalahnya. 

SLA Pemrosesan Prioritas akan diperlakukan sama seperti SLA Jenjang Skala, kredit layanan akan ditawarkan jika kami gagal memenuhi SLA tersebut untuk pelanggan dalam perjanjian enterprise selama jendela waktu yang diberikan.

Kebijakan

Ya