API Customers များအတွက် Priority Processing
Priority processing သည် pay-as-you-go ပြောင်းလွယ်ပြင်လွယ်နှင့်အတူ ယုံကြည်စိတ်ချရပြီး မြန်နှုန်းမြင့် စွမ်းဆောင်ရည်ကို ပေးပါသည်။
Priority processing ကို ရွေးချယ်ခြင်းဖြင့် အောက်ပါတို့ကို ရရှိနိုင်ပါသည်-
- ခန့်မှန်းနိုင်သော latency နိမ့်မှု- Priority processing သည် demand အမြင့်ဆုံးအချိန်များတွင်ပင် Standard processing service ထက် တိုကင် များကို ပိုမြန်စွာနှင့် ပိုတည်ငြိမ်သော အမြန်နှုန်းဖြင့် ထုတ်ပေးပါသည်။
- အသုံးပြုရလွယ်ကူသော ပြောင်းလွယ်ပြင်လွယ်- Standard processing ကဲ့သို့ပင် Priority processing ကို ကြိုတင် provisioning လိုအပ်ခြင်းမရှိဘဲ ပြောင်းလွယ်ပြင်လွယ် pay-as-you-go ပုံစံဖြင့် အသုံးပြုနိုင်ပါသည်။
| ထည့်သွင်း တိုကင် ၁ သန်းအတွက် စျေးနှုန်း | ထည့်သွင်း တိုကင် ၁ သန်းအတွက် စျေးနှုန်း(ကက်ရှ်လုပ်ထားသည်) | အထွက်တိုကင် ၁ သန်းအတွက် စျေးနှုန်း | လုပ်ဆောင်ချိန် SLA3 | တုံ့ပြန်မှုအချိန် SLA3 | |
|---|---|---|---|---|---|
GPT-5.5 ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၁၂.၅၀ US$ | ၁.၂၅၀ US$ | ၇၅.၀၀ US$ | ၉၉.၉% | ၉၉% > ၅၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-5.4 mini ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၁.၅၀ US$ | ၀.၁၅၀ US$ | ၉.၀၀ US$ | ၉၉.၉% | ၉၉% > ၁၀၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-5.4 ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၅.၀၀ US$ | ၀.၅၀၀ US$ | ၃၀.၀၀ US$ | ၉၉.၉% | ၉၉% > ၅၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-5.2 ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၃.၅၀ US$ | ၀.၃၅၀ US$ | ၂၈.၀၀ US$ | ၉၉.၉% | ၉၉% > ၅၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-5.1 ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၂.၅၀ US$ | ၀.၂၅၀ US$ | ၂၀.၀၀ US$ | ၉၉.၉% | ၉၉% > ၅၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-5 ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၂.၅၀ US$ | ၀.၂၅၀ US$ | ၂၀.၀၀ US$ | ၉၉.၉% | ၉၉% > ၅၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-5 mini ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၀.၄၅ US$ | ၀.၀၄၅ US$ | ၃.၆၀ US$ | ၉၉.၉% | ၉၉% > ၈၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-5.1 codex ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၂.၅၀ US$ | ၀.၂၅၀ US$ | ၂၀.၀၀ US$ | ၉၉.၉% | ၉၉% > ၅၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-5 codex ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၂.၅၀ US$ | ၀.၂၅၀ US$ | ၂၀.၀၀ US$ | ၉၉.၉% | ၉၉% > ၅၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-4.1 ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၃.၅၀ US$ | ၀.၈၇၅ US$ | ၁၄.၀၀ US$ | ၉၉.၉% | ၉၉% > ၈၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-4.1 mini ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၀.၇၀ US$ | ၀.၁၇၅ US$ | ၂.၈၀ US$ | ၉၉.၉% | ၉၉% > ၉၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-4.1 nano ရှည်လျားသော အကြောင်းအရာကို မပါဝင်ပါ၁ | ၀.၂၀ US$ | ၀.၀၅၀ US$ | ၀.၈၀ US$ | ၉၉.၉% | ၉၉% > ၁၀၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | ၄.၂၅ US$ | ၂.၁၂၅ US$ | ၁၇.၀၀ US$ | ၉၉.၉% | ၉၉% > ၈၀ တိုကင်များစက္ကန့်လျှင် ၂ |
gpt-4o-2024-05-13 | ၈.၇၅ US$ | — | ၂၆.၂၅ US$ | ၉၉.၉% | ၉၉% > ၈၀ တိုကင်များစက္ကန့်လျှင် ၂ |
GPT-4o mini | ၀.၂၅ US$ | ၀.၁၂၅ US$ | ၁.၀၀ US$ | ၉၉.၉% | ၉၉% > ၉၀ တိုကင်များစက္ကန့်လျှင် ၂ |
o3 | ၃.၅၀ US$ | ၀.၈၇၅ US$ | ၁၄.၀၀ US$ | ၉၉.၉% | ၉၉% > ၈၀ တိုကင်များစက္ကန့်လျှင် ၂ |
o4-mini | ၂.၀၀ US$ | ၀.၅၀၀ US$ | ၈.၀၀ US$ | ၉၉.၉% | ၉၉% > ၉၀ တိုကင်များစက္ကန့်လျှင် ၂ |
အလုပ်လုပ်ပုံ
ရှိပြီးသား service_tier parameter ကို အသုံးပြုပြီး request တစ်ခုချင်းစီအလိုက် customers များသည် traffic ကို Priority processing သို့ ညွှန်ပေးနိုင်သည်။ ရွေးချယ်စရာမှာ service_tier = “priority”.
Priority processing မှ ဆောင်ရွက်ပေးသော တိုကင် များကို per-token အခြေခံဖြင့် ဘီလ်ကောက်ခံမည်ဖြစ်ပြီး၊ Standard processing နှုန်းထားများထက် ပိုမြင့်သောစျေးနှုန်းဖြစ်သည်။
request အဆင့်တွင် သတ်မှတ်နိုင်သည့်အပြင်၊ Project settings → Default Service Tier: Priority တွင် project တစ်ခု၏ မူလတန်ဖိုးကိုလည်း Priority အဖြစ် သတ်မှတ်နိုင်သည်။ request တစ်ခုချင်းစီအလိုက် override လုပ်နိုင်သေးသည်။
ကန့်သတ်ချက်များ
- Priority processing rate limit များကို အခြား service tier များနှင့် မျှဝေသုံးစွဲပါသည်။
- ရှားပါးသောအခြေအနေများတွင် သင့် Priority processing Tokens per Minute ကို အလျင်အမြန် တိုးမြှင့်ခြင်းကြောင့် ramp rate limit ကို ထိမိနိုင်သည်။ ramp rate limit ကို ကျော်လွန်ပါက additional traffic ကို Standard processing သို့ ပို့နိုင်သည်။