در راستای تقویت رقابت با شرکتهای مطرح هوش مصنوعی مانند گوگل، OpenAI اقدام به راهاندازی «پردازش منعطف» (Flex processing) کرده است. این گزینه API به کاربران این امکان را میدهد که با قیمتهای پایینتر برای استفاده از مدلهای هوش مصنوعی، به شرطی که زمان پاسخدهی کندتر باشد و در برخی موارد منابع در دسترس نباشند، بهرهبرداری کنند. پردازش منعطف که هماکنون در مرحله بتا برای مدلهای جدید o3 و o4-minireasoning در دسترس است، بهخصوص برای وظایف کماولویت و «غیرتولیدی» شامل ارزیابی مدلها، غنیسازی دادهها و بارهای کاری غیروقتی طراحی شده است. به گفته OpenAI، این گزینه هزینههای API را به نصف کاهش میدهد.
به عنوان مثال، برای مدل o3، هزینه پردازش منعطف به ۵ دلار برای هر میلیون توکن ورودی (تقریباً معادل ۷۵۰,۰۰۰ کلمه) و ۲۰ دلار برای هر میلیون توکن خروجی کاهش یافته است. در حالی که در حالت عادی این هزینهها به ترتیب ۱۰ و ۴۰ دلار است. همچنین، برای مدل o4-mini، قیمتها به ۰.۵۵ دلار برای هر میلیون توکن ورودی و ۲.۲۰ دلار برای خروجی، از ۱.۱۰ و ۴.۴۰ دلار به طور قابل توجهی کاهش یافتهاند.
این اقدام در حالی انجام میشود که قیمتهای هوش مصنوعی پیشرفته همچنان افزایش مییابد و رقبا مدلهایی با هزینههای کمتر و کارایی بالاتر ارائه میدهند. به عنوان مثال، روز پنجشنبه گوگل مدل «Gemini 2.5 Flash» را عرضه کرد که در زمینه عملکرد مشابه یا بهتر از R1 شرکت DeepSeek است، اما با هزینه کمتری برای توکنهای ورودی.
در ایمیلی که OpenAI به مشتریان خود ارسال کرده، اعلام شده است که توسعهدهندگان در سطوح ۱ تا ۳ از سلسله مراتب مصرف، برای دسترسی به مدل o3 باید فرآیند جدید احراز هویت را طی کنند. این سطوح بر اساس میزان هزینههای صرف شده برای خدمات OpenAI تعیین میشوند. همچنین، خلاصههای استدلال و پشتیبانی API استریم برای سایر مدلها نیز به احراز هویت وابسته خواهد بود. OpenAI پیشتر اعلام کرده بود که هدف از این احراز هویت جلوگیری از نقض سیاستهای استفاده است.