OpenAI از پردازش Flex برای کاهش هزینه و سرعت در تسک‌های هوش مصنوعی رونمایی کرد

در راستای تقویت رقابت با شرکت‌های مطرح هوش مصنوعی مانند گوگل، OpenAI اقدام به راه‌اندازی «پردازش منعطف» (Flex processing) کرده است. این گزینه API به کاربران این امکان را می‌دهد که با قیمت‌های پایین‌تر برای استفاده از مدل‌های هوش مصنوعی، به شرطی که زمان پاسخ‌دهی کندتر باشد و در برخی موارد منابع در دسترس نباشند، بهره‌برداری کنند. پردازش منعطف که هم‌اکنون در مرحله بتا برای مدل‌های جدید o3 و o4-minireasoning در دسترس است، به‌خصوص برای وظایف کم‌اولویت و «غیرتولیدی» شامل ارزیابی مدل‌ها، غنی‌سازی داده‌ها و بارهای کاری غیروقتی طراحی شده است. به گفته OpenAI، این گزینه هزینه‌های API را به نصف کاهش می‌دهد.

به عنوان مثال، برای مدل o3، هزینه پردازش منعطف به ۵ دلار برای هر میلیون توکن ورودی (تقریباً معادل ۷۵۰,۰۰۰ کلمه) و ۲۰ دلار برای هر میلیون توکن خروجی کاهش یافته است. در حالی که در حالت عادی این هزینه‌ها به ترتیب ۱۰ و ۴۰ دلار است. همچنین، برای مدل o4-mini، قیمت‌ها به ۰.۵۵ دلار برای هر میلیون توکن ورودی و ۲.۲۰ دلار برای خروجی، از ۱.۱۰ و ۴.۴۰ دلار به طور قابل توجهی کاهش یافته‌اند.

این اقدام در حالی انجام می‌شود که قیمت‌های هوش مصنوعی پیشرفته همچنان افزایش می‌یابد و رقبا مدل‌هایی با هزینه‌های کمتر و کارایی بالاتر ارائه می‌دهند. به عنوان مثال، روز پنجشنبه گوگل مدل «Gemini 2.5 Flash» را عرضه کرد که در زمینه عملکرد مشابه یا بهتر از R1 شرکت DeepSeek است، اما با هزینه کمتری برای توکن‌های ورودی.

در ایمیلی که OpenAI به مشتریان خود ارسال کرده، اعلام شده است که توسعه‌دهندگان در سطوح ۱ تا ۳ از سلسله مراتب مصرف، برای دسترسی به مدل o3 باید فرآیند جدید احراز هویت را طی کنند. این سطوح بر اساس میزان هزینه‌های صرف شده برای خدمات OpenAI تعیین می‌شوند. همچنین، خلاصه‌های استدلال و پشتیبانی API استریم برای سایر مدل‌ها نیز به احراز هویت وابسته خواهد بود. OpenAI پیش‌تر اعلام کرده بود که هدف از این احراز هویت جلوگیری از نقض سیاست‌های استفاده است.

ایجاد تصاویر خلاقانه با هوش مصنوعی

OpenAI از پردازش Flex برای کاهش هزینه و سرعت در تسک‌های هوش مصنوعی رونمایی کرد

دیدگاه‌ خود را بنویسید لغو پاسخ