مدل جدید تولید تصویر OpenAI، gpt-image-1، به تازگی به API این شرکت اضافه شده است. این مدل، که از ابزار تولید تصویر محبوب ChatGPT بهره میبرد، به توسعهدهندگان و کسبوکارها این امکان را میدهد که بهراحتی تولید تصاویر با کیفیت حرفهای را به ابزارها و پلتفرمهای خود ادغام کنند.
به گفته OpenAI، gpt-image-1 قابلیتهایی عالی برای تولید تصاویر با سبکهای مختلف داشته و میتواند بهطور دقیق از راهنماهای سفارشی پیروی کرده و دانش جهانی را به کار گیرد. این ویژگیها فرصتی شگرف برای کاربردهای متنوع در صنایع مختلف بهوجود میآورد.
در راستای هزینهها، API جدید شامل تفکیک توکنها برای ورودیهای متنی و تصویری است. توکنهای ورودی متنی هر میلیون توکن معادل ۵ دلار هزینه دارد، در حالی که توکنهای ورودی تصویری ۱۰ دلار به ازای هر میلیون توکن و توکنهای خروجی تصویری (تصاویر ایجاد شده) نیز ۴۰ دلار به ازای هر میلیون توکن تعیین شده است.
با توجه به رقابت در عرصه تولید تصاویر، رقبایی نظیر Stability AI و Google نیز مدلهای خاص خود را ارائه کردهاند. به عنوان مثال، مدل تولید تصویر Google، با نام Imagen، برای هر تصویر ۰.۰۳ دلار از کاربران هزینه میگیرد.
گفتنی است که OpenAI به کاربران ChatGPT اجازه داده تا بتوانند بهصورت مستقیم در بستر چت تصاویر را تولید و ویرایش کنند. این قابلیت پس از معرفی مدل GPT-4o رونمایی شد و خیلی سریع به یکی از ویژگیهای محبوب این پلتفرم تبدیل گردید، بهطوری که بیش از ۱۳۰ میلیون کاربر به این ویژگی دسترسی پیدا کردند و تنها در هفته اول، ۷۰۰ میلیون عکس بهوجود آمد.
با این حال، این محبوبیت چالشهایی نیز برای OpenAI به همراه داشت. کاربران شبکههای اجتماعی به سرعت دریافتند که میتوانند با استفاده از ChatGPT تصاویری الهامگرفته از انیمیشنهای Studio Ghibli تولید کنند که با استقبال گستردهای مواجه شد.
OpenAI همچنین به امنیت این مدل توجه ویژهای دارد و از متا دادهها برای شناسایی تصاویر تولید شده به عنوان محتوای ایجاد شده با هوش مصنوعی استفاده میکند تا مالکیت آنها نیز قابل شناسایی باشد.
در نهایت، این مدل جدید به کسبوکارها این امکان را میدهد که بدون نیاز به باز کردن یک اپلیکیشن جداگانه، تصاویر مورد نیاز خود را برای پروژههای مختلف تولید کنند و در این راستا، برندهای متعدد و استارتاپهای معروف نیز از این قابلیت بهرهبرداری کردهاند.
OpenAI اعلام کرده که اطلاعات مربوط به API مشتریان، شامل تصاویری که با gpt-image-1 ایجاد شدهاند، را برای آموزش مدلهای خود استفاده نخواهد کرد و همچنین مشتریان میتوانند بر روی پیشگیری از محتوای نامناسب کنترل داشته باشند.