شرکت تولید آواتار دیجیتال Lemon Slice مدل جدیدی به نام Lemon Slice-2 معرفی کرده که قادر است تنها از یک تصویر، آواتار ویدیویی تولید کند و آن را به‌عنوان لایه‌ای تعاملی روی چت‌بات‌ها و عوامل هوش مصنوعی قرار دهد. این فناوری می‌تواند در پاسخ به پرسش‌های مشتریان، کمک در تکالیف آموزشی یا حتی ارائه پشتیبانی روان‌شناختی به‌کار رود و تجربه تعامل صوتی-بصری را برای کاربران فراهم کند.

Lemon Slice-2 یک مدل انتشار (diffusion) عمومی با حدود 20 میلیارد پارامتر است که به‌گونه‌ای طراحی شده تا روی یک GPU بتواند ویدیوهای زنده را با سرعت حدود 20 فریم بر ثانیه پخش کند. شرکت این مدل را از طریق API و یک ویجت قابل جاسازی عرضه می‌کند که با یک خط کد می‌توان آن را در وب‌سایت یا اپلیکیشن‌ها ادغام کرد. پس از ساخت آواتار، امکان تغییر پس‌زمینه، استایل و ظاهر شخصیت در هر زمان وجود دارد و علاوه بر آواتارهای انسان‌نما، تولید شخصیت‌های غیرانسانی برای مصارف مختلف نیز در دستور کار قرار دارد.

برای تولید صداهای آواتارها، Lemon Slice از فناوری شرکت ElevenLabs استفاده می‌کند و برای جلوگیری از سوءاستفاده‌هایی مانند کلونینگ غیرمجاز چهره یا صدا، محافظت‌ها و مکانیسم‌های کنترلی را پیاده‌سازی کرده است. همچنین از مدل‌های زبان بزرگ برای نظارت بر محتوا و حذف موارد نامناسب استفاده می‌شود.

Lemon Slice که در 2024 توسط لینا کولوتچی، سیدنی پریماس و اندرو ویتز بنیان‌گذاری شد، با تکیه بر مدل انتشار عمومی خود تلاش دارد از رقبایی که راه‌حل‌های خاص و محدود ارائه می‌دهند متمایز شود. بنیان‌گذاران معتقدند مشکل اصلی در پذیرش گسترده آواتارها تاکنون «اثر دره وهم‌انگیز (uncanny valley)» و محدودیت‌های فنی بوده است؛ آنها هدف‌گذاری کرده‌اند تا با مدل عام و آموزش مقیاس‌پذیر، به کیفیتی فراتر از رقبا دست یابند.

این استارت‌آپ که در حال حاضر هشت کارمند دارد، روز سه‌شنبه اعلام کرد در دور سرمایه‌گذاری اولیه 10.5 میلیون دلار جذب کرده است. سرمایه‌گذاران عبارتند از Matrix Partners، Y Combinator، آرش فردوسی (CTO سابق Dropbox)، امت شیر (مدیرعامل سابق Twitch) و گروه موسیقی The Chainsmokers. تیم قصد دارد از این سرمایه برای توسعه محصولات، جذب نیروهای مهندسی و بازار، و پوشش هزینه‌های آموزش مدل‌ها و زیرساخت‌های محاسباتی استفاده کند.

موارد استفاده اعلام‌شده شامل آموزش و یادگیری زبان، تجارت الکترونیک، آموزش سازمانی و تولید محتوای ویدیویی تعاملی است. رقابت در این حوزه شدید است و شرکت‌هایی مانند D-ID، HeyGen، Synthesia و سازندگان آواتار مانند Genies، Soul Machine، Praktika و AvatarOS نیز فعال‌اند؛ با این حال سرمایه‌گذاران Lemon Slice به توان فنی تیم و رویکرد عمومی مدل این شرکت به‌عنوان مزیت رقابتی اشاره کرده‌اند.

Lemon Slice-2 می‌تواند نقطه عطفی در تبدیل گفتگوهای متنی به تجربه‌های ویدیویی و تعاملی باشد و مسیر تازه‌ای برای استفاده از آواتارهای هوش مصنوعی در محصولات دیجیتال باز کند.

دستیار هوشمند بینا ویرا

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا