شرکت تولید آواتار دیجیتال Lemon Slice مدل جدیدی به نام Lemon Slice-2 معرفی کرده که قادر است تنها از یک تصویر، آواتار ویدیویی تولید کند و آن را بهعنوان لایهای تعاملی روی چتباتها و عوامل هوش مصنوعی قرار دهد. این فناوری میتواند در پاسخ به پرسشهای مشتریان، کمک در تکالیف آموزشی یا حتی ارائه پشتیبانی روانشناختی بهکار رود و تجربه تعامل صوتی-بصری را برای کاربران فراهم کند.
Lemon Slice-2 یک مدل انتشار (diffusion) عمومی با حدود 20 میلیارد پارامتر است که بهگونهای طراحی شده تا روی یک GPU بتواند ویدیوهای زنده را با سرعت حدود 20 فریم بر ثانیه پخش کند. شرکت این مدل را از طریق API و یک ویجت قابل جاسازی عرضه میکند که با یک خط کد میتوان آن را در وبسایت یا اپلیکیشنها ادغام کرد. پس از ساخت آواتار، امکان تغییر پسزمینه، استایل و ظاهر شخصیت در هر زمان وجود دارد و علاوه بر آواتارهای انساننما، تولید شخصیتهای غیرانسانی برای مصارف مختلف نیز در دستور کار قرار دارد.
برای تولید صداهای آواتارها، Lemon Slice از فناوری شرکت ElevenLabs استفاده میکند و برای جلوگیری از سوءاستفادههایی مانند کلونینگ غیرمجاز چهره یا صدا، محافظتها و مکانیسمهای کنترلی را پیادهسازی کرده است. همچنین از مدلهای زبان بزرگ برای نظارت بر محتوا و حذف موارد نامناسب استفاده میشود.
Lemon Slice که در 2024 توسط لینا کولوتچی، سیدنی پریماس و اندرو ویتز بنیانگذاری شد، با تکیه بر مدل انتشار عمومی خود تلاش دارد از رقبایی که راهحلهای خاص و محدود ارائه میدهند متمایز شود. بنیانگذاران معتقدند مشکل اصلی در پذیرش گسترده آواتارها تاکنون «اثر دره وهمانگیز (uncanny valley)» و محدودیتهای فنی بوده است؛ آنها هدفگذاری کردهاند تا با مدل عام و آموزش مقیاسپذیر، به کیفیتی فراتر از رقبا دست یابند.
این استارتآپ که در حال حاضر هشت کارمند دارد، روز سهشنبه اعلام کرد در دور سرمایهگذاری اولیه 10.5 میلیون دلار جذب کرده است. سرمایهگذاران عبارتند از Matrix Partners، Y Combinator، آرش فردوسی (CTO سابق Dropbox)، امت شیر (مدیرعامل سابق Twitch) و گروه موسیقی The Chainsmokers. تیم قصد دارد از این سرمایه برای توسعه محصولات، جذب نیروهای مهندسی و بازار، و پوشش هزینههای آموزش مدلها و زیرساختهای محاسباتی استفاده کند.
موارد استفاده اعلامشده شامل آموزش و یادگیری زبان، تجارت الکترونیک، آموزش سازمانی و تولید محتوای ویدیویی تعاملی است. رقابت در این حوزه شدید است و شرکتهایی مانند D-ID، HeyGen، Synthesia و سازندگان آواتار مانند Genies، Soul Machine، Praktika و AvatarOS نیز فعالاند؛ با این حال سرمایهگذاران Lemon Slice به توان فنی تیم و رویکرد عمومی مدل این شرکت بهعنوان مزیت رقابتی اشاره کردهاند.
Lemon Slice-2 میتواند نقطه عطفی در تبدیل گفتگوهای متنی به تجربههای ویدیویی و تعاملی باشد و مسیر تازهای برای استفاده از آواتارهای هوش مصنوعی در محصولات دیجیتال باز کند.
