وells Fargo به آرامی به دستاوردی دست یافته که بسیاری از شرکتها همچنان در آرزوی آن هستند: ایجاد یک سیستم هوش مصنوعی تولیدی قابلاستفاده در مقیاس وسیع که بهطور واقعی کار میکند. در سال 2024، دستیار هوش مصنوعی این بانک با نام “فارگو” بیش از 245.4 میلیون تعامل را مدیریت کرد که به بیش از دو برابر پیشبینیهای اولیه آن تبدیل شد و این میزان بدون اینکه هیچگونه اطلاعات حساس مشتری به مدل زبانی برسد، انجام شد. فارگو به مشتریان در انجام نیازهای روزمره بانکی با استفاده از صدا یا متن کمک میکند و درخواستهایی مانند پرداخت قبضها، انتقال وجه، ارائه جزئیات تراکنشها و پاسخ به سوالات در مورد فعالیتهای حساب را مدیریت میکند. این دستیار بهعنوان ابزاری جذاب برای کاربران شناخته شده است و بهطور میانگین چندین تعامل را در هر جلسه ثبت میکند.
این سیستم از یک خط لوله مبتنی بر حریم خصوصی استفاده میکند. مشتری از طریق اپلیکیشن تعامل میکند، جایی که گفتار بهطور محلی با استفاده از مدل گفتار به متن تبدیل میشود. سپس این متن توسط سیستمهای داخلی Wells Fargo، شامل یک مدل زبانی کوچک برای شناسایی اطلاعات شناساییشده، پاکسازی و توکنیزه میشود. تنها پس از این مراحل، یک تماس به مدل Flash 2.0 گوگل برقرار میشود تا نیت کاربر و موجودیتهای مرتبط استخراج شوند. هیچ اطلاعات حساسی هرگز به مدل نمیرسد. «لایه ارکستراسیون با مدل ارتباط برقرار میکند»، جیئیاو Wells Fargo، چینتان مهتا، در مصاحبهای با VentureBeat گفت. «ما فیلترها در جلو و عقب هستیم».
آمارهای داخلی Wells Fargo نشاندهنده یک افزایش چشمگیر است: از 21.3 میلیون تعامل در سال 2023 به بیش از 245 میلیون در سال 2024، با بیش از 336 میلیون تعامل تجمعی از زمان راهاندازی. همچنین، پذیرش زبان اسپانیایی بهطور قابلتوجهی افزایش یافته و از زمان راهاندازی در سپتامبر 2023، بیش از 80% استفاده را به خود اختصاص داده است. این معماری نمایشدهنده یک تغییر استراتژیک وسیعتر است. مهتا گفت رویکرد بانک مبتنیبر ساخت «سیستمهای ترکیبی» است، جایی که لایههای ارکستراسیون بر اساس وظیفه، تصمیم میگیرند که از کدام مدل استفاده شود. در حالی که مدل Gemini Flash 2.0 قدرت بخش فارگو را فراهم میکند، مدلهای کوچکتر مانند Llama نیز در داخل استفاده میشوند و مدلهای OpenAI در صورت نیاز قابل دسترسی است.
مهتا تصریح کرد که «مدلنامشخصیبودن» در حال حاضر ضروری است و گفت که در حالی که بیشتر مدلها اکنون کارهای روزمره را بهخوبی انجام میدهند، توانایی استدلال همچنان بهعنوان یک مورد مرزی وجود دارد که برخی مدلها بهطور واضح بهتر از سایرین انجام میدهند. در رویدادی که به میزبانی VentureBeat برگزار شده بود، مهتا به سیستم ارکستراسیون Wells Fargo اشاره کرد که بهعنوان یک طراحی دو لایه عمل میکند و به شکلی طراحی شده تا از هرگونه ریسک و حساسیت دادهای جلوگیری کند.
بانک همچنین به سمت سیستمهای خودکارتر در حال حرکت است. مهتا پروژه اخیر خود را برای بازنگری در 15 سال اسناد وام آرشیوی توضیح داد که در آن از شبکهای از عوامل در حال تعامل استفاده شده است. هر عامل وظیفه خاصی در این فرایند داشت که شامل بازیابی اسناد از آرشیو، استخراج محتویات آنها و مطابقت دادهها با سیستمهای سوابق بود.
در حال حاضر، Wells Fargo و داستانهای Wayfair در زمان مناسبی برای گوگل قرار دارند که هفته جاری کنفرانس سالانه Google Cloud Next را در لاس وگاس برگزار میکند. با اینکه OpenAI و Anthropic در ماههای اخیر در عرصه هوش مصنوعی تسلط پیدا کردهاند، به نظر میرسد که استفادههای تجاری بهدنبال بازگشت به سمت گوگل باشد. مهتا بر این باور است که عملکرد مدل یا دسترسی به GPU، موانع واقعی برای پذیرش هوش مصنوعی نیستند، بلکه نسل و توزیع قدرت، بهعنوان bottleneck واقعی مطرح است.