برد منزس، مدیرعامل استارتاپ کدنویسی سازمانی Superblocks، بر این باور است که نسل جدید ایدههای استارتاپی با ارزشی در مرز میلیاردر شدن در دسترس هستند: دستورات سیستمی که توسط استارتاپهای موفق هوش مصنوعی در حال استفاده است. این دستورات سیستمی، شامل مجموعههای گستردهای از درخواستها (بیش از ۵۰۰۰ تا ۶۰۰۰ کلمه) هستند که استارتاپهای هوش مصنوعی برای راهنمایی مدلهای پایهای از شرکتهایی مانند OpenAI یا Anthropic در تولید محصولات هوش مصنوعی خود به کار میبرند. به اعتقاد منزس، این دستورات بهنوعی کلاسهای آموزشی مهندسی درخواست به حساب میآیند. او در گفتگو با TechCrunch گفت: «هر شرکت دستورات سیستمی منحصر به فردی برای همان مدل پایهای دارد. آنها در تلاشند تا مدل را وادار کنند دقیقاً مطابق نیازهای خاص هر حوزه و وظیفه عمل کند.»
دستورات سیستمی بهطور کامل پنهان نیستند و مشتریان میتوانند از بسیاری از ابزارهای هوش مصنوعی درخواست کنند آنها را به اشتراک بگذارند. با این حال، این اطلاعات همیشه بهطور عمومی در دسترس نیستند. به همین دلیل، در راستای معرفی محصول جدید استارتاپش، یک عامل هوش مصنوعی کدنویسی به نام Clark، Superblocks پیشنهاد کرد فایلی شامل ۱۹ دستور سیستمی از برخی از محبوبترین محصولات کدنویسی هوش مصنوعی مانند Windsurf، Manus، Cursor، Lovable و Bolt را به اشتراک بگذارد. توییت منزس به سرعت viral شد و نزدیک به ۲ میلیون بازدید داشت، از جمله شخصیتهای مهمی مانند سم بلاند، از بنیانگذاران Founders Fund و Brex، و آرون لِوی، سرمایهگذار Superblocks.
Superblocks هفته گذشته اعلام کرد که موفق به جذب ۲۳ میلیون دلار در دور سرمایهگذاری سری A شده و مجموع سرمایهگذاریهای خود را به ۶۰ میلیون دلار رسانده است. این سرمایهها برای توسعه ابزارهای کدنویسی مخصوص غیر-programmers در سازمانها به کار خواهد رفت. به همین منظور از منزس خواستیم تا ما را با روند مطالعه دستورات سیستمی دیگران برای استخراج اطلاعات مفید آشنا کند. او بیان کرد: «به نظر من، بزرگترین درسی که از ساخت Clark و مطالعه دستورات سیستمی گرفتیم این است که خود دستور سیستم شاید ۲۰ درصد از راز موفقیت را تشکیل دهد.» به گفته او، این دستور میتواند به مدلهای زبان پایه (LLM) نشان دهد که چه کاری باید انجام شود. ۸۰ درصد باقیمانده شامل «غنیسازی درخواست» است که به زیرساختی اشاره دارد که یک استارتاپ پیرامون فراخوانهای LLM بنا میکند.
او ادامه داد که سه بخش اصلی برای مطالعه دستورات سیستمی وجود دارد: تحلیل نقشی، تحلیل متنی و استفاده از ابزارها. یکی از نکات قابل توجه این است که، در حالی که دستورات سیستمی به زبان طبیعی نوشته شدهاند، اما بسیار خاص و دقیق هستند. منزس گفت: «شما باید بهگونهای صحبت کنید که گویی با یک همکار انسانی صحبت میکنید و دستورات باید کاملاً دقیق باشند.»
تحلیل نقشی به مدلهای LLM کمک میکند که در اجرای وظایف خود مداوم عمل کنند و هدف و شخصیت خاصی به آنها میدهد. برای مثال، دستور Devin با این جمله آغاز میشود: «شما Devin هستید، یک مهندس نرمافزار با استفاده از یک سیستمعامل واقعی. شما یک رمزگذار واقعی هستید: تعداد کمی از برنامهنویسان به اندازه شما در درک پایگاههای کد، نوشتن کدهای کارآمد و تمیز، و ویرایش تغییرات خود تا زمان درست شدن، توانمند هستند.»
تحلیل متنی به مدلها زمینهای برای بررسی قبل از عمل را ارائه میدهد تا هزینهها را کاهش دهد و وضوح وظایف را تضمین کند. دستور Cursor میگوید: «فقط در صورت نیاز ابزارها را فراخوانی کنید و هرگز نام ابزارها را به کاربران نگوید — فقط آنچه را که انجام میدهید توصیف کنید. … کد را مگر در صورت درخواست نشان ندهید. … قبل از ویرایش، محتویات فایلهای مرتبط را بخوانید و خطاهای واضح را اصلاح کنید، اما حدس نزنید یا بیش از سه بار اصلاحات را تکرار نکنید.»
استفاده از ابزارها به انجام وظایف مستقل کمک میکند زیرا به مدلها میآموزد که فقط به تولید متن اکتفا نکنند. برای نمونه، دستور Replit بلند است و شامل ویرایش و جستجوی کد، نصب زبانها، راهاندازی و پرسش از پایگاههای داده PostgreSQL، و اجرای دستورات شل و موارد دیگر میشود. مطالعه دستورات سیستمی دیگران به منزس کمک کرد تا تمرکز سایر کدنویسان بر روی چه چیزهایی است. او گفت: «ابزارهایی مانند Lovable، V0 و Bolt بر روی تکرار سریع تمرکز دارند» در حالی که «Manus، Devin، OpenAI Codex و Replit» به کاربران در ایجاد برنامههای تمامپشته کمک میکنند اما «خروجی هنوز کد خام است.»
منزس فرصتهایی را برای اجازه به غیر برنامهنویسان برای نوشتن برنامهها در نظر گرفته است اگر استارتاپ او بتواند بیشتر از این، از جمله امنیت و دسترسی به منابع دادهای سازمانی مانند Salesforce، را مدیریت کند. اگرچه او هنوز به استارتاپ چند میلیارد دلاری خود نرسیده است، اما Superblocks مشتریان قابل توجهی را جذب کرده است، از جمله Instacart و PayPal Global. او همچنین محصول خود را بهصورت داخلی آزمایش میکند و به مهندسان نرمافزارش اجازه نمیدهد که ابزارهای داخلی بنویسند؛ بلکه تنها میتوانند بر روی محصول کار کنند. بنابراین تیم تجاری او ابزارهایی برای نیازهای خود ساختهاند، مانند ابزاری که از دادههای CRM برای شناسایی مشتریان بالقوه استفاده میکند، یکی که متریکهای پشتیبانی را ردیابی میکند و دیگری که تخصیص وظایف مهندسان فروش انسانی را متعادل میکند. «این بهواقع یک روش برای ماست تا ابزارها را بسازیم و نه اینکه صرفاً آنها را خریداری کنیم»، او بیان کرد.