نوآوری syftr در بهینه‌سازی سامانه‌های هوش مصنوعی مولد

نوآوری syftr در بهینه‌سازی سامانه‌های هوش مصنوعی مولد

به گزارش پردیس هوش مصنوعی و نوآوری دیجیتال ایران، پژوهشگران در مقاله‌ای جدید با عنوان «syftr: Pareto-Optimal Generative AI» که در arXiv منتشر شده است، از چارچوبی نوآورانه به نام syftr رونمایی کرده‌اند. این چارچوب پاسخی حیاتی به چالش‌های فزاینده در ساخت و بهینه‌سازی سامانه‌های هوش مصنوعی برای تولید پاسخ‌های آگاهانه با استفاده از منابع خارجی (RAG) برای مدل‌های زبان بزرگ (LLM) معرفی شده است.

ساخت چنین سامانه‌هایی، نیازمند انتخاب دقیق و تنظیم اجزای چون پایگاه‌های داده وکتور، مدل‌های جاسازی، تقسیم‌کننده‌های متن، بازیافت‌کننده‌ها و LLMهای سنتزکننده است. با ظهور پارادایم‌های عاملی (agentic) و ماژول‌هایی نظیر تأییدکننده‌ها، بازنویسان و رتبه‌بندی‌کننده‌ها، پیچیدگی این فرآیند دوچندان شده است. مدیریت بین زمان پاسخ دهی، دقت و هزینه به یک چالش جدی تبدیل شده بود.

راه‌حل syftr

syftr یک چارچوب قدرتمند است که جستجوی چندهدفه‌ای را روی طیف وسیعی از پیکربندی‌های عاملی و غیرعاملی سامانه‌های هوش مصنوعی (RAG) انجام می‌دهد. این چارچوب با بهره‌گیری از بهینه‌سازی بیزی (Bayesian Optimization)، خطوط جریان بهینه پارتو را کشف می‌کند که به‌طور همزمان دقت و هزینه وظایف را بهینه می‌سازد. علاوه بر این، یک مکانیسم نوین توقف زودهنگام (early-stopping)، با هرس کردن کاندیداهای به‌وضوح ناکارآمد، کارایی را به‌طور قابل توجهی افزایش می‌دهد.

بر اساس نتایج حاصل از چندین بنچمارک، سامانه‌های هوش مصنوعی (RAG) با استفاده از چارچوب syftr موفق به شناسایی خطوط جریانی شده‌اند که به‌طور متوسط حدود ۹ برابر ارزان‌تر از گزینه‌های دیگر هستند، در حالی که دقت، دقیق‌ترین جریان‌ها در مرز پارتو حفظ می‌شود. 

به عنوان مثال، در یک مطالعه‌ روی تأثیر اندازه LLM بر جریان‌های موسیقی CRAG (نوعی از این سامانه‌های هوش مصنوعی)، دقت به‌طور متوسط ۱۷.۳ درصد افزایش یافته، در حالی که هزینه تنها ۶۷ برابر شده است.

به طور خاص، در یکی از موارد Critique RAG Agent (نوعی از عامل این سامانه‌ها)، syftr توانسته است دقت را از ۵۰.۰% به ۹۰.۶% (افزایش ۴۰.۶ درصدی) با ضریب هزینه ۲۵۳.۶ برابر بهبود بخشد.

اهمیت و کاربرد

قابلیت syftr در طراحی و بهینه‌سازی، امکان ادغام ماژول‌های جدید را نیز فراهم می‌کند. این پیشرفت می‌تواند تأثیر عمیقی بر توسعه و استقرار سامانه‌های هوش مصنوعی برای تولید پاسخ‌های آگاهانه با استفاده از اطلاعات خارجی داشته باشد و به سازمان‌ها کمک کند تا به‌طور کارآمدتر و مقرون‌به‌صرفه‌تری از مدل‌های زبانی بزرگ بر روی داده‌های اختصاصی و پویا بهره‌برداری کنند.