شرکت OpenAI در ژانویه 2021، فریمورک DALL.E را معرفی کرد، اکنون این کمپانی که درباره هوش مصنوعی تحقیق میکند از بروزترین نسخه پروژهی تبدیل متن به تصویر خود، DALL.E 2 رونمایی کرده است. DALL.E 2 میتواند بر اساس توصیفهایی به زبان روزمره، تصاویر واقعی و هنری بسازد.
این سیستم هوش مصنوعی میتواند بر اساس عباراتی از زبان روزمره، ویرایشهایی واقعی بر روی عکسهای موجود انجام دهد؛ همچنین میتواند عناصری مثل سایهها، بازتابها و بافتها را نیز کم یا زیاد نماید. میتواند یک تصویر را نیز بردارد و با الهام از نسخه اصلی، نسخههای مختلفی از آن ایجاد کند.
DALL.E 2 رابطهی میان تصاویر و متنهای مرتبط با آنها را فرا میگیرد. این فریمورک از یک فرآیند به نام diffusion(انتشار) استفاده میکند که ابتدا در آن نقاطی را با الگویی تصادفی انتخاب میکند و رفته رفته این روند را در پی شناسایی یک تصویر خاص بهبود میبخشد تا زمانی که بخشهای معینی از آن تصویر را تشخیص دهد.
زمانی که از ارزیابان خواستند تا 1000 نمونه تصویر مختلف مربوط به دو مدل نسل ا و 2 را با هم مقایسه کنند آنان تصاویر DALL.E 2 را به خاطر همخوانی بیشتر با متن و واقعنمایی، به DALL.E 1 ترجیح دادند.
با این وجود DALL·E 2 یک پروژه تحقیقاتی است و API آن در دسترس نیست. OpenAI به عنوان بخشی از تلاش و تعهد خود برای توسعه و گسترش هوش مصنوعی، محدودیتها و قابلیتهای DALL·E را با گروهی منتخب از کاربران آزمایش میکند.
در این نسخه محدودیتهای امنیتی افزایش یافته که شامل موارد زیر است:
- جلوگیری از تولید تصاویر مخرب: بخشی از قابلیتهای E 2 محدود شده تا از تولید تصاویر خشونتآمیز، نفرتانگیز یا مستهجن جلوگیری کند و در دورهی آموزش هوش مصنوعی چنین تصاویری حذف میشوند.
- ممانعت از سوء استفاده: فیلترها برای محدودکردن درخواستهای متنی و بارگذاری تصاویری که ممکن است قوانین ما را نقض کند مورد استفاده قرار میگیرند.
- استقرار (Deployment) مرحله به مرحله بر اساس یادگیری: دسترسی به E 2 محدود به کاربران قابل اعتمادی است که به تیمها کمک میکنند تا در مورد قابلیتها و محدودیتهای این فناوری اطلاعات کسب کنند.
میتوانید اینجا را کلیک کنید و در نوبت انتظار استفاده از DALL.E 2 قرار بگیرید.
بدون دیدگاه