به گزارش خبرگزاری خبرآنلاین، براساس گزارش زومیت، از دو سال گذشته که بازار هوش مصنوعی‌ داغ‌تر از همیشه بوده و بین مردم گسترش یافته است، همه‌ی ما با هوش مصنوعی‌های مولدی مثل DALL-E، میدجرنی، ادوبی فایرفلای و Stable Diffusion آشنا شده‌ایم. با اینکه بهترین تولیدکنندگان تصویر هوش مصنوعی همواره در تلاش بوده‌اند که با به‌روزرسانی‌های جدید، گامی نو و پیشرفتی قابل‌ تحسین به ارمغان بیاورند، می‌توان ادعا کرد که در تعدادی از زمینه‌ها مثل واقع‌گرایی، تغییرات شگرفی نکرده‌اند.

Flux مولد تصویر هوش مصنوعیِ منبع باز و نسبتاً جدیدی محسوب می‌شود که می‌تواند گوی سبقت را به‌خصوص در زمینه‌ی واقع‌گرایی از نامداران تولید تصویر AI برباید. در آزمایش‌های اولیه پژوهشگران با اجرای این مدل روی دستگاه‌های خودشان و جفت کردن آن با ابزار Lora که XLabs آن را توسعه داده و یک اسکریپت بهینه‌سازی برای فوتورئالیسم است، جزئیات بیشتری به Flux افزوده‌اند. این امر با تنظیم و بهبود عملکرد مدل هوش مصنوعی، نتایجی تولید می‌کند که تقریباً با یک نگاه سریع از عکس‌های واقعی قابل تشخیص نیستند.

هوش مصنوعی مولد تصویر Flux

هوش مصنوعی مولد تصویر Flux

هوش مصنوعی مولد تصویر Flux

برای امتحان هوش مصنوعی جدید، زومیت از Flux خواست که مهندسی از شرکت مایکروسافت را به تصویر بکشد که در یونیفرم اداری با میکروفونی در دست و کارت پرسنلی مایکروسافت دور گردنش در حال ارائه در یکی از رویدادهای این شرکت است.

مولد تصویر Flux AI توسط استارتاپ Black Forest Labs ایجاد شده است. این شرکت مستقر در آلمان را افرادی مثل آندرس بلتمن، رابین رامبک و دومینیک لورنز که همگی از مهندسان سابق Stability AI هستند، همراه با دیگر چهره‌های پیشرو در این زمینه هدایت می‌کنند.

Flux به‌دلیل منبع باز بودن، به‌عنوان وارث Stable Diffusion معرفی می‌شود. این یعنی که کد آن به‌صورت رایگان در دسترس است و هر کسی می‌تواند آن را دستکاری کند، مدل را اصلاح کند و آن را در مولدهای خود بگنجاند.

تصویر تولیدشده با Flux روی لپ‌تاپ با RTX 4090

تصویر تولیدشده با Flux روی لپ‌تاپ با RTX ۴۰۹۰

تصویر تولیدشده با Flux روی لپ‌تاپ با RTX 4090

تصویر تولیدشده با Flux روی لپ‌تاپ با RTX ۴۰۹۰

اگر کاربران کامپیوتری داشته باشند که برای رسیدگی به نیازهای پردازش مدل هوش مصنوعی به اندازه‌ی کافی خوب باشد، می‌توانند Flux را به‌صورت محلی و بدون نیاز به تکیه‌ بر سرورهای خارجی یا سرویس‌های ابری اجرا کنند؛ بااین‌حال این برنامه در پلتفرم‌های چندمدلی مانند Poe و Nightcafe نیز موجود است. Poe و Nightcafe رابط‌هایی را برای کاربران فراهم می‌کنند تا آن‌ها بتوانند با مدل‌های مختلف هوش مصنوعی برای ایجاد تصاویر بر اساس پیام‌های متنی تعامل داشته باشند.

سه نسخه از Flux.۰۱ وجود دارد: Flux.۰۱ Pro که نسخه‌ی حرفه‌ای با مجوز تجاری محسوب می‌شود، Flux.۰۱ Dev که برای استفاده‌ی غیرتجاری به‌منظور آزمایش و بهبود در دسترس توسعه‌دهندگان و محققان قرار دارد و Flux.۰۱ Schnell که از نظر سرعت بهینه شده و برای توسعه محلی و استفاده‌ی شخصی ایدئال است.

به نظر می‌رسد Flux اکنون بزرگ‌ترین رقیب میدجرنی در زمینه فوتورئالیسم باشد. این مدل نتایج بسیار واقع‌گرایانه‌ای ایجاد می‌کند، اگرچه بافت‌ پوست خیلی قانع‌کننده نیست و ظاهری پلاستیکی‌ دارد اما برخی از کاربران از ترکیب Flux با Lora به نتایجی دست یافته‌اند که به‌شدت واقعی به‌نظر می‌رسند.

هوش مصنوعی مولد تصویر Flux

تصویر تولیدشده با Flux

هوش مصنوعی مولد تصویر Flux

نتیجه‌ی تولیدشده از ترکیب Flux با Lora

هوش مصنوعی مولد تصویر Flux

تصویر تولیدشده با Flux

هوش مصنوعی مولد تصویر Flux

نتیجه‌ی تولیدشده از ترکیب Flux با Lora

واقع‌گرایی خیره‌کننده‌ی تصاویر بالا باعث شده است که آن‌ها با سرعت زیادی در اینترنت دست به دست شوند و مورد توجه قرار بگیرند. بسیاری از مردم نمی‌دانند که دسترسی به این سطح از واقع‌گرایی در تولید تصاویر AI به‌جز ایجاد کمی سرگرمی برای علاقه‌مندان به یادگیری ماشین چه مزایای دیگری می‌تواند داشته باشد. در حال حاضر بسیاری از مشاغل و برندهای کوچک‌ از تصاویر هوش مصنوعی برای ارائه در رسانه‌های اجتماعی استفاده می‌کنند. توانایی ایجاد تصاویر واقعی از افراد غیرواقعی می‌تواند بازی را برای عکاسی و تبلیغات استوک تغییر دهد. با تصاویر واقع‌گرایانه‌ای که Flux اکنون تولید می‌کند و به‌زودی پیشرفت بیشتری نیز خواهد داشت، خطر استفاده از تصاویر هوش مصنوعی برای ارتکاب به کلاهبرداری یا ایجاد اخبار جعلی از همیشه جدی‌تر خواهد شد.

۲۲۷۲۲۷

بدون دیدگاه

دیدگاهتان را بنویسید