به گزارش سایت خبری پرسون، هوش مصنوعی اخیراً راه خود را به بسیاری از صنایع خلاق ، به عنوان مثال، در قالب ابزارهایی برای هنرمندان دیجیتال، معماران، طراحان داخلی و ویرایشگران تصویر باز کرده است. در این زمینهها، هوش مصنوعی میتواند فرآیندهای خستهکننده یا زمانبر را خودکار کند، در حالی که به طور بالقوه هنرمندان را الهام میبخشد و فرآیند خلاقیت آنها را تسهیل میکند. محققان اخیراً به بررسی پتانسیل مدلهای هوش مصنوعی در طراحی مد پرداختند. آنها چارچوب بینایی رایانهای جدیدی را معرفی کردند که میتواند به طراحان مد کمک کند تا طرحهای خود را تجسم کنند و به آنها نشان دهند که چگونه ممکن است در بدن انسان به نظر برسند.
اکثر مطالعات گذشته که به بررسی استفاده از هوش مصنوعی در صنعت مد میپردازند، بر ابزارهای محاسباتی متمرکز شدهاند که میتوانند لباسهایی مشابه لباسهایی که توسط کاربر انتخاب میشود یا مدلهایی که میتوانند به مشتریان آنلاین نشان دهند لباسها روی بدنشان چگونه به نظر میرسند را توصیه کنند (یعنی سیستمهای آزمایش مجازی) . از سوی دیگر، این تیم از محققان تصمیم گرفتند چارچوبی ایجاد کنند که بتواند از کار طراحان پشتیبانی کند و به آنها نشان دهد که لباس هایی که طراحی کرده اند در زندگی واقعی چگونه به نظر می رسند، تا بتوانند الهام جدیدی پیدا کنند، مسائل بالقوه را شناسایی کنند و در صورت نیاز طرح های آنها را تغییر دهند. برخلاف کارهای قبلی که عمدتاً بر روی آزمایش مجازی لباسها تمرکز داشتند، ما وظیفه ویرایش تصویر مد شرطی شده چندوجهی را پیشنهاد می کنیم، که با پیروی از دستورات چندوجهی، مانند متن، ژست های بدن انسان، تولید تصاویر مد محور انسان را هدایت می کند.
آنها با ارائه یک معماری جدید مبتنی بر مدلهای انتشار پنهان، رویکردی که قبلاً در حوزه مد استفاده نشده است، با این مشکل مقابله میکنند. به جای استفاده از شبکههای متخاصم مولد (GAN)، که از معماریهای شبکه عصبی مصنوعی اغلب برای تولید متون یا تصاویر جدید استفاده میشود، محققان تصمیم گرفتند چارچوبی بر اساس مدلهای انتشار پنهان یا LDM ایجاد کنند. از آنجایی که LDM ها در یک فضای پنهان فشرده و با ابعاد کمتر آموزش می بینند، می توانند تصاویر مصنوعی با کیفیت بالا ایجاد کنند.ئدر حالی که این مدلهای امیدوارکننده برای بسیاری از کارهایی که نیاز به تولید تصاویر یا ویدیوهای مصنوعی دارند، به ندرت در زمینه ویرایش تصویر مد استفاده شدهاند. اکثر کارهای قبلی در این زمینه معماری های مبتنی بر GAN را معرفی کردند که تصاویر با کیفیت پایین تری نسبت به LDM ها تولید می کنند.
اکثر مجموعه دادههای موجود برای آموزش مدلهای هوش مصنوعی در مورد وظایف طراحی مد، فقط شامل تصاویر با وضوح پایین لباس میشوند و اطلاعات لازم برای ایجاد تصاویر مد بر اساس اعلانهای متنی و طرحها را شامل نمیشوند. برای آموزش مؤثر مدل خود، این محققان مجبور شدند ابتدا این مجموعه داده های موجود را به روز کنند یا مجموعه های جدیدی ایجاد کنند.با توجه به فقدان مجموعه دادههای موجود مناسب برای این کار، آنها همچنین دو مجموعه داده مد موجود، یعنی Dress Code و VITON-HD را با حاشیهنویسیهای چندوجهی جمعآوریشده به صورت نیمه خودکار گسترش میدهند. نتایج تجربی روی این مجموعه دادههای جدید، اثربخشی پیشنهاد آنها را هم از نظر واقعگرایی و هم از نظر انسجام با ورودیهای چندوجهی نشان میدهد. در ارزیابی های اولیه، مدل ایجاد شده توسط این تیم از محققان به نتایج بسیار امیدوارکننده ای دست یافت و تصاویر واقعی از لباس ها را بر روی بدن انسان با الهام از طرح های انسانی و متن های خاص ایجاد کرد. کد منبع مدل آنها و حاشیه نویسی های چندوجهی که آنها به مجموعه داده ها اضافه کرده اند به زودی در منتشر می شود.
در آینده، این مدل جدید می تواند در ابزارهای نرم افزاری موجود یا جدید برای طراحان مد ادغام شود. همچنین میتواند توسعه معماریهای هوش مصنوعی دیگر مبتنی بر LDMها را برای برنامههای خلاقانه در دنیای واقعی نشان دهد. این یکی از اولین تلاشهای موفقیتآمیز برای تقلید از شغل طراحان در فرآیند خلاقانه طراحی مد است و میتواند نقطه شروعی برای پذیرش مویرگی مدلهای انتشار در صنایع خلاق، نظارت بر ورودیهای انسانی باشد.