استفاده هوش مصنوعی از طرح‌های انسانی برای تصاویر مد

هوش مصنوعی اخیراً در قالب ابزارهایی برای هنرمندان دیجیتال، معماران، طراحان داخلی و ویرایشگران تصویر راه خود را باز کرده است.
تصویر استفاده هوش مصنوعی از طرح‌های انسانی برای تصاویر مد

به گزارش سایت خبری پرسون، هوش مصنوعی اخیراً راه خود را به بسیاری از صنایع خلاق ، به عنوان مثال، در قالب ابزارهایی برای هنرمندان دیجیتال، معماران، طراحان داخلی و ویرایشگران تصویر باز کرده است. در این زمینه‌ها، هوش مصنوعی می‌تواند فرآیندهای خسته‌کننده یا زمان‌بر را خودکار کند، در حالی که به طور بالقوه هنرمندان را الهام می‌بخشد و فرآیند خلاقیت آنها را تسهیل می‌کند. محققان اخیراً به بررسی پتانسیل مدل‌های هوش مصنوعی در طراحی مد پرداختند. آنها چارچوب بینایی رایانه‌ای جدیدی را معرفی کردند که می‌تواند به طراحان مد کمک کند تا طرح‌های خود را تجسم کنند و به آن‌ها نشان دهند که چگونه ممکن است در بدن انسان به نظر برسند.

اکثر مطالعات گذشته که به بررسی استفاده از هوش مصنوعی در صنعت مد می‌پردازند، بر ابزارهای محاسباتی متمرکز شده‌اند که می‌توانند لباس‌هایی مشابه لباس‌هایی که توسط کاربر انتخاب می‌شود یا مدل‌هایی که می‌توانند به مشتریان آنلاین نشان دهند لباس‌ها روی بدنشان چگونه به نظر می‌رسند را توصیه کنند (یعنی سیستم‌های آزمایش مجازی) . از سوی دیگر، این تیم از محققان تصمیم گرفتند چارچوبی ایجاد کنند که بتواند از کار طراحان پشتیبانی کند و به آنها نشان دهد که لباس هایی که طراحی کرده اند در زندگی واقعی چگونه به نظر می رسند، تا بتوانند الهام جدیدی پیدا کنند، مسائل بالقوه را شناسایی کنند و در صورت نیاز طرح های آنها را تغییر دهند. برخلاف کارهای قبلی که عمدتاً بر روی آزمایش مجازی لباس‌ها تمرکز داشتند، ما وظیفه ویرایش تصویر مد شرطی شده چندوجهی را پیشنهاد می کنیم، که با پیروی از دستورات چندوجهی، مانند متن، ژست های بدن انسان، تولید تصاویر مد محور انسان را هدایت می کند.

آنها با ارائه یک معماری جدید مبتنی بر مدل‌های انتشار پنهان، رویکردی که قبلاً در حوزه مد استفاده نشده است، با این مشکل مقابله می‌کنند. به جای استفاده از شبکه‌های متخاصم مولد (GAN)، که از معماری‌های شبکه عصبی مصنوعی اغلب برای تولید متون یا تصاویر جدید استفاده می‌شود، محققان تصمیم گرفتند چارچوبی بر اساس مدل‌های انتشار پنهان یا LDM ایجاد کنند. از آنجایی که LDM ها در یک فضای پنهان فشرده و با ابعاد کمتر آموزش می بینند، می توانند تصاویر مصنوعی با کیفیت بالا ایجاد کنند.ئدر حالی که این مدل‌های امیدوارکننده برای بسیاری از کارهایی که نیاز به تولید تصاویر یا ویدیوهای مصنوعی دارند، به ندرت در زمینه ویرایش تصویر مد استفاده شده‌اند. اکثر کارهای قبلی در این زمینه معماری های مبتنی بر GAN را معرفی کردند که تصاویر با کیفیت پایین تری نسبت به LDM ها تولید می کنند.

اکثر مجموعه داده‌های موجود برای آموزش مدل‌های هوش مصنوعی در مورد وظایف طراحی مد، فقط شامل تصاویر با وضوح پایین لباس می‌شوند و اطلاعات لازم برای ایجاد تصاویر مد بر اساس اعلان‌های متنی و طرح‌ها را شامل نمی‌شوند. برای آموزش مؤثر مدل خود، این محققان مجبور شدند ابتدا این مجموعه داده های موجود را به روز کنند یا مجموعه های جدیدی ایجاد کنند.با توجه به فقدان مجموعه داده‌های موجود مناسب برای این کار، آنها همچنین دو مجموعه داده مد موجود، یعنی Dress Code و VITON-HD را با حاشیه‌نویسی‌های چندوجهی جمع‌آوری‌شده به صورت نیمه خودکار گسترش می‌دهند. نتایج تجربی روی این مجموعه داده‌های جدید، اثربخشی پیشنهاد آنها را هم از نظر واقع‌گرایی و هم از نظر انسجام با ورودی‌های چندوجهی نشان می‌دهد. در ارزیابی های اولیه، مدل ایجاد شده توسط این تیم از محققان به نتایج بسیار امیدوارکننده ای دست یافت و تصاویر واقعی از لباس ها را بر روی بدن انسان با الهام از طرح های انسانی و متن های خاص ایجاد کرد. کد منبع مدل آنها و حاشیه نویسی های چندوجهی که آنها به مجموعه داده ها اضافه کرده اند به زودی در منتشر می شود.

در آینده، این مدل جدید می تواند در ابزارهای نرم افزاری موجود یا جدید برای طراحان مد ادغام شود. همچنین می‌تواند توسعه معماری‌های هوش مصنوعی دیگر مبتنی بر LDMها را برای برنامه‌های خلاقانه در دنیای واقعی نشان دهد. این یکی از اولین تلاش‌های موفقیت‌آمیز برای تقلید از شغل طراحان در فرآیند خلاقانه طراحی مد است و می‌تواند نقطه شروعی برای پذیرش مویرگی مدل‌های انتشار در صنایع خلاق، نظارت بر ورودی‌های انسانی باشد.

483712

سازمان آگهی های پرسون