یادگیری عمیق، ساخت سطوح سه بعدی از تصاویر دو بعدی به وسیله شبکه‌های عمیق


یادگیری عمیق، ساخت سطوح سه بعدی از تصاویر دو بعدی به وسیله شبکه‌های عمیق

آیان سینها از دانشگاه MIT، روشی جدیدی در هوش مصنوعی با استفاده از یادگیری عمیق ارائه داده است که می تواند از تصاویر دوبعدی اشکال، مدل سه بعدی آن را استخراج کند. این روش می تواند تکمیل کننده فناوری های واقعیت مجازی و چاپگرهای سه بعدی باشد.


اشکال سه بعدی معمولا از اتصال نقاط و تولید صفحه چندضلعی ساخته می‌شود. کیمینگ هی و همکارانش روشی جدیدی (Deep Residual Learning for Image Recognition) به منظور شناسایی تصویر توسط شبکه‌های عصبی کانولوشن ارائه دادند. آیان سینها از دانشگاه MIT به کمک روش ارائه شده کیمینگ هی، روشی جدید تحت عنوان SurfNet به منظور تولید سطوح سه بعدی از تصاویر دوبعدی ارائه کرد. دو مدل اشکال در این روش در نظر گرفته شده است: 1- مدلی از اشکال که سطوح نرمی دارند (مانند دست)، 2- مدلی از اشکالی که سطوح سختی دارند (مانند هواپیما و خودرو).

1- مدل سازی اشکال با سطوح نرم به کمک شبکه‌های کانولوشن

برای این مدل از کینماتیک دست با 18 درجه آزادی استفاده شده است که 18 پارامتر زاویه برای انگشتان و مچ در نظر گرفته شد و از هر 18 پارامتر زاویه، یک نقشه عمق تهیه شد. در واقع این 18 پارامتر زوایای مفاصل هستند (15 زاویه مفصل انگشتان و سه زاویه حرکتی مچ)  که نقشه تهیه شده با توجه به محدودیت‌های پیکربندی دست است. تمام مدلهای Mesh از دست، شامل 1065 نقطه (رأس) و 2126 صفحه هستند و نقاط همان ساختار اتصال در تمام مدلهای Mesh  را دارد. دیتاست، محدوده وسیعی از مفصل های دست با نقاط مختلف از 3 زاویه چرخش مچ دست را پوشش می دهد. در مدل اشکال با سطوح نرم برای دست، دیتاستی از 200 هزار فایل مدل Mesh با 18 پارامتر درجه آزادی تولید شده است که همه ی آنها دارای 1065 مختصات رأس مرتبط با نقشه عمق دارند. تمام تصاویر عمیق نرمالایز، برش و تغییر اندازه شدند به طوری که پیکسل با کمترین عمق بیشترین Intensity یعنی 255 را داشته باشد. شکل زیر نتایج سطوح سه بعدی تشکلیل شده از تصاویر هندسی به کمک شبکه عصبی کانولوشن ارائه شده در اشکال با سطوح نرم را نشان می دهد.

2- مدل سازی اشکال با سطوح سخت به کمک شبکه های کانولوشن

برای مدل اشکال با سطوح سخت، دیتاست مدلهای Mesh از هواپیما و خودرو از دیتابیس ShapeNet ساخته شده است. برای روش پارامتریک کروی دو محدودیت وجود دارد: 1- Surface mesh باید از ویژگی های اویلر پیروی کند که همه مدلهای موجود در دیتابیس ShabeNet از این ویژگیها تبعیت نمی کند. به این منظور، تمام مدلهای Mesh با رزولیشن 128 در 128 در 128 واکسولایز شدند، سپس a-shape با a-radius به اندازه جذر 3 ساخته شد. این a-radius سوراخ های و لبه های تیز مشتق شده از مدل Mesh واکسولایز شده را، حفظ می کند. با انجام این فرآیند ها، مدلهای Mesh از ویژگی های اویلر تبعیت خواهند کرد و به عنوان یک مرحله پیش پردازش باید انجام شود. 2-Surface باید genus-0 باشد. به این منظور تمام مدلهای Mesh که تقسیم شده از a-shape و genus غیر ازصفر بودند حذف شدند و مدلها با استفاده هموار کنند لاپلاسین هموار شدند.شکل پایین مدل سازی اشکال با سطوح سخت از یک تصویر سه رنگ نشان می دهد. شکل چپ نتایج بدست آمده از یک دیتاست آزمایشی برای تولید مدل Mesh  خودرو و هواپیما را نشان می دهد. ردیف اول، تصویر عمیق و ردیف دوم مدل صحیح و ردیف سوم نتایج مدلسازی از دو گروه است. اشکال وسط و اشکال سمت راست نتایج بدست روش SurfNet با دیتا PASCAL 3D+ ماشین و هواپیما را نشان می دهد.

دانلود مقاله


یادگیری عمیق، ساخت سطوح سه بعدی از تصاویر دو بعدی به وسیله شبکه‌های عمیق
4.3/3
4.3
39
5
1

برای استفاده از تمامی امکانات وارد شوید

ارسال دیدگاه

دیدگاه ها