۱۴۰۴ شنبه ۱۵ آذر

ربات‌ها بهترین دربازکن‌های دنیا

ICTPRESS - سامانه تازه انویدیا ربات Unitree G۱ را به جایی رسانده که انواع در‌ها را سریع‌تر و هوشمندتر از انسان‌ها باز می‌کند؛ آن هم بدون هیچ حسگر ویژه‌ای و فقط با آموزشی که در دنیای شبیه‌سازی انجام شده است.

 

به گزارش شبکه خبری ICTPRESS به نقل از  interesting engineering، ربات Unitree G۱ با سیستم تازه توسعه‌یافته انویدیا در اجرای وظایف باز کردن انواع در‌ها عملکردی بهتر و سریع‌تر از اپراتور‌های انسانی ثبت کرد.

 پژوهشگران انویدیا از یک سامانه تازه یادگیری رباتیک با نام DoorMan رونمایی کرده‌اند؛ سیستمی که یک ربات انسان‌نما را قادر می‌سازد در‌های مختلف را سریع‌تر و مؤثرتر از اپراتور‌های انسانی باز کند. این سامانه روی ربات Unitree G۱ به ارزش ۱۶ هزار دلار آزمایش شده و تنها با اتکا به دوربین‌های RGB داخلی و یک سیاست یادگیری تقویتی آموزش‌دیده در شبیه‌سازی کار می‌کند. به گفته محققان این رویکرد موجب شده ربات بتواند در محیط واقعی، طیف گسترده‌ای از در‌ها را با سرعت و موفقیت بیشتری نسبت به انسان‌ها باز کند.

بر اساس نتایج آزمایش‌های میدانی DoorMan توانست تا ۳۱ درصد سریع‌تر از اپراتور‌های انسانی وظیفه باز کردن در را انجام دهد و نرخ موفقیت بالاتری نیز به دست بیاورد. پژوهشگران این دستاورد را گامی مهم در پیشبرد حوزه لکو منیپولیشن می‌دانند؛ حوزه‌ای که نیازمند هماهنگی هم‌زمان راه‌رفتن، درک محیط، کنترل اندام‌ها و انجام کار‌های دقیق است.

آموزش کامل در شبیه‌سازی از پیکسل تا عمل
سامانه DoorMan از یک روش آموزشی جدید بهره می‌برد که به طور کامل در محیط شبیه‌سازی‌شده Isaac Lab انویدیا انجام شده است. ربات هنگام کار فقط داده‌های تصویری خام (RGB) را می‌بیند و برخلاف بسیاری از ربات‌های انسان‌نمای کنونی به حسگر‌های عمق یا نشانگر‌های حرکتی وابسته نیست؛ ابزار‌هایی که در شرایط واقعی اغلب دچار خطا می‌شوند.

برای مقابله با چالش‌های رایج یادگیری تقویتی در وظایف فیزیکی، تیم تحقیق دو مشکل اصلی را هدف قرار داده است:

• چالش اکتشاف:

ربات معمولا در مراحل اولیه دائما شکست می‌خورد و ممکن است هرگز مسیر صحیح را پیدا نکند. برای حل این مشکل، پژوهشگران از مکانیزمی به نام بازتنظیم مرحله‌ای استفاده کردند؛ یعنی هرگاه ربات در شبیه‌سازی موفق به گرفتن دستگیره شد، آن وضعیت ذخیره شد و مراحل بعدی آموزش از همان نقطه آغاز گردید. این کار اجازه داد ربات بدون تکرار بیش‌ازحد مراحل اولیه بخش‌های پیچیده‌تر باز کردن و عبور از در را تمرین کند.

• چالش خروج دستگیره از میدان دید:

هنگامی که ربات به در نزدیک می‌شود، احتمال دارد دستگیره از قاب دوربین خارج شود. برای رفع این مشکل از روش Group Relative Policy Optimization بهره گرفته شد؛ روشی که باعث می‌شود سیاست یادگرفته‌شده طوری تنظیم شود که ویژگی‌های مهم همیشه در دید باقی بمانند. در نتیجه ربات یاد گرفت در صورت لزوم کمی عقب‌تر بایستد یا زاویه سر خود را اصلاح کند.

رباتی که وارد جهانی پر از در شد
ربات انسان‌نمای Unitree G۱ به‌سرعت به پلتفرمی متداول در پژوهش‌های رباتیک تبدیل شده و در پروژه‌های مختلفی از جمله در آمازون، دانشگاه کالیفرنیا سن‌دیگو و دانشگاه پوردو استفاده می‌شود. این فراگیری باعث می‌شود مقایسه نتایج پژوهش‌ها روی سخت‌افزار یکسان آسان‌تر باشد.

در این پژوهش عملکرد DoorMan مستقیما با اپراتور‌های انسانی که همین ربات را با سیستم‌های واقعیت مجازی کنترل می‌کردند مقایسه شد. گزارش شده که انسان‌ها اغلب قادر نبودند نیرو‌های لولا را به‌درستی از طریق ورودی‌های VR تشخیص دهند و گاهی بیش از حد می‌کشیدند یا تعادل خود را از دست می‌دادند.

در مقابل سیستم خودکار طی آموزش در شبیه‌سازی با میلیون‌ها در با ویژگی‌های متفاوت روبه‌رو شد؛ از سختی و میرایی لولا گرفته تا ابعاد، شکل دستگیره و حتی بافت سطح. این داده‌های گسترده به ربات سبک تعامل سازگارتر و متعادلتری بخشید.

نتایج نشان می‌دهد سامانه خودکار به ۸۳ درصد موفقیت دست یافت؛ در حالی که این رقم برای اپراتور‌های خبره ۸۰ درصد و برای افراد غیرمتخصص ۶۰ درصد بود.

شبیه‌سازی به‌جای داده‌های انسانی
نویسندگان مطالعه اعلام کرده‌اند این پروژه نمونه‌ای از یادگیری رباتیک مبتنی بر شبیه‌سازی است که بر مقیاس‌پذیری تکیه دارد نه داده‌های نمایشی انسان‌ها. به گفته آنها DoorMan نخستین سیاست کنترل انسان‌نمایی است که تنها با تکیه بر داده‌های RGB به‌طور کامل در شبیه‌سازی آموزش دیده و بدون نیاز به تنظیمات اضافی فورا روی ربات واقعی اجرا شده است.

نظرات : 0

ثبت نظر

13382