پدیده‌ای نوظهور به نام انتقال وارونه

کمیته رکن چهارم – آزمایشگاه تحقیقاتی نیروی زمینی ایالات متحده، موفق به تقویت حافظه سیستم‌های هوش مصنوعی با الگوریتمی خاص شده اند.

محققان دانشگاه ایالتی کارولینای شمالی – که سرمایه آن را نیروی زمینی تأمین کرده است – به این نتیجه رسیده‌اند که استفاده از چارچوبی برای یادگیری یک کار جدید می‌تواند به بهبود هوش مصنوعی در انجام وظایف قبلی کمک کند و این پدیده «انتقال وارونه» نام دارد.
مری آن فیلدز (Mary Anne Fields)، مدیر برنامه سیستم‌های هوشمند در دفتر تحقیقاتی نیروی زمینی – یکی از عناصر آزمایشگاه تحقیقاتی فرماندهی توسعه توانایی‌های رزمی نیروی زمینی ایالات‌متحده گفت:

برای اینکه نیروی زمینی بتواند برای مبارزه در هر مکانی در جهان آماده باشد، سیستم‌های اطلاعاتی آن باید آماده شوند. ما انتظار داریم که این سیستم‌ها به‌طور مداوم مهارت‌های جدیدی را برای انجام مأموریت‌هایی در میدان‌های نبرد در سراسر جهان بدون فراموش کردن مهارت‌های آموزش‌دیده به‌دست آورند. به عنوان مثال، هنگام اجرای یک عملیات شهری یک ربات چرخ‌دار شاید پارامترهای هوانوردی جدیدی را برای شهرهای متراکم یاد بگیرد، اما هنوز هم باید برای محیطی مانند جنگل کارآمد باشد.

تیم تحقیقاتی، یک چارچوب جدید به نام «یادگیری برای رشد» به منظور یادگیری مداوم پیشنهاد داده است که یادگیری ساختار شبکه و پارامتر مدل را تفکیک می‌کند. در یک آزمایش، رویکردهای قبلی در مورد یادگیری مداوم بهتر اجرا می‌شوند.

شیلای لی (Xilai Li)، یکی از نویسندگان اصلی مقاله و دانشجوی دکترا در دانشگاه ایالتی کارولینای شمالی اعلام کرد:

سیستم‌های هوش مصنوعی شبکه عصبی عمیق برای یادگیری کارهای محدود طراحی‌شده‌اند. در نتیجه، هنگام یادگیری وظایف جدید سیستم‌ها می‌توانند کارهای قدیمی را فراموش کنند و به این کار فراموشی فاجعه‌آمیز می‌گویند. سیستم‌ها می‌توانند وظایف قدیمی را به جای جایگزینی کارهای جدید، اصلاح کنند و با محدود کردن پیشرفت‌ها منجر به یک سیستم هوش مصنوعی می‌شود که برای کارآمد بودن خیلی زیاد است. یادگیری مداوم – با نام دیگر یادگیری مداوم – تلاش برای حل این مسئله است.

کارشناسان معتقدند که برای درک چارچوب یادگیری برای رشد، باید به شبکه‌های عصبی عمیق به عنوان یک لوله پر از لایه‌های مختلف فکر کرد. داده‌های خام، بالای لوله قرار می‌گیرند و خروجی کار پایین می‌آید. هر لایه در لوله، شامل محاسباتی است که داده را به منظور کمک به انجام کارهای شبکه مانند شناسایی اهداف در یک تصویر دیجیتال دست‌کاری می‌کند. روش‌های مختلفی برای تنظیم لایه‌ها در لوله مطابق با معماری مختلف شبکه وجود دارند.

هنگام درخواست یک شبکه عصبی عمیق برای یادگیری یک کار جدید، چارچوب یادگیری برای رشد با اجرای چیزی به نام بهینه‌سازی واضح معماری عصبی از طریق جستجو آغاز می‎‌شود. این بدان معنا است که با ورود شبکه به هر لایه در سیستم خودش، توانایی تصمیم‌گیری برای انجام یکی از این ۴ مورد را دارد:

فرار از لایه
استفاده از لایه در همان مسیری که کارهای قبلی انجام می‌شدند
چسباندن یک آداپتور سبک‌وزن به لایه برای ایجاد تغییر و اصلاح
ایجاد یک لایه کاملاً جدید

این بهینه‌سازی معماری به‌‎طور مؤثر بهترین توپولوژی یا مجموعه‌ای از لایه‌های مورد نیاز برای انجام کار جدید را تعیین می‌کند. با تکمیل کار، شبکه از توپولوژی جدید برای آموزش نحوه انجام کار درست مثل هر سیستم هوش مصنوعی یادگیری عمیق استفاده می‌کند.

لی اظهار داشت:

ما آزمایش‌هایی را با استفاده از چندین مجموعه داده انجام دادیم و فهمیدیم که هرچه کار جدید به موارد قبلی شباهت بیشتری داشته باشد، همپوشانی بیشتری برحسب لایه‌های موجود برای انجام کار جدید وجود خواهد داشت. نکته جالب توجه این است که با بهینه‌سازی – یا توپولوژی یادگیری – شبکه آموزش دیده برای انجام کارهای جدید، موارد موردنیاز برای انجام کارهای قبلی – حتی اگر کارهای قبلی مشابه نباشند – را بسیار اندک فراموش می‌کند.

محققان همچنین آزمایش‌هایی را در مقایسه با توانایی چارچوب یادگیری برای رشد به منظور یادگیری کارهای جدید به چندین روش یادگیری مداوم انجام دادند و دریافتند که چارچوب یادگیری برای رشد هنگام تکمیل وظایف جدید عملکرد و دقت بهتری داشته است.

کارشناسان برای بررسی میزان فراموشی هر شبکه هنگام یادگیری کارهای جدید، دقت هر سیستم را در انجام وظایف قبلی آزمایش کردند و چارچوب یادگیری برای رشد دوباره شبکه‌های دیگر را بهبود بخشید.

کیمینگ شیانگ (Caiming Xiong)، مدیر تحقیقات «Salesforce Research» و یکی از نویسندگان کار توضیح داد:

در برخی موارد چارچوب یادگیری برای رشد در انجام وظایف قبلی عملکرد بهتری دارد. این کار انتقال وارونه نام دارد و هنگامی رخ می‌دهد که شما می‌فهمید که یادگیری وظایف جدید به شما در انجام کارهای قبلی بهتر کمک می‌کند. ما این مورد را – نه همیشه با هوش مصنوعی – در مردم همیشه مشاهده می‌کنیم.

مدیر برنامه سیستم‌های هوشمند در دفتر تحقیقاتی نیروی زمینی آمریکا نیز گفت:

سرمایه‌گذاری نیروی زمینی وضعیت فعلی تکنیک‌های یادگیری ماشینی را گسترش می‌دهد و محققان آزمایشگاه تحقیقاتی نیروی زمینی ما را برای توسعه برنامه‌های رباتیک مانند مانور هوشمند و یادگیری برای شناسایی اهداف جدید هدایت خواهد کرد. این تحقیقات، هوش مصنوعی را یک قدم به تأمین سیستم‌های مؤثر بدون سرنشین برای جنگجویان و استفاده در میدان نبرد نزدیک‌تر می‌کند.

مقاله «یادگیری برای رشد: یک چارچوب یادگیری ساختار مداوم برای غلبه بر فراموشی فاجعه‌آمیز» در سی و ششمین کنفرانس بین‌المللی یادگیری ماشینی در ماه ژوئن ۲۰۱۹ در کالیفرنیا ارائه شد. نویسندگان اصلی این مقاله، تیانفو وو (Tianfu Wu)، استادیار مهندسی کامپیوتر و برق در دانشگاه ایالتی کارولینای شمالی، شیلای لی (Xilai Li)، دانشجوی دکترا در دانشگاه و یینگبو ژو (Yingbo Zhou)، یکی از اعضای «Salesforce Research» هستند. این مقاله، به‌وسیله ریچارد ساچر (Richard Socher) و کیمینگ شیانگ (Caiming Xiong)، مدیر تحقیقات «Salesforce Research» نوشته شده است.

این کار همچنین به‌وسیله بنیاد ملی علوم پشتیبانی شد. بخشی از کار در حالی انجام شد که لی یک کارمند تابستانی در تحقیقات هوش مصنوعی در Salesforce بود.

آزمایشگاه تحقیقاتی نیروی زمینی (ARL)، یکی از عناصر فرماندهی توسعه توانایی‌های رزمی نیروی زمینی ایالات‌متحده است. این آزمایشگاه تحقیقاتی، علم و فناوری را برای اطمینان از قدرت زمینی راهبردی حاکم کشف، ابداع و منتقل می‌کند. از طریق همکاری در با صلاحیت فنی هسته‌ای فرماندهی، فرماندهان قابلیت‌های فناوری مورد نیاز برای تأثیر بیشتر سربازان و پیروزی در جنگ‌های ملی و بازگشت امن به خانه کشف می‌کنند و توسعه می‌دهند. CCDC، زیرمجموعه بزرگی از فرماندهی آینده نیروی زمینی ایالات‌متحده محسوب می‌شود.

منبع : سایبربان