کمیته رکن چهارم – آزمایشگاه تحقیقاتی نیروی زمینی ایالات متحده، موفق به تقویت حافظه سیستمهای هوش مصنوعی با الگوریتمی خاص شده اند.
محققان دانشگاه ایالتی کارولینای شمالی – که سرمایه آن را نیروی زمینی تأمین کرده است – به این نتیجه رسیدهاند که استفاده از چارچوبی برای یادگیری یک کار جدید میتواند به بهبود هوش مصنوعی در انجام وظایف قبلی کمک کند و این پدیده «انتقال وارونه» نام دارد.
مری آن فیلدز (Mary Anne Fields)، مدیر برنامه سیستمهای هوشمند در دفتر تحقیقاتی نیروی زمینی – یکی از عناصر آزمایشگاه تحقیقاتی فرماندهی توسعه تواناییهای رزمی نیروی زمینی ایالاتمتحده گفت:
برای اینکه نیروی زمینی بتواند برای مبارزه در هر مکانی در جهان آماده باشد، سیستمهای اطلاعاتی آن باید آماده شوند. ما انتظار داریم که این سیستمها بهطور مداوم مهارتهای جدیدی را برای انجام مأموریتهایی در میدانهای نبرد در سراسر جهان بدون فراموش کردن مهارتهای آموزشدیده بهدست آورند. به عنوان مثال، هنگام اجرای یک عملیات شهری یک ربات چرخدار شاید پارامترهای هوانوردی جدیدی را برای شهرهای متراکم یاد بگیرد، اما هنوز هم باید برای محیطی مانند جنگل کارآمد باشد.
تیم تحقیقاتی، یک چارچوب جدید به نام «یادگیری برای رشد» به منظور یادگیری مداوم پیشنهاد داده است که یادگیری ساختار شبکه و پارامتر مدل را تفکیک میکند. در یک آزمایش، رویکردهای قبلی در مورد یادگیری مداوم بهتر اجرا میشوند.
شیلای لی (Xilai Li)، یکی از نویسندگان اصلی مقاله و دانشجوی دکترا در دانشگاه ایالتی کارولینای شمالی اعلام کرد:
سیستمهای هوش مصنوعی شبکه عصبی عمیق برای یادگیری کارهای محدود طراحیشدهاند. در نتیجه، هنگام یادگیری وظایف جدید سیستمها میتوانند کارهای قدیمی را فراموش کنند و به این کار فراموشی فاجعهآمیز میگویند. سیستمها میتوانند وظایف قدیمی را به جای جایگزینی کارهای جدید، اصلاح کنند و با محدود کردن پیشرفتها منجر به یک سیستم هوش مصنوعی میشود که برای کارآمد بودن خیلی زیاد است. یادگیری مداوم – با نام دیگر یادگیری مداوم – تلاش برای حل این مسئله است.
کارشناسان معتقدند که برای درک چارچوب یادگیری برای رشد، باید به شبکههای عصبی عمیق به عنوان یک لوله پر از لایههای مختلف فکر کرد. دادههای خام، بالای لوله قرار میگیرند و خروجی کار پایین میآید. هر لایه در لوله، شامل محاسباتی است که داده را به منظور کمک به انجام کارهای شبکه مانند شناسایی اهداف در یک تصویر دیجیتال دستکاری میکند. روشهای مختلفی برای تنظیم لایهها در لوله مطابق با معماری مختلف شبکه وجود دارند.
هنگام درخواست یک شبکه عصبی عمیق برای یادگیری یک کار جدید، چارچوب یادگیری برای رشد با اجرای چیزی به نام بهینهسازی واضح معماری عصبی از طریق جستجو آغاز میشود. این بدان معنا است که با ورود شبکه به هر لایه در سیستم خودش، توانایی تصمیمگیری برای انجام یکی از این ۴ مورد را دارد:
- فرار از لایه
- استفاده از لایه در همان مسیری که کارهای قبلی انجام میشدند
- چسباندن یک آداپتور سبکوزن به لایه برای ایجاد تغییر و اصلاح
- ایجاد یک لایه کاملاً جدید
این بهینهسازی معماری بهطور مؤثر بهترین توپولوژی یا مجموعهای از لایههای مورد نیاز برای انجام کار جدید را تعیین میکند. با تکمیل کار، شبکه از توپولوژی جدید برای آموزش نحوه انجام کار درست مثل هر سیستم هوش مصنوعی یادگیری عمیق استفاده میکند.
لی اظهار داشت:
ما آزمایشهایی را با استفاده از چندین مجموعه داده انجام دادیم و فهمیدیم که هرچه کار جدید به موارد قبلی شباهت بیشتری داشته باشد، همپوشانی بیشتری برحسب لایههای موجود برای انجام کار جدید وجود خواهد داشت. نکته جالب توجه این است که با بهینهسازی – یا توپولوژی یادگیری – شبکه آموزش دیده برای انجام کارهای جدید، موارد موردنیاز برای انجام کارهای قبلی – حتی اگر کارهای قبلی مشابه نباشند – را بسیار اندک فراموش میکند.
محققان همچنین آزمایشهایی را در مقایسه با توانایی چارچوب یادگیری برای رشد به منظور یادگیری کارهای جدید به چندین روش یادگیری مداوم انجام دادند و دریافتند که چارچوب یادگیری برای رشد هنگام تکمیل وظایف جدید عملکرد و دقت بهتری داشته است.
کارشناسان برای بررسی میزان فراموشی هر شبکه هنگام یادگیری کارهای جدید، دقت هر سیستم را در انجام وظایف قبلی آزمایش کردند و چارچوب یادگیری برای رشد دوباره شبکههای دیگر را بهبود بخشید.
کیمینگ شیانگ (Caiming Xiong)، مدیر تحقیقات «Salesforce Research» و یکی از نویسندگان کار توضیح داد:
در برخی موارد چارچوب یادگیری برای رشد در انجام وظایف قبلی عملکرد بهتری دارد. این کار انتقال وارونه نام دارد و هنگامی رخ میدهد که شما میفهمید که یادگیری وظایف جدید به شما در انجام کارهای قبلی بهتر کمک میکند. ما این مورد را – نه همیشه با هوش مصنوعی – در مردم همیشه مشاهده میکنیم.
مدیر برنامه سیستمهای هوشمند در دفتر تحقیقاتی نیروی زمینی آمریکا نیز گفت:
سرمایهگذاری نیروی زمینی وضعیت فعلی تکنیکهای یادگیری ماشینی را گسترش میدهد و محققان آزمایشگاه تحقیقاتی نیروی زمینی ما را برای توسعه برنامههای رباتیک مانند مانور هوشمند و یادگیری برای شناسایی اهداف جدید هدایت خواهد کرد. این تحقیقات، هوش مصنوعی را یک قدم به تأمین سیستمهای مؤثر بدون سرنشین برای جنگجویان و استفاده در میدان نبرد نزدیکتر میکند.
مقاله «یادگیری برای رشد: یک چارچوب یادگیری ساختار مداوم برای غلبه بر فراموشی فاجعهآمیز» در سی و ششمین کنفرانس بینالمللی یادگیری ماشینی در ماه ژوئن ۲۰۱۹ در کالیفرنیا ارائه شد. نویسندگان اصلی این مقاله، تیانفو وو (Tianfu Wu)، استادیار مهندسی کامپیوتر و برق در دانشگاه ایالتی کارولینای شمالی، شیلای لی (Xilai Li)، دانشجوی دکترا در دانشگاه و یینگبو ژو (Yingbo Zhou)، یکی از اعضای «Salesforce Research» هستند. این مقاله، بهوسیله ریچارد ساچر (Richard Socher) و کیمینگ شیانگ (Caiming Xiong)، مدیر تحقیقات «Salesforce Research» نوشته شده است.
این کار همچنین بهوسیله بنیاد ملی علوم پشتیبانی شد. بخشی از کار در حالی انجام شد که لی یک کارمند تابستانی در تحقیقات هوش مصنوعی در Salesforce بود.
آزمایشگاه تحقیقاتی نیروی زمینی (ARL)، یکی از عناصر فرماندهی توسعه تواناییهای رزمی نیروی زمینی ایالاتمتحده است. این آزمایشگاه تحقیقاتی، علم و فناوری را برای اطمینان از قدرت زمینی راهبردی حاکم کشف، ابداع و منتقل میکند. از طریق همکاری در با صلاحیت فنی هستهای فرماندهی، فرماندهان قابلیتهای فناوری مورد نیاز برای تأثیر بیشتر سربازان و پیروزی در جنگهای ملی و بازگشت امن به خانه کشف میکنند و توسعه میدهند. CCDC، زیرمجموعه بزرگی از فرماندهی آینده نیروی زمینی ایالاتمتحده محسوب میشود.
منبع : سایبربان