آموزش داده‌های وب تاریک به هوش مصنوعی

اردیبهشت ۳۱, ۱۴۰۲ نوشتهٔ hraicp3 بدون نظر

کمیته رکن چهارم – دانشمندان هوش مصنوعی جدید را به طور انحصاری در وب تاریک آموزش می‌دهند.

مدل‌های زبان بزرگ (LLM) شرکت OpenAI بر روی مجموعه وسیعی از داده‌ها آموزش دیده‌اند و اطلاعات را از دورترین نقاط اینترنت استخراج می‌کنند، اما اگر قرار باشد چنین مدلی در وب تاریک به دنبال اطلاعات بگردد چه اتفاقی می‌افتد؟

تیمی از محققان کره جنوبی دقیقاً این کار را انجام دادند و یک مدل هوش مصنوعی به نام DarkBERT ایجاد کردند تا برخی از کلی‌ترین دامنه‌های موجود در اینترنت را فهرست کند.

این یک نگاه اجمالی جذاب به برخی از تاریک‌ترین نقاط وب جهانی است که مترادف با فعالیت‌های غیرقانونی و مخرب از اشتراک‌گذاری داده‌های درز گرفته تا فروش مواد مخدر شده است.

مثل یک کابوس به نظر می‌رسد، اما محققان می‌گویند DarkBERT جبنه استفاده مثبت دارد: تلاش برای روشن کردن راه‌های جدید مبارزه با جرایم سایبری، زمینه‌ای که استفاده روزافزونی از پردازش زبان طبیعی داشته است.

شاید تعجب آور نباشد که فهمیدن قسمت‌هایی از وب که توسط موتورهای جستجو مانند گوگل شاخص نمی‌شوند و اغلب فقط از طریق نرم‌افزار خاصی قابل دسترسی هستند، کار آسانی نبود.

همانطور که در مقاله‌ای با عنوان «DarkBERT: مدل زبانی برای سمت تاریک اینترنت» که هنوز مورد بررسی قرار نگرفته است، این تیم مدل خود را به شبکه Tor، سیستمی برای دسترسی به بخش‌هایی از وب تاریک متصل کرد. سپس شروع به کار کرد و یک پایگاه داده از داده‌های خامی که پیدا کرد، ایجاد کرد.

این تیم می‌گوید مدل زبانی بزرگ جدید آن‌ها نسبت به مدل‌هایی که برای انجام کارهای مشابه آموزش دیده‌اند، از جمله RoBERTa که محققان فیس‌بوک در سال ۲۰۱۹ آن را طراحی کرده بودند، مفیدتر بوده است.

این تیم پیشنهاد می‌کند که DarkBERT می‌تواند برای انواع وظایف مرتبط با امنیت سایبری، مانند شناسایی سایت‌هایی که باج‌افزار می‌فروشند یا داده‌های محرمانه را درز می‌کنند، استفاده شود. همچنین می‌توان از آن برای گشتن در تالارهای وب تاریک بی‌شماری که روزانه به‌روزرسانی می‌شوند استفاده کرد و آن‌ها را برای هرگونه تبادل اطلاعات غیرقانونی نظارت کرد.

منبع: افتانا