کمیته رکن چهارم – دانشمندان هوش مصنوعی جدید را به طور انحصاری در وب تاریک آموزش میدهند.
مدلهای زبان بزرگ (LLM) شرکت OpenAI بر روی مجموعه وسیعی از دادهها آموزش دیدهاند و اطلاعات را از دورترین نقاط اینترنت استخراج میکنند، اما اگر قرار باشد چنین مدلی در وب تاریک به دنبال اطلاعات بگردد چه اتفاقی میافتد؟
تیمی از محققان کره جنوبی دقیقاً این کار را انجام دادند و یک مدل هوش مصنوعی به نام DarkBERT ایجاد کردند تا برخی از کلیترین دامنههای موجود در اینترنت را فهرست کند.
این یک نگاه اجمالی جذاب به برخی از تاریکترین نقاط وب جهانی است که مترادف با فعالیتهای غیرقانونی و مخرب از اشتراکگذاری دادههای درز گرفته تا فروش مواد مخدر شده است.
مثل یک کابوس به نظر میرسد، اما محققان میگویند DarkBERT جبنه استفاده مثبت دارد: تلاش برای روشن کردن راههای جدید مبارزه با جرایم سایبری، زمینهای که استفاده روزافزونی از پردازش زبان طبیعی داشته است.
شاید تعجب آور نباشد که فهمیدن قسمتهایی از وب که توسط موتورهای جستجو مانند گوگل شاخص نمیشوند و اغلب فقط از طریق نرمافزار خاصی قابل دسترسی هستند، کار آسانی نبود.
همانطور که در مقالهای با عنوان «DarkBERT: مدل زبانی برای سمت تاریک اینترنت» که هنوز مورد بررسی قرار نگرفته است، این تیم مدل خود را به شبکه Tor، سیستمی برای دسترسی به بخشهایی از وب تاریک متصل کرد. سپس شروع به کار کرد و یک پایگاه داده از دادههای خامی که پیدا کرد، ایجاد کرد.
این تیم میگوید مدل زبانی بزرگ جدید آنها نسبت به مدلهایی که برای انجام کارهای مشابه آموزش دیدهاند، از جمله RoBERTa که محققان فیسبوک در سال ۲۰۱۹ آن را طراحی کرده بودند، مفیدتر بوده است.
این تیم پیشنهاد میکند که DarkBERT میتواند برای انواع وظایف مرتبط با امنیت سایبری، مانند شناسایی سایتهایی که باجافزار میفروشند یا دادههای محرمانه را درز میکنند، استفاده شود. همچنین میتوان از آن برای گشتن در تالارهای وب تاریک بیشماری که روزانه بهروزرسانی میشوند استفاده کرد و آنها را برای هرگونه تبادل اطلاعات غیرقانونی نظارت کرد.
منبع: افتانا