توسعه الگوریتم فیسبوک با چالش عکس ۱۰ سال قبل

کمیته رکن چهارم – شرکت فیس‌بوک احتمالاً برای آموزش الگوریتم‌های تشخیص چهره روی پیشروی سن و تشخیص آن، از تصاویر چالش عکس ۱۰ سال قبل استفاده می‌کند.

آیا شما هم در چالشی که با نام ۱۰YearsChallenge# شناخته می‌شود، شرکت کرده‌اید؟ بسیاری از کاربران تنها با هدف یادآوری خاطرات در این چالش شرکت می‌کنند و عکس فعلی و ۱۰ سال پیش خود را در کنار هم به اشتراک می‌گذارند؛ اما آیا شرکت‌های فناوری اهداف خاص دیگری را در پشت پرده‌ی این چالش دنبال می‌کنند؟

اگر شما هم از فعالان شبکه‌های اجتماعی باشید، احتمالاً این روزها در فیسبوک، اینستاگرام و توییتر با پست‌های متعدد افراد از عکس‌های پروفایل خود که ظاهر گذشته‌ی خود – معمولاً از ده سال پیش – را با وضعیت حاضر خود مقایسه می‌کنند، مواجه شده‌اید. اما پیش از پیوستن به این چالش فراگیر به این فکر کرده‌اید که اشتراک این عکس‌ها و چالش‌هایی مثل آن، می‌توانند از طرف مدیران شبکه‌های اجتماعی و برای مقاصد دیگری مثل بهبود الگوریتم‌های تشخیص چهره و تشخیص سن طراحی شده باشند؟

کیت اُنیل، سخنران و نویسنده‌ی فعال در زمینه‌ی تکنولوژی، از این جهت به موضوع نگاه کرده و در یک توییت وضعیت ۱۰ سال پیش خود را با شرایط حاضر خود به این شکل مقایسه کرده است:

من، ۱۰ سال پیش: احتمالاً در حال خاطره‌بازی با گذر سالیان زندگی‌ام در فیسبوک و اینستاگرام بودم.

من، حالا: به این موضوع می‌اندیشم که این داده‌ها، می‌توانند برای آموزش الگوریتم‌های تشخیص چهره روی پیشروی سن و تشخیص سن مورد استفاده قرار گیرند.

این مطلب به طور گسترده‌ای مورد توجه قرار گرفت و در بعضی موارد، واکنش‌های نسبتاً شدیدی نیز در قبال آن انجام گرفت. البته هدف او از این مطلب، ایجاد وحشت و نگرانی و بی‌اعتمادی نسبت به حرکات موجود در شبکه‌های اجتماعی نیست؛ اما به هر حال روند رو به رشد روش‌های نوین مثل همین الگوریتم‌های تشخیص چهره و استفاده از داده‌های ذخیره شده‌ی کاربران در شبکه‌های اجتماعی باعث می‌شود تفکر و حتی بعضی اوقات، شک در به اشتراک گذاشتن داده‌های شخصی در این شبکه‌ها، کار عاقلانه و مناسبی باشد.

در بین افرادی که ایده‌ی خانم اُنیل را به چالش می‌کشیدند، بسیاری از آن‌ها این استدلال را مطرح می‌کردند که این تصاویر، پیش از این چالش هم همه جا موجود بوده‌اند. بیشترین واکنش، شامل این جمله می‌شد:

این داده‌ها در حال حاضر هم در دسترس هستند. فیسبوک همین حالا هم تمامی تصاویر پروفایل‌ها را در اختیار خود دارد.

البته که همین طور است. در نسخه‌های مختلف این چالش، به افراد آموزش داده می‌شود که چطور اولین تصویر پروفایل خود یا یک تصویر از ۱۰ سال پیش را در کنار تصویر پروفایل حاضر خود منتشر کنند. بنابراین، بله، این تصاویر پروفایل همین حالا هم موجود هستند، روی همه‌ی آن‌ها یک برچسب زمانی خورده است، افراد زیادی این تصاویر را ذخیره کرده‌اند و برای بخش اعظم کاربران، این تصاویر به طور عمومی در دسترس هستند. اما بیایید قدری متفاوت به این داستان فکر کنیم.

تصور کنید که قصدِ ارائه‌ی داده‌ی یادگیری به یک الگوریتم تشخیص چهره روی جنبه‌های مرتبط با سن، و به طور خاص‌تر، روی افزایش سن داشته باشید؛ مثلاً این که ظاهر افراد با بالا رفتن سن چه تغییری می‌کند. در حالت ایده‌آل، نیاز به یک مجموعه داده‌ی بسیار وسیع از تصاویر افراد خواهید داشت. اگر این را هم بدانید که تصاویر در یک فاصله زمانی ثابت و مشخص، مثلاً ۱۰ ساله، گرفته شده‌اند، بهتر هم خواهد بود.

مسلماً می‌توانید برای به دست آوردن چنین مجموعه داده‌ای، به کند و کاو در تصاویر پروفایل‌ها در فیسبوک و نگاه کردن به زمان انتشار آن‌ها یا داده‌های متای تصویر بپردازید. اما این مجموعه‌ی بزرگ تصاویر پروفایل، می‌تواند حجم عظیمی از تصاویر غیرمفید و مزاحم را وارد مجموعه داده‌ی شما کند. هیچ تضمینی وجود ندارد که هر فرد، در انتشار تصاویر خود، ترتیب خاص و درست زمانی را رعایت کرده باشد. این موضوع هم به هیچ وجه عجیب نیست که افرادی، از تصاویر دیگری غیر از تصویر خودشان به عنوان تصویر پروفایل استفاده کنند. همین حالا به لیست دوستان خود در شبکه‌های اجتماعی نگاه کنید. تصاویر حیوانات خانگی، مناظر طبیعی، تصاویر کارتونی، جملات حکیمانه و بسیاری از تصاویر دیگری از این نوع هم وارد داده‌های آموزش الگوریتم شما خواهند شد.

به عبارت دیگر، اگر بتوانید یک مجموعه از تصاویر تمیز، ساده و برچسب‌گذاری شده با عباراتی مثل «ده سال پیش – امروز» جمع‌آوری کنید، چندین گام جلوتر خواهید بود.

توجه به مشکلات دیگری مثل اینکه در بسیاری از موارد، تاریخ انتشار یک عکس با تاریخ ثبت آن هم‌خوانی ندارد؛ یا اینکه ممکن است عکس بارگذاری شده، یک تصویر اسکن شده باشد و داده‌های EXIF آن نامعتبر باشد، یا برنامه‌های ادیت عکس که این داده‌های زمانی را از بین می‌برند و مواردی از این دست، کار را برای جمع‌آوری‌ این داده‌ها دشوارتر هم خواهد کرد.

در چالشی که از فیسبوک آغاز شده، کاربران با افزودن برچسب‌هایی مثل «من در ۲۰۰۸ و من در ۲۰۱۸» به علاوه اطلاعاتی مثل مکان و چگونگی ثبت تصویر از قبیل «۲۰۰۸ در فلان دانشگاه، گرفته شده توسط آقای ایکس؛ ۲۰۱۸ در نیویورک، امسال، مراسم فلان» به جمع‌آوری‌کننده‌ی داده‌ها کمک می‌کنند.

به عبارت دیگر، به کمک این چالش، یک مجموعه داده‌ی تمیز و دقیق از تصاویر کاربران از ۱۰ سال گذشته و حال حاضر آن‌ها جمع‌آوری شده است. البته تمامی پیام‌های دریافتی علیه توییت یاد شده، به در دسترس بودن تصاویر اشاره نمی‌کنند؛ بعضی نیز معتقدند این داده‌ها استفاده‌ی خاصی نخواهند داشت. اما محققان بخش داده و دانشمندان، خوب می‌دانند چطور از آن‌ها استفاده کنند. وقتی هشتگ‌ها فراگیر می‌شوند، به صحت داده‌هایی که در مراحل اولیه‌ی این روند ایجاد می‌شوند، بیش‌تر از داده‌های بعدی – زمانی که بعضی کاربران شروع به شوخی کردن با هشتگ یا هایجک کردن آن برای اهداف نامربوط می‌کنند – می‌توان اعتماد کرد.

در مورد تصاویر جعلی نیز، الگوریتم‌های شناخت تصویر به اندازه‌ی کافی برای انتخاب چهره‌ی یک انسان خبره شده‌اند. اگر شما به جای حالت عادی این چالش، تصویر یک گربه مربوط به ۱۰ سال پیش و حالا را منتشر کنید، الگوریتم به سادگی می‌تواند آن را نادیده بگیرد.

فیسبوک در جایگاه خود، هر گونه دست داشتن در چالش #۱۰YearsChallenge را تکذیب کرده است. یکی از اعضای شرکت فیسبوک این گونه پاسخ داده است:

این یک رفتار کاربرمحور است که توانسته همه‌گیر شود. فیسبوک این جریان را راه‌اندازی نکرده است و در این چالش، از تصاویری که در فیسبوک موجود است استفاده می‌شود. از این چالش چیزی به فیسبوک نمی‌رسد (جز یادآوری اینکه چه چیزهایی در سال ۲۰۰۹ به عنوان مد مطرح بود). به خاطر داشته باشید که کاربران فیسبوک می‌توانند در هر زمان، قابلیت تشخیص چهره‌ی فیسبوک را خاموش کنند.

اما حتی اگر این چالش، یکی از موارد مهندسی اجتماعی نباشد، در سال‌های گذشته چندین مثال از بازی‌های اجتماعی یا چالش‌های این‌چنینی برای استخراج و جمع‌آوری داده‌ها دیده شده است. تنها کافی است به جمع‌آوری داده‌های حجیم بیش از ۷۰ میلیون کاربر امریکایی فیسبوک که توسط کمبریج آنالیتیکا صورت گرفت فکر کنید.

اما اینکه دیگران از تصاویر فیسبوک شما برای بهبود الگوریتم تشخیص چهره استفاده کنند اتفاق بدی است؟ لزوماً نه. از جهتی، این اتفاق اجتناب‌ناپذیر است. به هر حال ما برای پیش‌برد این فناوری نیاز به استفاده از داده‌های گسترده داریم تا بتوانیم آن را در مقیاس بزرگ استفاده کنیم. به سه مورد کاربرد برای تشخیص چهره اشاره می‌کنیم: یک مورد استفاده‌ی قابل احترام، یک مورد معمولی و یک مورد خطرناک.

سناریوی خوب:

تکنولوژی تشخیص چهره، به خصوص با توانایی شناخت افزایش سن، می‌تواند در موارد پیدا کردن کودکان گمشده کمک کند. سال گذشته پلیس در دهلی‌نو گزارش کرد که در چهار سال گذشته، بیش از ۳۰۰۰ کودک گمشده را ردیابی کرده است. اگر کودکان برای مدتی گم شوند، احتمالاً به زودی چهره‌شان نسبت به آخرین تصویر ثبت شده تغییر خواهد کرد، بنابراین یک الگوریتم با شناسایی تغییرات سنی می‌تواند در این‌جا بسیار کمک‌کننده باشد.

استفاده عادی و بینابینی:

تشخیص سن احتمالاً یکی از مفیدترین راه‌ها برای تبلیغات هدفمند خواهد بود. طراحان تبلیغات می‌توانند با استفاده از دوربین‌ها و سنسورهایی که تصاویر کاربر را ثبت می‌کنند، پیام‌های خود را در گروه‌بندی‌های سنی مختلف (و گروه‌بندی‌های دیگری که با تشخیص چهره قابل تفکیک هستند) به کاربر ارائه کنند. این کاربرد آنقدرها هم هیجان‌انگیز نیست اما می‌تواند تبلیغات ارائه‌شده را مرتبط‌تر با شخص کند. اما ترکیب کردن این قابلیت با موارد دیگری مثل ردیابی مکانی، پاسخ‌ها و رفتارهای ما در خرید، همین تبلیغات می‌توانند باعث بعضی تعاملاتی شوند که کاربران را به وسواس و حتی وحشت در دنیای مجازی می‌اندازد.

استفاده‌‌‌هایی که می‌توانند نادرست باشند:

درست مثل سایر فناوری‌ها، امکان فراگیر شدن و ایجاد نتایج دیگر نیز وجود دارد. تشخیص افزایش سن می‌تواند در آینده در صنعت بهداشت و بیمه نیز اثرگذار باشد. برای مثال اگر به نظر رسد که نسبت به اطرافیان خود، زودتر پیر می‌شوید می‌توان نتیجه گرفت که احتمالاً ریسک بیمه‌ای شما چندان برای شرکت بیمه مناسب نیست و بیمه تصمیم خواهد گرفت که هزینه‌ی بیمه را برای شما بیشتر کرده یا از تحت پوشش قرار دادن شما صرف نظر کند.

پس از این که آمازون سرویس تشخیص چهره‌ی بلادرنگ خود را در سال ۲۰۱۶ معرفی کرد، از ابتدا توانست این سرویس را به آژانس‌های دولتی و مراکز مجری قانون مثل اداره‌ی پلیس اورلاندو و واشنگتن بفروشد. اما این تکنولوژی باعث افزایش نگرانی‌هایی در زمینه‌ی حریم خصوصی نیز شد. پلیس می‌توانست از این فناوری نه فقط برای رهگیری افراد مشکوک به انجام جرائم، که برای گرفتن رد افراد بی‌گناه مثل حاضران در راهپیمایی‌ها یا افراد دیگری که پلیس آن‌ها را مزاحم می‌داند، استفاده کند.

اتحادیه‌ی آزادی‌های شهروندی امریکا از آمازون توقف فروش این سرویس را درخواست کرد. همین درخواست توسط گروه‌های دیگری مثل شرکا و کارمندان آمازون نیز انجام شد که باعث شد ارزش و اعتبار شرکت تحت تأثیر قرار گیرد.

صحبت در مورد اثرگذاری فناوری روی مسائل انسانی کار دشواری است. همه‌ی ما می‌توانیم تلاش کنیم این تأثیرات را به سمت مثبتی حرکت دهیم، اما برای این کار، باید روش‌های استفاده‌ی نادرست از آن را نیز بشناسیم. وقتی با مشکل به خوبی آشنا شویم، بهتر می‌توانیم در مورد حل آن تصمیم بگیریم.

خب، حالا این موضوع چقدر مهم است؟ آیا به اشتراک گذاشتن چند عکس در این چالش – که قبلا هم عمومی و در دسترس بودند – باعث رخ دادن اتفاقات بدی خواهد شد؟ آیا آموزش به الگوریتم‌های تشخیص چهره برای شناخت سن و پیشروی سن خطرناک است؟ مسلماً نه!

گذشته از بحث خواستگاه یا هدف پشت این چالش، همه‌ی ما باید در مورد داده‌هایی که ایجاد کرده و به اشتراک می‌گذاریم، سطحی از دسترسی که به دیگران می‌دهیم و معنای استفاده از آن‌ها دقیق‌تر باشیم. اگر موضوع یک بازی بود که صریحاً در آن اعلام شده باشد که جمع‌آوری این جفت تصاویر قدیمی و جدید، برای استفاده در تحقیقات شناسایی سن استفاده می‌شود، می‌توانستید با توجه به اینکه چه کسی به این تصاویر دسترسی خواهد داشت و هدف آن چه خواهد بود، در شرکت کردن یا نکردن یا انتخاب تصاویر استفاده شده بیشتر دقت کنید

انسان‌ها رابط بین دنیای فیزیکی و دیجیتال هستند. تعاملات انسانی بخش اعظم جذابیت‌های اینترنت اشیاء را شکل می‌دهند. داده‌های ما صنایع را هوشمندتر و سودده‌تر می‌کنند. لذا باید همگی خواستار این باشیم که صنایع با داده‌های ما از هر جهت، با احترام رفتار کنند. اما مهم‌تر از آن، این است که خودمان با اطلاعات و داده‌های مربوط به خود، درست رفتار کنیم.

منبع : شهر سخت افزار