کمیته رکن چهارم – شرکت های حوزه تکنولوژی چشم به سنگر بعدی خود دوخته اند: چهره انسان. اگر دوست داشته باشید، حالا می توانید صورت یک حیوان را به خودتان بگیرید و ویدیویی با آن چهره از خودتان ضبط کنید.
اگر مبلغ گزافی بپردازید و آیفون X بخرید، می توانید به وسیله صورتتان موبایل را در یک چشم به هم زدن باز کنید. حتی در هانگژو چین، می توانید به یک دوربین لبخند بزنید و ساندویچ مرغ رایگان بگیرید.
و حداقل از هر چهار دپارتمان پلیس در آمریکا، یکی به نرم افزار تشخیص چهره مجهز است که اجازه می دهد صورت افراد را در کسری از ثانیه شناسایی کنند و اقدامات لازم را انجام دهند.
اما این فناوری هنوز کامل نیست. آیفون X شما شاید بعضی وقت ها با این سرعت نتواند موبایل را آنلاک کند، پلیس ها هم ممکن است اشخاص اشتباهی را دستگیر کنند.
اگر قرار باشد نرم افزاری بدون مشکل چهره شما را تشخیص بدهد، باید توالی کاملی از الگوریتم ها کنار هم کار کنند. اول از همه، نرم افزار باید تشخیص دهد که آیا یک تصویر درون خود چهره ای دارد یا نه. اگر شما پلیسی هستید که می خواهید یک کودک گمشده را در تصویری شلوغ پیدا کنید، داشتن چهره ها بر اساس سن و سال می تواند بیشترین کمک را کند.
و در نهایت، شما نیاز به الگوریتمی دارید که می تواند هر چهره را با چهره دیگر در دیتابیس مقایسه کند، آن هم با نورپردازی متفاوت و از زاویه های مختلف و پس از آن باید تشخیص دهد که آیا این تصویر، متعلق به همان شخص است یا خیر.
برای بهبود این الگوریتم ها، محققین از اطلاعات دموگرافیک استفاده می کنند. وقتی آن ها به نرم افزار تشخیص چهره در مورد نژاد، جنسیت و سن شما می آموزند، می تواند کمی بهتر در برخی موارد عمل کند. آنیل جین از دانشگاه ایالت میشیگان می گوید: «این یک نتیجه شگفت آور نیست که اگر شما جمعیت های مختلف را جداگانه مدل کنید، نتیجه بهتری به دست می آید.»
با الگوریتم های بهتر، شاید پلیس ها شخص بیگناه را دستگیر نکنند. خبر خوبی است نه؟ اما چندان ساده نیست. اطلاعات دموگرافیک شاید به دقت الگوریتم ها کمک کند اما مورد استفاده شان را نیز پیچیده تر خواهد کرد.
یک مثال اخیر را بررسی کنیم. پژوهشگران دانشگاه ساری انگلستان و جیانگنان چین سعی دارند تا الگوریتم خاص مورد استفاده در فناوری تشخیص چهره را بهبود بخشند. این الگوریتم که بر اساس مدل سه بعدی قابل تغییر شکل ساخته شده، یک سلفی را به صورت دیجیتالی تبدیل به یک سر سه بعدی می کند آن هم در کمتر از یک ثانیه.
با در دست داشتن این مدل، شما می توانید زاویه سلفی اشخاص را تغییر دهید و با عکس دیگری مقایسه کنید. آیفون X و اسنپ چت نیز از مدل های سه بعدی مشابهی بهره می برند.
پژوهشگران به الگوریتم هایشان یک سری دستورالعمل ابتدایی دادند: این یک قالب از سر است، و این هم قابلیتی است که اجازه می دهد تصویر فشرده شده یا کش بیاید تا عمق چهره برای ساخت یک تصویر ۳ بعدی مهیا شود.
قالب مورد استفاده در واقع یک مدل ساده از سر انسان است، فردی با بینی متوسط، فاصله متوسط بین دو چشم و قطر متوسط گونه که از چهره اشخاص عادی گرفته اند. زمانی که این مدل ها در گذشته به دست آمد، اسکن چهره ها کار دشواری بود چون زمان بسیاری می گرفت. بنابراین همه چهره ها را با هم ترکیب کردند تا یک متوسط از کل چهره ها به دست آورند، فارغ از سن و نژاد و جنسیت.
این گروه از مجموع چهره ۹۴۲ نفر استفاده کرده که اسکن چهره ها در انگلیس و چین صورت پذیرفته. در عوض ترکیب این ۹۴۲ چهره، این گروه دسته بندی ها را بر اساس نژاد انجام داده. آن ها برای هر نژاد یک الگو یا قالب متفاوت به دست آورده اند. یک چهره برای آسیایی ها، یک چهره برای سفید پوست ها، یک چهره برای سیاه پوست ها و الگوریتم را بر اساس این سه گروه تنظیم کردند.
اگرچه فقط اسکن چهره از ۱۰ سیاهپوست در دسترس بود اما این رقم برای سفید پوست ها و آسیایی ها به ترتیب بیش از ۱۰۰ و ۸۰۰ است. آن ها متوجه شدند که الگوریتم ها این بار بسیار دقیق تر عمل کرده اند نسبت به زمانی که فقط یک الگو در نظر گرفته می شد.
ژنهوا فِنگ از دانشگاه ساری انگلستان می گوید: «فقط بحث نژاد نیست. اگر شما مدل صورت یک نوزاد را داشته باشید، شما می توانید چهره سه بعدی بهتری برای نوزادان بسازید. اگر شما مدل صورت یک فرد پیر را داشته باشید، ساخت چهره سه بعدی برای آن هم ساده تر خواهد شد.»
بنابراین اگر به نرم افزارهای بیومتریک در مورد گروه های مختلف، توضیحات دقیق تری داده شود، می توانند کار را بهتر از قبل به پیش ببرند.
به گفته جین، مدل های سه بعدی به خصوص فِنگ یک الگوریتم ویژه در زمینه فناوری تشخیص چهره به حساب می آیند. الگوریتم های فعلی مورد استفاده از تصاویر دو بعدی استفاده می کنند چون کار کردن با داده های سه بعدی دشوار است.
اما دیگر تکنیک های فراگیر نیز مردم را دسته بندی می کند تا عملکرد بهتری ارائه دهد. یک مدل چهره سه بعدی معمول نیز معمولا از الگوی چهره استفاده می کند. بنا به اینکه شخص موجود در تصویر مرد، زن، نوزاد یا پیرمرد است، این الگوریتم با الگوی متفاوتی کار خود را آغاز می کند.
برای الگوریتم های یادگیری ماشینی دو بعدی به خصوص که تشخیص می دهد یک فرد در دو تصویر وجود دارد، محققان متوجه شده اند اگر ویژگی های به خصوص مثل نژاد، جنسیت و حتی رنگ چشم و حالات صورت کاملا جداگانه بررسی شود، نرم افزار می تواند با دقت بیشتری پاسخگو باشد.
بنابراین، اگر شما به یک الگوریتم در مورد نژادها بیاموزید، آیا آن را تبدیل به یک ماشین نژاد پرست کرده اید؟ نه لزوما. به گفته جامعه شناس دانشگاه کلمبیا، آلوندرا نلسون که اخلاق در فناوری های جدید را مطالعه می کند اینطور نیست. دانشمندان اجتماعی همیشه داده های دموگرافیک را بر اساس دسته بندی ها مطالعه می کنند.
برای مثال، جامعه شناس ها همیشه رفتارها را با معیار جنسیت و نژاد می سنجند. نلسون می گوید: «ما در دنیایی زندگی می کنیم که از نژاد برای همه چیز استفاده می کند.» همین حالا هم اف بی آی از دسته بندی های خاصی برای افراد استفاده می کند. بنابراین اگر قصد عملکرد بهتر الگوریتم ها را داریم، باید چنین چیزی را به آن بیاموزیم.
با این حال، نلسون به اهمیت موضوع دیگری اشاره می کند: «مشکلی نیست اگر دسته بندی ها مثلا چشم آبی، چشم قهوه ای، بینی باریک، بینی نه چندان باریک و موارد این چنینی باشد که اصلا کاری به نژاد ندارد؟»
بنابراین باید دانشمندان فکر کنند که چرا تصمیم گرفته اند نژاد را انتخاب کنند. آیا می توان تفاوت های دیگری را در نظر گرفت که همانند نژاد، تعصب برانگیز و تبعیض گونه به نظر نرسد؟
پژوهشگران باید موارد احتمالی استفاده کارهایشان را در نظر بگیرند، به خصوص آن هایی که دولت ها و سازمان های صاحب قدرت می خواهند برای مواردی که در ابتدا ذکر شد استفاده کنند.
منبع: دیجیاتو