تشخیص چهره با یادگیری عمیق و نور مرئی


در میان راهکارهای احراز هویت بیومتریک ، فناوری تشخیص چهره یکی از راحت ترین و منسجم ترین تکنیکها را دارد. این تکنولوژی چندان جدید نیست و سابقه آن به دهه 1960 میلادی بر می‌گردد. اما در طی این مدت پیشرفت‌های بزرگی داشته و در حال به عنوان یکی از قابل اطمینان ترین روش‌های احراز هویت بیومتریک، مورد اقبال عموم استفاده کنندگان قرار گرفته است.

 

دو تکنولوژی یادگیری عمیق (Deep Learning) و شناسایی با نور مرئی (Visible light recognitionنقش به سزایی در رفع نواقص نسخه‌های قبلی تشخیص چهره و توسعه بیشتر این فناوری داشته‌اند. در این پست به صورت اجمالی به این دو تکنولوژی می‌پردازیم.

 

 

شناسایی عمیق چهره

یادگیری عمیق (Deep Learning) یا یادگیری سلسه مراتبی زیر شاخه‌ای  از یادگیری ماشین (ML) و هوش مصنوعی (AI) است و از  روشی که ذهن انسان برای یادگیری موضوع خاصی به کار می گیرد، تقلید می کند.

به دلیل الهام گرفتن الگوریتم‌های این روش از ساختار عصبی در مغز انسان، به این الگوریتم‌ها، شبکه‌های عصبی مصنوعی ، شبکه‌های عصبی عمیق و یا شبکه‌های عصبی کانولوشنی (CNN) نیز گفته می‌شود.

شبکه‌های عصبی از چندین لایه برای استخراج و پردازش ویژگی‌های سطح بالا از ورودی خام استفاده می‌کنند. در هر یک از این لایه‌ها، ویژگی‌های خاصی تشخیص داده‌ می‌شوند و در نهایت، در لایه‌ی آخر، تصویر به طور کامل شناسایی می‌شود در حقیقت در یک  CNN، لایه‌‌های مختلفی وجود دارند که هر یک لایه مخصوص شناسایی موارد خاصی است. در نهایت نیز خروجی مدل ادراک تصویری کامل است.

 

از مهمترین مزایایی که الگوریتم‌های یادگیری عمیق به ارمغان می‌آورند، می‌توان به دقت تشخیص قابل‌قیاس و حتی بهتر از انسان، قابلیت ضد مداخله و قابلیت تشخیص، استخراج و کلاس‌بندی هزاران مشخصه از چهره افراد اشاره کرد. با بهره‌گیری از تکنولوژی یادگیری عمیق (Deep Learning)، میانگین دقت شناسایی در دوربین‌‌های تشخیص چهره به ‌طور چشم‌گیری افزایش پیدا می‌کند. این موضوع باعث کارایی بیشتر سیستم‌های احراز هویت و همچنین سیستم‌های امنیتی و نظارت تصویری محیط می‌شود.

 

شبکه عصبی کانولوشنی در یادگیری عمیق برای  استخراج ویژگی‌ها و عملکرد بهینه نیاز به آموزش اولیه (دریافت اولیه اطلاعات ) داشته و برای اینکار نیاز به پردازشگر گرافیکی قوی دارد.  ولی همین که یکبار شبکه آموزش ببیند، می تواند معیار هایی برای هر چهره تولید کند. حتی برای چهره هایی که قبلا ندیده است! بنابراین دستگاه‌های تشخیص چهره جدید که از تکنیک یادگیری عمیق در شناسایی افراد استفاده می‌کنند، نیاز به پردازنده قوی دارند.

 

با ارائه اطلاعات و محاسبات کافی، یک شبکه عصبی نسبت به یک انسان می تواند بهتر عمل کند. این شبکه عصبی می‌تواند مشخصه‌های پیچیده‌تر و بیشتری تولید و استفاده کند. مشخصه‌هایی که انسان قادر به تولید و تحلیل آن‌ها نیست.

 

 

تأیید چهره عمیق چگونه کار می کند؟


شناسایی عمیق چهره


 

مرحله 1 : Feature Net

پس از وارد کردن تصویر صورت انسان توسط دوربین‌ها، FeatureNet قادر به استخراج متمایزترین موارد ویژگی های صورت است.

طراحی معماری FeatureNet از اهمیت حیاتی برخوردار است .  این طراحی قادر به استفاده از پیشرفته ترین شبکه عصبی برای یادگیری و شناخت ویژگی های خوب است.

 

مرحله 2 : Concat

در این بخش ویژگی‌های مختلف چهره انسان با هم ادغام شده و به صورت واحد در‌می‌آیند و سپس به مرحله بعد منتقل می‌شوند.

 

مرحله 3 : MetricNet

MetricNet جفت های ورودی تصویر را به نقشه‌ای برای توزیع هدف در فضای نهفته تبدیل می‌کند. در این مرحله سیستم قادر است تا بهترین معیارها و ویژگی‌های اندازه گیری شده چهره را شناسایی کرده و به صورت نقشه‌ای برای توزیع‌های هدف درآورد.

                               

مرحله 4 : Target distribution

بهترین معیار، توزیع های هدف را برای تمیز (تشخیص) دادن تصاویر چهره دنبال می کند . جفت‌های همسان به یک توزیع هدف ترسیم می شوند و شناسایی صورت می‌گیرد.



 

تشخیص چهره با نور مرئی (VLFR)

تکنولوژی تشخیص چهره با نور مرئی یا Visible Light Facial Recognition  یکی از جدیدترین پیشرفت‌های فناوری شناسایی چهره است که هدف آن غلبه بر کاستی های تشخیص چهره قبلی و دستیابی به یک ارتقا همه جانبه در هر عملکرد و قابلیت اطمینان با استفاده از آموزش عمیق است.

سیستم تشخیص چهره با نور مرئی قادر است به صورت خودکار چهره‌ها را در فیلم‌ها شناسایی و ردیابی کند. این سیستم با تابش نور مرئی و با استفاده از تکنیک تمایز نور ، وضوح و بافت چهره زنده را از تصویر جعلی تشخیص می‌دهد. بنابراین افرادی که سعی می کنند هویت جعلی را با استفاده از پرینت، عکس یا فیلم تأیید کنند ، به سرعت توسط سیستم شناسایی شده و دسترسی آن‌ها لغو می‌گردد.

 

پس از نصب، سیستم قادر است تا به طور فعال تصاویر چهره را جمع‌ آوری کند و مطابقت و شناسایی را بر روی هر فعالیت انسانی در فاصله 3 متری و در زاویه‌های مختلف (حداکثر تا 30 درجه) انجام دهد. پس از تأیید موفقیت آمیز، کارکنان آزادانه بدون ورود به صف و انتظار، ورود و خروج خود را ثبت می‌کنند.


با این روش دیگر شاهد ایجاد صف و ترافیک کارکنان در مقابل دستگاه‌های حضور و غیاب، برای ثبت اثر انگشت یا چهره نخواهید بود. با راحتی و کارایی بسیار خوبی که سیستم شناسایی Visible light facial به ارمغان آورده است، کارکنان فقط باید مستقیماً از کنار آن عبور کنند (راه بروند) و سیستم به طور فعال چهره‌ها و داده‌ها را مطابقت می‌دهد. در ضمن می‌توان چند نفر (حداکثر 5 نفر) را به صورت همزمان شناسایی کرد. 



چکیده

تلفیق یادگیری عمیق و نور مرئی در یک سیستم تشخیص چهره، مزایای بسیاری به همراه دارد و محدودیت‌‌های الگوریتم‌های قدیمی در توانایی ضد جعل ، آستانه قدرت پردازش ، محدودیت محیطی در منبع نور و موقعیت زاویه را بر طرف می‌سازد.

بر خلاف روش‌های سنتی (نسخه‌های قدیمی تشخیص چهره)،  این روش بهترین ویژگی های صورت را شناسایی و الگوسازی می‌کند. در ضمن با افزایش تعداد ویژگی‌های استخراج شده در یادگیری عمیق، فرآیند تشخیص چهره دقیق تر می‌شود. بنابراین می‌تواند تا همه چهره‌های موجود در تصویر را با سرعت و دقت بالا تشخیص و بعد شناسایی کند.

 

در سیستم جدید تشخیص چهره، فاصله شناسایی تا حدود 3 متر افزایش یافته است و  زمان شناسایی و تأیید نیز حدود 0.5 ثانیه است. این سیستم قادر است حداکثر 5 نفر را به صورت همزمان شناسایی کند.


این سیستم می تواند چهره تعریف شده را با زاویه انحراف 30٪ (چپ، راست، بالا و پایین) تشخیص دهد. این قابلیت باعث می‌شود که افراد حتی در حال صحبت با دیگران و یا عبور از کنار دستگاه نیز شناخته شوند. استفاده از کلاه یا عینک نیز سیستم را از کار تشخیص باز نمی دارد ، مگر اینکه وسایل قسمت زیادی از صورت را پنهان کنند.


مزایا و قابلیت‌های سیستم جدید تشخیص چهره به صورت خلاصه عبارتند از :

 

·         شناسایی در حال حرکت و از فاصله 3 متری

·         شناسایی سریع افراد (حدود 0.5 ثانیه)

·         قابلیت ضد تقلب قوی (شناسایی چهره زنده از تصاویر موجود در عکس و فیلم)

·         زاویه شناسایی وسیع تا 30 درجه

·         شناسایی دقیق چهره با نقاط و ویژ‌گی‌های بیشتر

·         شناسایی همزمان چند نفر (حداکثر 5 نفر)