Αναγνώριση και Ανίχνευση Προσώπου
Οι εξελίξεις και οι προσδοκίες
Αν θέλαμε να προβλέψουμε μια τεχνολογική εφαρμογή στο τομέα της βιντεο-επιτήρησης που τα αμέσως επόμενα χρόνια θα μας απασχολήσει σε πάρα πολύ μεγάλο βαθμό, θα ποντάραμε σίγουρα στο λεγόμενο Face Recognition and Detection.
Του Αριστοτέλη Λυμπερόπουλου
Αναφορές προηγούμενων χρόνων
Η ανίχνευση και αναγνώριση προσώπων αποτελεί μια τεχνολογική λειτουργία των συστημάτων ασφάλειας, που είχε δοκιμαστεί και τα παλαιότερα χρόνια, όχι όμως πάντα με επιτυχία. Οι λύσεις και τα συστήματα αναγνώρισης προσώπων που είχαν παρουσιαστεί, δεν είχαν πάντα την ίδια αποτελεσματικότητα και αξιοπιστία στην ακρίβεια αναγνώρισης προσώπου, όμως είναι αλήθεια ότι και οι απαιτήσεις των έργων αλλά και οι προσδοκίες των χρηστών παλιότερα, δεν ήταν ίδιες σε σχέση με σήμερα. Κατά την πρώτη περίοδο ανάπτυξης της τεχνολογίας αναγνώρισης προσώπου, τεχνικοί περιορισμοί στη διαθέσιμη επεξεργαστική ισχύ των τότε συστημάτων, έθεταν αρκετούς και σημαντικούς περιορισμούς στις δυνατότητες αυτών των συστημάτων. Ένα από τα σημαντικότερα προβλήματα που αντιμετώπιζαν όσοι ασχολούνταν με τις λύσεις αυτής της κατηγορίας στο πρώιμο στάδιο ανάπτυξης του, ήταν ότι έδιναν ορισμένες φορές εσφαλμένα αποτελέσματα. Αυτό είχε ως συνέπεια, είτε την ενεργοποίηση ψευδοσυναγερμών κατά την προσπάθεια εντοπισμού ενός στόχου, είτε την μη δυνατότητα τεκμηρίωσης κάποια υπόθεσης. Η προσδοκώμενη χρήση ενός τέτοιου συστήματος, που ήταν κυρίως η αναγνώριση και ταυτοποίηση ενός μεμονωμένου ατόμου σε ένα πλήθος ανθρώπων, δεν ήταν μια εύκολη υπόθεση λοιπόν.
Η εξέλιξη
Σήμερα όμως και με βάση την ευρύτατη αξιοποίηση των προηγμένων συστημάτων video analytics και την υιοθέτηση τεχνολογιών όπως η Τεχνητή Νοημοσύνη, το τοπίο στο τομέα της αναγνώρισης προσώπων στα συστήματα ασφάλειας, έχει αλλάξει ριζικά. Οι λύσεις που είναι διαθέσιμες στην αγορά για την αναγνώριση, ανίχνευση και εντοπισμό ενός ατόμου, αναλύοντας τα χαρακτηριστικά του προσώπου του, είναι αρκετά αποτελεσματικές, αξιόπιστες και με μεγάλη ακρίβεια. Επίσης, με την πάροδο των χρόνων η συγκεκριμένη τεχνολογία αρχίζει να γίνεται πιο προσιτή, ακόμα και σε εφαρμογές χαμηλότερου κόστους.
Γνωρίζουμε ότι από την μια πλευρά, ο άνθρωπος διακρίνεται για την ικανότητα του να αναγνωρίζει πρόσωπα, ενώ από την άλλη πλευρά, οι υπολογιστές είναι πολύ καλοί στην επεξεργασία δεδομένων και στη δυνατότητα τους να ανακαλούν δεδομένα όποτε κρίνεται σκόπιμο. Η πρόκληση που υπήρχε εδώ και αρκετές δεκαετίες, ήταν να πετύχουμε να ενοποιήσουμε αυτά τα δύο χαρακτηριστικά σε ένα έξυπνο σύστημα. Και από ότι φαίνεται οι κατασκευαστές των λύσεων βίντε-επιτήρησης το κατάφεραν και πέτυχαν σήμερα η τεχνολογία αναγνώρισης προσώπου, να αποτελεί ένα χρήσιμο εργαλείο για μια ευρεία σειρά εφαρμογών ασφάλειας, με βασικό στόχο των εντοπισμό, την αναγνώριση και την παρακολούθηση ενός προσώπου με βάση την ανάλυση των χαρακτηριστικών του προσώπου του.
Η επίτευξη του στόχου ήρθε με την έλευση ορισμένων τεχνολογικών εξελίξεων στα video analytics και την υιοθέτηση τάσεων όπως η Τεχνητή Νοημοσύνη, όπως προαναφέρθηκε. Η διάδοση των συστημάτων που βασίζονται στη χρήση λειτουργιών τεχνητής νοημοσύνης και βαθειάς εκμάθησης (deep learning) ενίσχυσαν σε πολύ μεγάλο βαθμό την αποτελεσματικότητα αυτών των εφαρμογών.
Φαίνεται λοιπόν ότι πλέον ότι έχουν μπει γερά τα θεμέλια σε ότι αφορά το τεχνολογικό υπόβαθρό για την αξιοποίηση όλων των πλεονεκτημάτων που συνοδεύουν τις εφαρμογές αναγνώρισης προσώπου.
Η διαφοροποίηση των μεθόδων
Όταν η βιομηχανία αποφάσισε να εμβαθύνει στις εφαρμογές αναγνώρισης προσώπου είχε μπροστά της να αντιμετωπίσει δυο μεθόδους, δυο δηλαδή διαφορετικές προσεγγίσεις που έχουν να κάνουν τόσο με τον τρόπο υλοποίησης όσο και με τα προσδοκώμενα αποτελέσματα. Υπάρχει, λοιπόν η τεχνολογία ανίχνευσης προσώπου (facial detection) και η πιο γνωστή στο ευρύ κοινό τεχνολογία αναγνώρισης προσώπου (facial recognition). Στους δύο όρους υπάρχει μια μικρή διαφοροποίηση, αλλά πολλές φορές δεν γίνεται αντιληπτή, με αποτέλεσμα να δημιουργείται σύγχυση στο τι είναι ικανά να κάνουν τα συστήματα και στο τι δεν μπορούν να κάνουν.
Οι δύο αυτές τεχνολογίες, έχουν μια σημαντική ομοιότητα στον βασικό τους σκοπό και στο πως υλοποιούν αυτόν τον σκοπό. Είναι και οι δύο εφαρμογές που έχουν την ικανότητα αναγνώρισης ενός προσώπου, το οποίο έχει καταγραφεί σε μια εικόνα. Ο συμβατικός τρόπος για την υλοποίηση αυτού του στόχου, είναι με τη μέθοδο του τριγωνισμού και τη χρήση χαρακτηριστικών του ανθρώπινου προσώπου (μάτια, μύτη και στόμα) ώστε να αναγνωριστούν τα χαρακτηριστικά ενός συγκεκριμένου προσώπου. Με την αυξανόμενη χρήση της τεχνητής νοημοσύνης και της βαθιάς εκμάθησης σε πολλές λειτουργίες έξυπνων συστημάτων βίντεο, αυτή η προσέγγιση μοιάζει λίγο ξεπερασμένη αν και φυσικά χρησιμοποιείται ακόμα αρκετά.
Όμως τα νέα έξυπνα συστήματα με βάση την AI (Artificia Technology) και Deep Learning τεχνολογία πλέον μπορούν να “μαθαίνουν” να αναγνωρίζουν ανθρώπους μέσα σε μια μικρή ή μεγάλη ομάδα ατόμων και να ακολουθούν τις κινήσεις τους. μέχρι να συλλάβουν μια κατάλληλη εικόνα προσώπου που θα χρησιμοποιείται πλέον για αυτόν τον σκοπό. Αυτή η προσέγγιση είναι πιο ευέλικτη και δίνει προφανώς πολύ καλύτερα αποτελέσματα, αλλά απαιτεί και πολύ μεγαλύτερη υπολογιστική ισχύ. Αυτή η διαφορά μεταξύ ανίχνευσης και αναγνώρισης γίνεται πιο ξεκάθαρη, όταν η παρουσία ενός προσώπου έχει εντοπισθεί σε μια σκηνή βίντεο.
Η ανίχνευση προσώπου βασίζεται στην ύπαρξη ενός αλγόριθμου που ανιχνεύει πότε ένα πρόσωπο είναι παρών σε μια σκηνή και στη συνέχεια χρησιμοποιεί αυτήν την πληροφορία για να ενεργοποιεί μια προκαθορισμένη ενέργεια ή να τροποποιεί τις ρυθμίσεις του συστήματος,
Παραδείγματος χάρη, ένα σύστημα επιτήρησης μπορεί να καταγράφει σε χαμηλότερο frame rate ή σε χαμηλότερη ανάλυση όταν δεν υπάρχει δραστηριότητα ή όταν υπάρχει δραστηριότητα που δεν σχετίζεται με κάποιο συγκεκριμένο άτομο. Όταν όμως το σύστημα ανιχνεύει την ύπαρξη κάποιου συγκεκριμένου προσώπου τότε αυτομάτως μπορεί να αυξάνεται τόσο το frame rate, όσο και η ανάλυση του βίντεο. Τα βίντεο που θα περιέχουν κάποιο συγκεκριμένο πρόσωπο θα μπορούν να αποθηκεύονται με διακριτό όνομα ώστε οι μεταγενέστερες αναζητήσεις να είναι πιο εύκολες. Είναι επίσης πιθανό να χρησιμοποιείται η ύπαρξη ενός προσώπου σε μια σκηνή ώστε να δημιουργείται μια ειδική περιοχή μεγαλύτερου ενδιαφέροντος μέσα σε όλη την εικόνα.
Σε ότι αφορά την αναγνώριση προσώπου είναι μια εξελιγμένη έκδοση της ανίχνευσης προσώπου. Βασίζεται μεν στη δημιουργία ενός προτύπου από τα στοιχεία που συνθέτουν ένα πρόσωπο, το οποίο όμως συγκρίνεται με τα αποθηκευμένα δεδομένα, ώστε να εξετασθεί αν όντως αυτό το πρόσωπο είναι αποθηκευμένο στη βάση δεδομένων. Με αυτόν τον τρόπο γίνεται εφικτή η δημιουργία “λευκών λιστών” δηλαδή προσώπων που έχουν δικαίωμα πρόσβασης σε συγκεκριμένους χώρους ή “μαύρων λιστών” δηλαδή προσώπων με μη εξουσιοδότηση πρόσβασης σε χώρους. Η αναγνώριση προσώπων είναι μια τεχνολογία πιο απαιτητική σε ότι αφορά την κατανάλωση των υπολογιστικών πόρων σε σχέση με την ανίχνευση προσώπων. Αυτό συμβαίνει ακριβώς λόγω της διεργασίας που αναφέρθηκε παραπάνω. Πραγματοποιεί την ανίχνευση προσώπου και στη συνέχεια κάνει την αναζήτηση μέσα στη βάση δεδομένων μέχρι να εντοπίσει μια αντιστοίχιση που να ταιριάζει με τα προκαθορισμένα όρια ώστε να εξασφαλιστεί η ακρίβεια της αναζήτησης. Όσο μεγαλύτερα είναι τα όρια τόσο γρηγορότερη είναι η αναζήτηση ενώ όσο μικρότερο είναι το εύρος των ορίων τόσο αυξάνεται ο χρόνος της αναζήτησης αλλά βελτιώνεται η ακρίβεια της αναζήτησης.
Προηγμένοι αλγόριθμοι
Τα τελευταία χρόνια η εξέλιξη όλων αυτών των τεχνολογιών στην ευρύτερη κατηγορία των video analytics των συστημάτων επιτήρησης ακολούθησε ένα εντυπωσιακό ρυθμό ανάπτυξης. Οι αλγόριθμοι ανίχνευσης προσώπων, όπως και η ακρίβεια προσδιορισμού των χαρακτηριστικών τους, βελτιώθηκαν σε σημαντικό βαθμό και έκαναν εφικτή τη χρήση της τεχνολογίας, σε ένα ευρύ φάσμα εφαρμογών. Ένα σημαντικό στοιχείο που συνέβαλλε σε αυτήν την εξέλιξη, ήταν η εμφάνιση των επεξεργαστών αποκλειστικά για χρήση σε εφαρμογές ανάλυσης της εικόνας. Οι Graphical Processor Units, πιο γνωστοί ως GPU, αφού χρησιμοποιήθηκαν με μεγάλη επιτυχία στον χώρο της πληροφορικής και σε εφαρμογές γραφικών (επεξεργασία βίντεο, γραφιστικές εφαρμογές αλλά και παιχνίδια) έκαναν την εμφάνιση τους και στον χώρο των συστημάτων ασφάλειας με πολύ εντυπωσιακά αποτελέσματα. Η χρήση των GPU επέτρεψε και την ενσωμάτωση τεχνολογιών, όπως την τεχνητή νοημοσύνη και τη βαθειά εκμάθηση, οι οποίες έδωσαν μια νέα διάσταση στη δυνατότητα των εφαρμογών ώστε να εντοπίζουν πολύ γρήγορα την πληροφορία που αναζητεί ο χρήστης. Επίσης έδωσαν τη δυνατότητα στις εφαρμογές αναγνώρισης προσώπου να αυτό-βελτιώνονται, μια δυνατότητα που επίσης βοήθησε σημαντική την αλληλεπίδραση χρήστη και εφαρμογής. Όλες αυτές οι εξελίξεις συνέβαλλαν στη μεγαλύτερη διάδοση της αναγνώρισης προσώπου και στην ενσωμάτωση της σε συστήματα ηλεκτρονικής ασφάλειας. Εκτός της προφανής χρήσης σε εφαρμογές συστημάτων επιτήρησης, η αναγνώριση προσώπου μπορεί να βοηθήσει σημαντικά και σε εφαρμογές ελέγχου πρόσβασης με χρήση βιομετρικών χαρακτηριστικών. Η χρήση της σε αυτού του είδους εφαρμογές συμβάλλει στην αύξηση της ταχύτητας ελέγχου και άρα στη γρηγορότερη ροή των εισερχόμενων από τα διάφορα σημεία ελέγχου.
Συνοψίζοντας…
Κανείς, ούτε στην πρώιμη περίοδο εξέλιξης της αναγνώρισης προσώπου, δεν αμφισβητούσε ότι αποτελούσε ένα σημαντικό εργαλείο για τη βελτίωση της ασφάλειας μιας εγκατάστασης. Όμως με την εμφάνιση των GPU και την ενσωμάτωση άλλων τεχνολογιών όπως η τεχνητή νοημοσύνη και η βαθιά εκμάθηση είναι φανερό ότι η αναγνώριση προσώπου θα επιτελέσει έναν σημαντικό ρόλο στα ηλεκτρονικά συστήματα ασφάλειας της επόμενης γενιάς. Η χρήση της θα βελτιώσει τις διαδικασίες ελέγχου, θα μειώσει τους χρόνους αναμονής και θα συμβάλλει στον γρηγορότερο εντοπισμό και άρα στην αποτελεσματικότερη πρόληψη ενδεχόμενων παραβατικών ενεργειών.