Υπολογισμός ανάλυσης εικόνας σε pixels ανά μέτρο
Ίσως το πιο σημαντικό χαρακτηριστικό για να αξιολογήσουμε την ποιότητα μιας εικόνας στα κυκλώματα CCTV είναι η λεπτομέρεια που καταγράφεται όπως αυτή ορίζεται, με βάση την ανάλυση.
Ίσως το πιο σημαντικό χαρακτηριστικό για να αξιολογήσουμε την ποιότητα μιας εικόνας στα κυκλώματα CCTV είναι η λεπτομέρεια που καταγράφεται και η οποία με τη σειρά της ορίζεται από την ανάλυση. Στα συστήματα όμως CCTV είναι αλήθεια ότι συναντάμε διάφορους ορισμούς για την ανάλυση της εικόνας – και αυτό είναι απόρροια της διαφορετικής προσέγγισης των χαρακτηριστικών των προϊόντων στη βιομηχανία των ηλεκτρονικών συστημάτων ασφάλειας, όπως αυτά εμφανίζονται από κατασκευαστή σε κατασκευαστή.
Οι ορισμοί λοιπόν που έχουμε συναντήσει κατά καιρούς, είναι:
- Η ανάλυση μπορεί να εκφραστεί ως ο αριθμός των τηλεοπτικών γραμμών (TV lines). Μεγαλύτερος αριθμός τηλεοπτικών γραμμών, σημαίνει μεγαλύτερη λεπτομέρεια ή ευρύτερο πεδίο θέασης της κάμερας. Ο αριθμός των τηλεοπτικών γραμμών μπορεί να είναι 480, 540, 570 κ.λπ.
- Η ανάλυση μπορεί να εκφραστεί ως ο συνολικός αριθμός των εικονοστοιχείων (pixels) του φωτοευαίσθητου ανιχνευτή που χρησιμοποιείται για τη σύλληψη της εικόνας. Με τις ΜΡ (MegaPixels) κάμερες, ο συνολικός αριθμός των εικονοστοιχείων είναι εκφρασμένος σε μονάδες τάξης Μ=106 εικονοστοιχείων.
- Η ανάλυση μπορεί να είναι το επίπεδο λεπτομέρειας, με το οποίο μια εικόνα μπορεί να αναπαραχθεί ή να εγγραφεί. Η ανάλυση του αισθητήρα μπορεί να εκφραστεί ως γραμμές ανά χιλιοστό (lines per millimeter) και ο ορισμός αυτός χρησιμοποιείται μεταξύ των σχεδιαστών των φακών και των μηχανικών οπτικής. Καθώς λοιπόν αυξάνεται ο συνολικός αριθμός των εικονοστοιχείων ενός αισθητήρα, το μέγεθος των εικονοστοιχείων γίνεται μικρότερο και απαιτεί υψηλότερη ποιότητα φακού για να επιτευχθεί καλύτερη εστίαση.
- Η ανάλυση μπορεί να καθοριστεί επίσης ως ο αριθμός των εικονοστοιχείων ανά μέτρο απόστασης του αντικειμένου παρατήρησης από το φακό (pixels/m). Αυτή η απεικόνιση των διαστάσεων του αισθητήρα σε σχέση με την απόσταση που βρίσκεται το υπό παρατήρηση αντικείμενο, εμφανίζεται άμεσα μέσα από το επίπεδο της λεπτομέρειας στην εικόνα. Στην περίπτωση αυτή, το οριζόντιο πεδίο θέασης (Horizontal Field Of View) διαιρείται με τον οριζόντιο αριθμό των εικονοστοιχείων του αισθητήρα. Ο αριθμός που προκύπτει σε pixels/m σχετίζεται με την ποιότητα της εικόνας. Στο παρόν άρθρο θα ασχοληθούμε με την ανάλυση της εικόνας σύμφωνα με τον τελευταίο ορισμό.
Παράμετροι υπολογισμού ανάλυσης
Είναι γεγονός ότι ακόμα δεν έχουν τεθεί βιομηχανικά πρότυπα για το επίπεδο της λεπτομέρειας στην εικόνα που πρέπει να υπάρχει για κάθε εφαρμογή επιτήρησης. Έτσι προσδιορίζουμε τη λεπτομέρεια της εικόνας με τον αριθμό των εικονοστοιχείων, με τα οποία μπορούμε να απεικονίσουμε το υπό επιτήρηση αντικείμενο. Γνωρίζουμε ότι όσο μεγαλύτερη ανάλυση έχουμε, τόσο πιο εύκολη αναγνώριση και ταυτοποίηση του αντικείμενου θα επιτύχουμε. Εντούτοις, η υψηλότερη λεπτομέρεια στην ανάλυση της εικόνας απαιτεί είτε να χρησιμοποιήσουμε κάμερες υψηλότερης ανάλυσης ή μεγαλύτερο αριθμό καμερών μικρότερης ανάλυσης. Επιπλέον, για μεγαλύτερη ανάλυση θα απαιτηθεί περισσότερο bandwidth για μετάδοση και καταγραφή της εικόνας. Όλα αυτά βέβαια αυξάνουν το κόστος της επένδυσης. Έτσι, τελικά για μια εφαρμογή επιτήρησης γίνεται ένας συμβιβασμός μεταξύ των απαιτήσεων σε ανάλυση της εικόνας και του κόστους.
Στην εικόνα 1 μία εικόνα παρουσιάζεται σε διαφορετικά επίπεδα ανάλυσης. Φαίνεται η υψηλότερη λεπτομέρεια στην εικόνα, όπου είναι δυνατή η ταυτοποίηση του αντικείμενου με ανάλυση της εικόνας στα 200pix/m, η ανάλυση στα 130pix/m για αναγνώριση, η ανάλυση στα 70pix/m για ανίχνευση και τέλος η ανάλυση στα 30pix/m όπου μπορεί να χρησιμοποιηθεί γενικά για επιτήρηση ενός χώρου. Παρατηρούμε ότι κάθε εικόνα έχει τον ίδιο αριθμό εικονοστοιχείων, αλλά καθώς το πεδίο θέασης (FOV) μεγαλώνει, ο αριθμός pix/m που χαρακτηρίζει την ανάλυση εικόνας μειώνεται. Επειδή δεν υπάρχουν περισσότερα εικονοστοιχεία σε μία εικόνα σε σχέση με κάποια άλλη (ο συνολικός αριθμός εικονοστοιχείων είναι ίδιος) δεν υπάρχει διαφορά στο ποσό των δεδομένων που μεταφέρονται και άρα δεν υποβαθμίζεται η απόδοση του δικτύου είτε έχουμε υψηλότερη ανάλυση είτε έχουμε ευρύτερο πεδίο θέασης.
Στην εικόνα 2 γίνεται σύγκριση του πεδίου θέασης από διαφορετικές κάμερες σε μια απόσταση 10m (32ft, 1ft=0.3048m) από το αντικείμενο, στην ίδια ανάλυση εικόνας. Παρατηρούμε ότι καθώς η ανάλυση της κάμερας (συνολικός αριθμός εικονοστοιχείων) αυξάνεται, το ίδιο συμβαίνει και με το πεδίο θέασης για σταθερή ανάλυση εικόνας. Έτσι, για μεγαλύτερο αριθμό εικονοστοιχείων της κάμερας, έχουμε ευρύτερο πεδίο θέασης για την ίδια ανάλυση εικόνας.
Είναι γνωστό ότι η μικρότερη εστιακή απόσταση του φακού έχει το ευρύτερο πεδίο θέασης. Για εύρος θέασης μεγαλύτερο από 900 οι περισσότεροι φακοί αρχίζουν να καμπυλώνουν την εικόνα, εμφανίζοντας παραμορφωμένες εικόνες (barrel distortion), οι οποίες συμπιέζουν την εικόνα στις άκρες. Οι υπερευρυγώνιοι φακοί με τεχνικές κατασκευής τέτοιες ώστε να εμφανίζουν τις γραμμές ευθείες (rectilinear lenses), δεν δημιουργούν barrel distortion και έτσι διατηρούν ίδια την ανάλυση εικόνας στις άκρες.
Με τον τρόπο αυτό αυξάνεται η ανάλυση της εικόνας στις άκρες. Δηλαδή, ένα αντικείμενο θα καλύπτει περισσότερα εικονοστοιχεία στην εικόνα όταν αυτό βρίσκεται στην άκρη της εικόνας, ενώ αντίθετα οι ευρυγώνιοι φακοί με barrel distortion συμπιέζουν την εικόνα στις άκρες και ελαττώνουν την ανάλυση. Με τους συνήθεις ευρυγώνιους φακούς χάνεται πολύτιμη πληροφορία, η οποία δεν μπορεί να ανακτηθεί ούτε με επεξεργασία από κάποιο λογισμικό. Οποιαδήποτε επεξεργασία προσαρμογής γίνει, θα δημιουργήσει μία εικόνα που θα δείχνει ότι είναι όμοια με τα αποτελέσματα που θα είχαμε αν χρησιμοποιούσαμε rectilinear φακό, αλλά στην πραγματικότητα θα είχαμε μικρότερη ανάλυση.
Με ένα rectilinear φακό, τα αντικείμενα που βρίσκονται στο ίδιο κατακόρυφο επίπεδο έχουν την ίδια ανάλυση εικόνας είτε βρίσκονται στο κέντρο είτε στα άκρα της εικόνας, ακόμα και αν τα αντικείμενα στις άκρες της εικόνας βρίσκονται σε μεγαλύτερη απόσταση από την κάμερα. Στην εικόνα 3 φαίνονται παραστατικά τα παραπάνω.
Αυτή η τεχνική της ευθυγράμμισης δημιουργεί ένα φαινόμενο που ονομάζεται 3D-stretching, σύμφωνα με το οποίο τα αντικείμενα στην άκρη της εικόνας φαίνονται να έχουν επιμηκυνθεί. Με τους rectilinear φακούς, όσο ευρύτερο πεδίο θέασης έχουμε, τόσο πιο εύκολα αντιληπτό γίνεται το φαινόμενο. Βέβαια, οι rectilinear φακοί έχουν το πλεονέκτημα της αυξανόμενης ανάλυσης της εικόνας σε σχέση με τους φακούς που παρουσιάζουν barrel distortion. Με αυτούς τους φακούς, τα αντικείμενα στην άκρη της εικόνας θα είναι μικρότερα από ό,τι στο κέντρο. Η εικόνα 4 δείχνει το φαινόμενο της 3D-stretching. To μήκος του μαύρου αυτοκίνητου που βρίσκεται κοντά στο άκρο της εικόνας έχει εξομαλυνθεί στο επίπεδο της εικόνας, επειδή τα δύο αυτοκίνητα βρίσκονται στο ίδιο κατακόρυφο επίπεδο ως προς την κάμερα. Αυτό το φαινόμενο παρουσιάζεται όταν τα αντικείμενα έχουν διάσταση παράλληλη προς τη διεύθυνση τοποθέτησης της κάμερας.
Με ένα rectilinear φακό, ο υπολογισμός της ανάλυσης των αντικειμένων που βρίσκονται τοποθετημένα σε ένα τόξο, με την κάμερα να είναι τοποθετημένη στο κέντρο του, είναι λίγο πιο πολύπλοκη. Στην περίπτωση αυτή, καθώς το αντικείμενο μετακινείται από το κέντρο της εικόνας προς τα άκρα κατά μήκος ενός τόξου, χωρίς αλλαγή της απόστασης από την κάμερα θα αυξάνεται η ανάλυση της εικόνας του αντικειμένου.
Στην εικόνα 5 φαίνεται ξεκάθαρα ότι καθώς το αντικείμενο μετακινείται πάνω στο ίδιο τόξο προς τα άκρα, αυξάνεται η ανάλυση. Η εικόνα του ατόμου που βρίσκεται σε απόσταση 6.3m από την κάμερα γίνεται περισσότερο ευδιάκριτη καθώς μετακινείται προς τα άκρα, σε σχέση με τη λεπτομέρεια στο κέντρο της εικόνας. Ταυτόχρονα όμως και λόγω του φαινόμενου 3D-stretching, αυξάνεται και το εύρος του. Αν χρησιμοποιούνταν ένας ευρυγώνιος φακός με barrel distortion, τότε θα είχαμε μικρότερη λεπτομέρεια στην εικόνα για κινούμενο προς τα άκρα αντικείμενο, αλλά όμως δεν θα είχαμε αύξηση του εύρους του.
Για ένα rectilinear φακό μπορούμε να υπολογίσουμε την ανάλυση εικόνας που επιτυγχάνεται με μία MP κάμερα, χρησιμοποιώντας απλές σχέσεις.
Αν ορίσουμε ως:
- D (distance): την απόσταση του αντικειμένου από την κάμερα
- CW (chip width): το εύρος του ανιχνευτή της κάμερας και το οποίο είναι γνωστό ανάλογα με το format της κάμερας που χρησιμοποιείται (π.χ. για 1/3΄ είναι 4.8mm)
- HNP (horizontal number pixels): τον οριζόντιο αριθμό εικονοστοιχείων του ανιχνευτή της κάμερας
- FL (focal length): την εστιακή απόσταση του φακού
- HFOV (horizontal field of view): το οριζόντιο πεδίο θέασης,
τότε
Έτσι, αν έχουμε μία κάμερα 5MP ( CW=5.76 mm, HNP=2560) και χρησιμοποιούμε ένα rectilinear φακό με FL=1.7mm, τότε ένα αντικείμενο που βρίσκεται σε απόσταση D=7m έχει ανάλυση 108pix/m.
Όπως έχει ήδη αναφερθεί, για αντικείμενα που βρίσκονται στο ίδιο κατακόρυφο επίπεδο, η ανάλυση εικόνας στα άκρα είναι όμοια με την ανάλυση εικόνας στο κέντρο. Το ίδιο όμως δεν συμβαίνει για τα αντικείμενα που βρίσκονται σε τόξο γύρω από την κάμερα. Έτσι, μια σχέση που μας δίνει την ανάλυση στα άκρα, αν γνωρίζουμε την ανάλυση στο κέντρο και το HFOV του φακού, είναι η ακόλουθη:
όπου
- Ε_RESOLUTION : η ανάλυση εικόνας στα άκρα
- C_RESOLUTION : η ανάλυση εικόνας στo κέντρο
Αν στο προηγούμενο παράδειγμα ο φακός έχει HFOV=1200, τότε η Ε_RESOLUTION=216 pix/m.
Στο σημείο αυτό πρέπει να επισημανθεί και να γίνει κατανοητό ότι η ανάλυση της εικόνας εξαρτάται και από το φακό αλλά και από την κάμερα που θα χρησιμοποιηθεί. Διαφορετικές κάμερες με τον ίδιο φακό, θα δώσουν διαφορετικές αναλύσεις εικόνας.
Για τους φακούς που παρουσιάζουν barrel distortion, καλό είναι να συμβουλευόμαστε τα τεχνικά εγχειρίδια του κατασκευαστή για τον υπολογισμό των αντίστοιχων παραμέτρων.
Αναφορά: Theia Technologies
Του Γιώργου Βελντέ
Φυσικός – Ραδιοηλεκτρολόγος