12/09/2016

Κάμερα μπορεί να διαβάσει βιβλίο χωρίς να το ανοίξει (Reading through closed books)

Ομάδα ερευνητών στο MIT και στο Georgia Tech παρουσίασε μια νέα κάμερα η οποία χρησιμοποιεί μία τεχνική απεικόνισης που της επιτρέπει μέσω ενός υπολογιστή να διαβάσει το τυπωμένο κείμενο από ένα βιβλίο χωρίς να ξεφυλλίσει. Χρησιμοποιεί ακτινοβολία tetrahertz και ένα ερμηνευτικό αλγόριθμο.Όπως αναφέρεται λεπτομερώς σε ένα έγγραφο που δημοσιεύεται στο Nature Communications, το σύστημα χρησιμοποιεί ακτινοβολία tetrahertz (το εύρος της ηλεκτρομαγνητικής ακτινοβολίας μεταξύ των μικροκυμάτων και του υπέρυθρου φωτός) το οποίο έχει έναν αριθμό πλεονεκτημάτων έναντι των άλλων επιφανειακής διείσδυσης κυμάτων όπως οι ακτίνες Χ ή οι υπέρηχοι. Η ακτινοβολία tetrahertz απορροφάται από διαφορετικές χημικές ουσίες με διαφορετικούς τρόπους, γεγονός που μπορεί να χρησιμοποιηθεί για τη διάκριση του χαρτιού και του μελανιού σε ένα βιβλίο. Η κάμερα tetrahertz που χρησιμοποιείται από την ομάδα μπορεί επίσης να εκπέμπει την ακτινοβολία σε υπέρ-βραχύ microbursts (μικροεκρήξεις) που μετρούν το βάθος μιας σελίδας σε ένα βιβλίο βάση του χρόνου που απαιτήθηκε στην ακτινοβολία να ανακλαστεί από το βιβλίο πίσω στην κάμερα. Αυτές οι υπερβραχείες εκρήξεις ακτινοβολίας αντιλαμβάνονται το βάθος σε ιδιαίτερα λεπτή ανάλυση, τόση ώστε οι ερευνητές να είναι σε θέση να μετρήσουν την απόσταση από την πηγή εκπομπής ακτινοβολίας σε μεμονωμένες σελίδες σε ένα βιβλίο, που χωρίζονται από θύλακες αέρα και που μπορεί να είναι και 20 μικρά βάθος (μικρά= χιλιοστά χιλιοστού, δηλαδή όσο το 1/1000 ενός χιλιοστού). Η αντανάκλαση από την μελάνη της tetrahertz ακτινοβολία πίσω προς την κάμερα στη συνέχεια αναλύεται από έναν αλγόριθμο που αναπτύχθηκε από τους ερευνητές του MIT και που σχεδιάστηκε να αποτυπώνει τα δεδομένα της χρονικής ανάκλασης ως εικόνα. Η εικόνα που προκύπτει από ότι είναι τυπωμένο σε μια δεδομένη σελίδα είναι σε μεγάλο βαθμό παραμορφωμένη και έτσι στη συνέχεια το σήμα επεξεργάζεται από ένα άλλο αλγόριθμο που αναπτύχθηκε από την ομάδα του Georgia Tech, ο οποίος είναι σε θέση να ερμηνεύσει μεμονωμένα γράμματα από την παραμορφωμένη εικόνα.

Ο ερευνητής της MIT Media Lab Κος Barmak Heshmat αναφερόμενος στον αλγόριθμο που ερμηνεύει τα γράμματα ανέφερε: «Είναι πραγματικά τρομακτικό. Πολλές ιστοσελίδες έχουν κάποιες δικλείδες πιστοποίησης [captchas] για να βεβαιωθούν ότι δεν είστε ρομπότ. Ο αλγόριθμος αυτός μπορεί εύκολα να προσπελάσει πολλές από αυτές». Η απεικόνιση Tetrahertz είναι μια τεχνολογία που είναι ακόμα στα σπάργανα και παρόλο που οι ερευνητές στο ΜΙΤ συνειδητοποίησαν αυτή η τεχνική αυτή θα μπορούσε να χρησιμοποιηθεί και πριν από μία δεκαετία για να βλέπει κάποιος μέσα από φακέλους, οι αλγόριθμοι όμως δεν ήταν αρκετά έτοιμοι να διαβάσουν το αποτέλεσμα. Ως απόδειξη της τεχνικής, οι ερευνητές τύπωσαν ένα γράμμα σε μεμονωμένα φύλλα χαρτιού και διαπίστωσαν ότι η τεχνική τους θα μπορούσε να προσδιορίσει σωστά τα γράμματα έως εννέα σελίδες βαθιά. Από εκεί και πέρα το ανακλώμενο σήμα έγινε πολύ θορυβώδες για να εξαγάγουν τις πληροφορίες από μια σελίδα, αλλά υποθέτουν ότι καθώς οι αισθητήρες ακτινοβολίας αναπτύσσονται συνεχώς και γίνονται όλο και καλύτεροι η τεχνική θα πρέπει μια μέρα να είναι σε θέση να διαβάσει ολόκληρα βιβλία χωρίς ποτέ να τα ανοίξει. Και αυτός ήταν ο σκοπός τους για αυτό το project, αφού ο Heshmat ανέφερε ότι το Μητροπολιτικό Μουσείο της Νέας Υόρκης ενδιαφέρεται έντονα για το έργο τους, δεδομένου ότι θα τους επιτρέψει να κοιτάξουν στα βιβλία που έχουν στην κατοχή τους και είναι τόσο παλιά που αν τα αγγίξουν θα τα βλάψουν ανεπανόρθωτα. Επιπλέον, επειδή η τεχνική απεικόνισης με ακτινοβολία tetrahertz είναι σε θέση να ξεχωρίσει τα χημικά προϊόντων από ένα αντικείμενο, η τεχνική θα μπορούσε όχι μόνο να χρησιμοποιηθεί για ανάγνωση βιβλίων αλλά και για να «διαβάσει» κάτι που είναι τυπωμένο σε μία λεπτή στρώση, όπως ο υμένας ενός χαπιού.

Δείτε το σχετικό βίντεο από την παρουσίαση της νέας τεχνολογίας: https://www.youtube.com/watch?v=6i25SuJzb0A

https://iguru.gr/2016/09/11/61008/camera-can-read-books-without-to-open-them/

No comments :

Post a Comment