20/05/2012

Ελληνική ανακάλυψη για την ψηφιοποίηση συγγραμμάτων

Μια έρευνα που προέρχεται από ένα νεαρό ερευνητή του «Δημόκριτου», ανοίγει νέους δρόμους για την ψηφιοποίηση ανεκτίμητων ιστορικών συγγραμμάτων, χειρόγραφων και μη, που αποτελούν έναν από τους βασικούς πυλώνες της πολιτιστικής κληρονομιάς. Συγκεκριμένα πρόκειται για τον 28χρονο Νικόλαο Σταματόπουλο, ερευνητή του Εργαστηρίου Υπολογιστικής Ευφυΐας του Ινστιτούτου Πληροφορικής και Τηλεπικοινωνιών του ΕΚΕΦΕ «Δημόκριτος», ο οποίος κέρδισε το ετήσιο βραβείο του Εθνικού Κέντρου Έρευνας και Τεχνολογικής Ανάπτυξης (ΕΚΕΤΑ) για την καλύτερη διδακτορική διατριβή του 2011, η οποία είχε ως αντικείμενο την «Οπτική επεξεργασία και ανάλυση ιστορικών εγγράφων». Η έρευνα, όπως αναφέρεται σε σχετική ανακοίνωση του «Δημόκριτου», εκτιμάται ότι θα λύσει τα χέρια βιβλιοθηκονόμων και ιστορικών που επί χρόνια έψαχναν ανάμεσα σε εκατοντάδες χιλιάδες τόμους, για να βρουν την πληροφορία που τους αφορούσε.

Οι νέες τεχνολογίες οπτικής επεξεργασίας επιτρέπουν, με ένα και μόνο «κλικ» σε μια μηχανή αναζήτησης, ο καθένας να μπορεί να περιηγηθεί στα άδυτα των ιστορικών αρχείων της Ελλάδας και του εξωτερικού, ακόμα και από το σπίτι του. Χιλιάδες χρήστες θα μπορούν να έχουν πρόσβαση στις πολύτιμες πληροφορίες ταυτόχρονα, ενώ παράλληλα θα διατηρούνται σε καλή κατάσταση τα εύθραυστα και ιστορικής αξίας κειμήλια. Η οπτική επεξεργασία ιστορικών κειμένων ή παλαιών χειρογράφων χαρακτηρίζεται από σημαντικές τεχνικές δυσκολίες σε σχέση με ένα σύγχρονο κείμενο, επειδή τα ιστορικά κείμενα συχνά είναι γραμμένα με πυκνή γραφή, ενώ είναι αποτυπωμένα σε λεπτό και φθαρμένο χαρτί όπου εναλλάσσονται αλφάβητα και γραμματοσειρές. Λόγω αυτών των δυσκολιών, ένας μεγάλος αριθμός ιστορικών συγγραμμάτων και χειρογράφων δεν έχει ψηφιοποιηθεί και μελετηθεί ακόμα, με συνέπεια οι πληροφορίες που κρύβουν αυτά τα βαριά σκονισμένα βιβλία, να παραμένουν ανεκμετάλλευτες. Σε αυτή την πρόκληση ήρθε να δώσει λύσεις η βραβευμένη έρευνα του Πανεπιστημίου Αθηνών και του Ινστιτούτου Πληροφορικής και Τηλεπικοινωνιών του ΕΚΕΦΕ «Δημόκριτος», που διεξήγαγε ο δρ Ν. Σταματόπουλος, με επιβλέποντα τον κύριο ερευνητή του «Δημόκριτου», δρ Βασίλειο Γάτο.

Ο κ. Σταματόπουλος μελέτησε ένα - ένα τα καθοριστικά στάδια που προηγούνται της διαδικασίας ψηφιοποίησης του ιστορικού κειμένου. Το μοντέλο που ανέπτυξε, εξάλειψε τα «τυπογραφικά» λάθη που εμφανίζονται με τα συνηθισμένα προγράμματα λογισμικού οπτικής αναγνώρισης κειμένου (OCR) και που οφείλονται τόσο στην καμπυλότητα των σελίδων των σκληρόδετων πολυσέλιδων συγγραμμάτων όσο και στα περίτεχνα περιθώρια και διαχωριστικά των σελίδων. Ο Έλληνας ερευνητής βελτίωσε τους μηχανισμούς αναγνώρισης των διακριτών σειρών και χαρακτήρων, ειδικότερα στις περιπτώσεις των χειρόγραφων κειμένων και, ακόμα, παρουσίασε μια μέθοδο που διευκολύνει την άμεση ψηφιοποίηση εγγράφων που αποτελούνται από κείμενο και εικόνα.

http://www.goodchannel.gr
http://www.schizas.com/site3/index.php

No comments :

Post a Comment