Τεχνολογία

LipNet: “Έξυπνο” σύστημα διαβάζει τα χείλη

Οι πιθανές πρακτικές εφαρμογές ενός τέτοιου συστήματος περιλαμβάνουν τη βελτίωση των ακουστικών βαρηκοΐας, την αυτόματη μετατροπή συζητήσεων σε κείμενο, την αναγνώριση ομιλίας σε περιβάλλοντα με θόρυβο, τη βιομετρική ταυτοποίηση ατόμων, τον υποτιτλισμό ταινιών του βωβού κινηματογράφου κ.α.

Επιστήμονες στη Βρετανία, με επικεφαλής έναν Έλληνα ερευνητή, ανέπτυξαν ένα σύστημα τεχνητής νοημοσύνης με την ονομασία LipNet, το οποίο μπορεί να διαβάσει τα χείλη των ανθρώπων πολύ καλύτερα από τους ίδιους τους ανθρώπους.

Το σύστημα παρακολουθεί βίντεο χωρίς ήχο με έναν άνθρωπο να μιλάει και μπορεί να μαντέψει τι λέει με ακρίβεια 93%, παρακολουθώντας την κίνηση του στόματος του ομιλητή. Το LipNet δημιουργήθηκε από ερευνητές του εργαστηρίου τεχνητής νοημοσύνης του Πανεπιστημίου της Οξφόρδης, με επικεφαλής τον ελληνικής καταγωγής Γιάννη Ασσαέλ, σύμφωνα με το BBC. Οι δοκιμές έδειξαν ότι ενώ το «έξυπνο» σύστημα έχει μέσο ποσοστό λάθους μόνο 6,6% στην ανάγνωση των χειλιών, το ποσοστό λάθους των ανθρώπων είναι πολύ μεγαλύτερο (48%), ενώ και στους επαγγελματίες δεν πέφτει κάτω από 40%.

Η ανάπτυξη του συστήματος χρηματοδοτήθηκε εν μέρει από τη θυγατρική τεχνητής νοημοσύνης Deep Mind της Google. Οι πιθανές πρακτικές εφαρμογές ενός τέτοιου συστήματος περιλαμβάνουν τη βελτίωση των ακουστικών βαρηκοΐας, την αυτόματη μετατροπή συζητήσεων σε κείμενο, την αναγνώριση ομιλίας σε περιβάλλοντα με θόρυβο, τη βιομετρική ταυτοποίηση ατόμων, τον υποτιτλισμό ταινιών του βωβού κινηματογράφου κ.α.

Ο Γιάννης Ασσαέλ γεννήθηκε το 1991, αποφοίτησε από το Κολλέγιο «Ανατόλια» της Θεσσαλονίκης, σπούδασε στο Τμήμα Εφαρμοσμένης Πληροφορικής του Πανεπιστημίου Μακεδονίας και πήρε υποτροφία από το ΙΚΥ για να κάνει μεταπτυχιακά στη Βρετανία. Απέκτησε το 2015 το διδακτορικό του στη μηχανική μάθηση από το Τμήμα Επιστήμης Υπολογιστών του Πανεπιστημίου της Οξφόρδης, όπου σήμερα διεξάγει έρευνα. Παράλληλα, εργάζεται στη βρετανική εταιρεία τεχνητής νοημοσύνης Deep Blue Labs Ltd., η οποία πρόσφατα απορροφήθηκε από τη Deep Mind της Google.