Ακουστικά τα οποία αναγνωρίζουν τις εκφράσεις του προσώπου και, μεταξύ άλλων, τις «μεταφράζουν» σε emoji, δηλαδή τις φατσούλες που χρησιμοποιούνται ευρέως στα κοινωνικά δίκτυα ανέπτυξαν επιστήμονες από το Πανεπιστήμιο Κορνέλ στις ΗΠΑ. Η λειτουργία των συσκευών αυτών, οι τεχνικές λεπτομέρειες των οποίων θα παρουσιαστούν στο Συμπόσιο Λογισμικού και Τεχνολογίας Διεπαφής Χρήστη UIST 2020, βασίζεται σε λογισμικά μηχανικής μάθησης.
Αναγνωρίζοντας τις κινήσεις των μυών
«Το πιο ενδιαφέρον εύρημα είναι ότι περιγράμματα τα οποία σχηματίζονται στο πρόσωπο μπορούν να προσφέρουν πολύ σημαντικές πληροφορίες για τις εκφράσεις των ανθρώπων», σημείωσαν σε σχετικές τους δηλώσεις οι ερευνητές που συμμετείχαν στην ανάπτυξη της τεχνολογίας. Καθώς σχηματίζεται μια έκφραση στο πρόσωπό μας συγκεκριμένοι μύες εκτείνονται ή συστέλλονται. Η δραστηριότητα αυτή των μυών έχει ως αποτέλεσμα να δημιουργούνται γύρω από τα μάγουλα χαρακτηριστικά μοτίβα τα οποία μπορούν να ψηφιοποιηθούν από ειδικά λογισμικά. Τα ακουστικά τα οποία ανέπτυξαν οι επιστήμονες είναι εξοπλισμένα με πολύ μικρές κάμερες οι οποίες αποτυπώνουν τις κινήσεις των μυών στο πρόσωπο.
Οι εκφράσεις μετατρέπονται σε εικόνες δύο διαστάσεων και τελικά τίθενται υπό την επεξεργασία αλγορίθμων οι οποίοι, βασισμένοι σε χαρακτηριστικά μοτίβα, αναγνωρίζουν και ψηφιοποιούν τις εκφράσεις του προσώπου. «Η συσκευή η οποία αναπτύξαμε είναι απλούστερη, λιγότερο εμφανής και πιο αποτελεσματική από προηγούμενες συσκευές οι οποίες είχαν χρησιμοποιηθεί για τον ίδιο σκοπό» σημείωσε σε δηλώσεις του ο ερευνητής Τσενγκ Ζανγκ ο οποίος συμμετείχε στην ανάπτυξη της τεχνολογίας η οποία «κρύβεται» πίσω από τα ακουστικά. Εκτός από τις εκφράσεις, η συσκευή μπορεί να ανιχνεύει και συγκεκριμένες λέξεις χωρίς ο χρήστης να χρειάζεται να τις προφέρει, παρά μόνο να τις εκφέρει βουβά με το στόμα του.
Αποτελεσματική τεχνολογία και εν μέσω… πανδημίας
Ο τρόπος λειτουργίας της συσκευής της δίνει ένα εξαιρετικό πλεονέκτημα: ότι αυτή μπορεί να χρησιμοποιηθεί ακόμη κι όταν ο χρήστης φοράει μάσκα. Κι αυτό επειδή σε αντίθεση με προηγούμενες συσκευές οι οποίες αναγνώριζαν τις εκφράσεις ενόσω οι χρήστες έπρεπε να στέκονται μπροστά από μια κάμερα, η συγκεκριμένη συσκευή είναι τοποθετημένη στο αυτί κι ως εκ τούτου σε μία οπτική γωνία η οποία κάνει εφικτή την αναγνώριση της κίνησης των μυών χωρίς να χρειάζεται να εκτίθεται ολόκληρη η επιφάνεια του προσώπου.
Σύμφωνα με τους ερευνητές, η ανάπτυξη της τεχνολογίας αυτής ενδέχεται να συμβάλει στο μέλλον στην αναγνώριση των συναισθημάτων των ανθρώπων οι οποίοι συμμετέχουν σε περιβάλλοντα εικονικής πραγματικότητας, αλλά και να χρησιμοποιηθεί σε χώρους όπου χρειάζεται να αποφεύγεται η ομιλία, όπως οι βιβλιοθήκες.