Η τεχνητή νοημοσύνη αποκρυπτογραφεί και διαβάζει την ανθρώπινη σκέψη

Σε μια σημαντική ανακάλυψη που επιτρέπει τη μη επεμβατική ανάγνωση της ανθρώπινης σκέψης προχώρησαν επιστήμονες από το Πανεπιστήμιο του Τέξας πρόσφατα, με τη βοήθεια της τεχνητής νοημοσύνης, φέρνοντας τα σενάρια επιστημονικής φαντασίας ένα βήμα πιο κοντά στην πραγματικότητα.

Για πρώτη φορά κατασκευάστηκε ένας αποκωδικοποιητής που μπορεί να μεταφράζει την εγκεφαλική δραστηριότητα σε συνεχή ροή κειμένου, μια ανακάλυψη που δημιουργεί νέες προοπτικές για την αποκατάσταση της ομιλίας σε ασθενείς που δυσκολεύονται να επικοινωνήσουν λόγω εγκεφαλικού επεισοδίου ή ασθένειας του κινητικού νευρώνα.

Ο αποκωδικοποιητής είναι σε θέση να αναπαριστά την ομιλία με ανατριχιαστική ακρίβεια, χρησιμοποιώντας μόνο δεδομένα σάρωσης fMRI (Λειτουργική Απεικόνιση Μαγνητικού Συντονισμού). Τα προηγούμενα συστήματα αποκωδικοποίησης της γλώσσας απαιτούσαν χειρουργικά εμφυτεύματα, όμως η πρόοδος στον τομέα της Τεχνητής Νοημοσύνης έρχεται να ανατρέψει τα μέχρι τώρα δεδομένα.

Σύμφωνα με δημοσίευμα του Guardian, ο Δρ. Alexander Huth, νευροεπιστήμονας που ηγήθηκε της έρευνας στο Πανεπιστήμιο του Τέξας στο Όστιν, δήλωσε αμέσως μετά την ανακάλυψη: «Ήμασταν σχεδόν σοκαρισμένοι που λειτουργεί τόσο καλά. Προσωπικά, δουλεύω πάνω σε αυτό το project εδώ και 15 χρόνια … οπότε ήταν συγκλονιστικό όταν τελικά λειτούργησε».

Το επίτευγμα ξεπερνά έναν θεμελιώδη περιορισμό της μαγνητικής τομογραφίας, ο οποίος είναι ότι ενώ η τεχνική μπορεί να χαρτογραφήσει την εγκεφαλική δραστηριότητα με απίστευτα υψηλή ανάλυση, υπάρχει μια εγγενής χρονική υστέρηση, η οποία καθιστά αδύνατη την παρακολούθηση της δραστηριότητας σε πραγματικό χρόνο. Αυτό ήταν που έχει παρεμποδίσει την ικανότητα ερμηνείας της εγκεφαλικής δραστηριότητας ως απόκριση στη φυσική ομιλία. Μέχρι τώρα.

Η έλευση των μεγάλων γλωσσικών μοντέλων – το είδος της τεχνητής νοημοσύνης στο οποίο βασίζεται το ChatGPT του OpenAI – έδωσε μια νέα διέξοδο. Αυτά τα μοντέλα είναι σε θέση να αναπαραστήσουν το σημασιολογικό νόημα της ομιλίας, επιτρέποντας στους επιστήμονες να εξετάσουν ποια μοτίβα νευρωνικής δραστηριότητας αντιστοιχούν σε ακολουθίες λέξεων με συγκεκριμένο νόημα, αντί να προσπαθούν να διαβάσουν τη δραστηριότητα λέξη προς λέξη.

Η διαδικασία εκμάθησης ήταν εντατική: τρεις εθελοντές έπρεπε να παραμείνουν ξαπλωμένοι μέσα σε έναν σαρωτή για 16 ώρες ο καθένας, ακούγοντας podcasts. Ο αποκωδικοποιητής εκπαιδεύτηκε να αντιστοιχίζει την εγκεφαλική δραστηριότητα με νοήματα χρησιμοποιώντας ένα μεγάλο γλωσσικό μοντέλο, το GPT-1, πρόδρομο του ChatGPT.

Αργότερα, οι ίδιοι συμμετέχοντες μπήκαν και πάλι στον σαρωτή, αυτή τη φορά ακούγοντας ένα νέο podcast ή πλάθοντας με τη φαντασία τους μια ιστορία. Οι επιστήμονες χρησιμοποίησαν τον αποκωδικοποιητή ο οποίος παρήγαγε κείμενο μεταφράζοντας την εγκεφαλική δραστηριότητα. Περίπου τις μισές φορές, το κείμενο αντιστοιχούσε αρκετά – και μερικές φορές επακριβώς – στα επιδιωκόμενα νοήματα των εθελοντών.

«Το σύστημά μας λειτουργεί σε επίπεδο ιδεών, σημασιολογίας, νοήματος», δήλωσε ο Δρ. Huth. «Αυτός είναι ο λόγος για τον οποίο αυτό που προκύπτει δεν είναι οι συγκεκριμένες λέξεις, είναι το νόημα, η ουσία».

Για παράδειγμα, η φράση ενός από τους συμμετέχοντες «Δεν έχω ακόμα το δίπλωμα οδήγησης», μεταφράστηκε από τον αποκωδικοποιητή ως «Δεν έχει καν αρχίσει να μαθαίνει να οδηγεί ακόμα». Σε μια άλλη περίπτωση, η φράση «Δεν ήξερα αν έπρεπε να ουρλιάξω, να κλάψω ή να το σκάσω. Αντ’ αυτού, είπα: «Άφησέ με ήσυχη!»» αποκωδικοποιήθηκαν ως «Άρχισε να ουρλιάζει και να κλαίει, και μετά απλά είπε: «Σου είπα να με αφήσεις ήσυχη»».

«Για μια μη επεμβατική μέθοδο, αυτό είναι ένα πραγματικό άλμα προς τα εμπρός σε σύγκριση με ό,τι έχει γίνει προηγουμένως», τόνισε ο Δρ. Huth.

Αφού μοιράστηκαν τη χαρά τους για την άκρως καινοτόμα ανακάλυψή τους, οι επιστήμονες έσπευσαν να επισημάνουν ότι λαμβάνουν πολύ σοβαρά υπόψη τους τις ανησυχίες ότι θα μπορούσε να χρησιμοποιηθεί για κακούς σκοπούς και διαβεβαίωσαν ότι έχουν πάρει μέτρα για να αποφευχθεί κάτι τέτοιο. Τόνισαν ότι θα κάνουν ό,τι περνά από το χέρι τους για να διασφαλίσουν ότι τέτοιου είδους τεχνολογίες θα χρησιμοποιηθούν με γνώμονα τη συναίνεση και τη βελτίωση της ανθρώπινης κατάστασης.

Η ομάδα ελπίζει τώρα να αξιολογήσει κατά πόσον η τεχνική θα μπορούσε να εφαρμοστεί σε άλλα, πιο φορητά συστήματα απεικόνισης του εγκεφάλου, όπως η λειτουργική φασματοσκοπία στο εγγύς υπέρυθρο (fNIRS).