Τι ακριβώς συνέβη το 2013;

Τέσσερις τάσεις στην τεχνολογία, τέσσερα κύματα που μέχρι τότε τα παρακολουθούσαμε ξεχωριστά και χωρίς ιδιαίτερο ενδιαφέρον, ξαφνικά συνέκλιναν, γιγαντώθηκαν και άρχισαν να παρασέρνουν ένα-ένα τα εμπόδια.

Ποιοι είναι οι τέσσερις αυτοί πυλώνες της ΤΝ; Ο πρώτος είναι το ότι, τα τελευταία 60 χρόνια, τα κομπιούτερ γίνονται όλο και πιο γρήγορα – περίπου εκατό φορές πιο γρήγορα κάθε δεκαετία. Αυτό ονομάζεται «ο νόμος του Μουρ» από το όνομα του επιχειρηματία που τον διατύπωσε το 1965. Ο νόμος λοιπόν λειτούργησε με εντυπωσιακή ακρίβεια για δεκαετίες, και το 2013 τα κομπιούτερ είχαν πια γίνει αρκετά γρήγορα για τις ανάγκες της ΤΝ. Εκτοτε, ο νόμος του Μουρ έχει κόψει κάπως ταχύτητα καθώς έχουμε πια φτάσει κοντά σε εμπόδια πολύ θεμελιώδη – γιατί δεν μπορεί π.χ. το τρανζίστορ να γίνει μικρότερο από το άτομο.

Η δεύτερη ευτυχής συγκυρία που μας έφερε την ΤΝ είναι το Διαδίκτυο. Γιατί για να λειτουργήσει η σημερινή ΤΝ χρειάζεται, όπως θα δούμε, τεράστια αποθέματα δεδομένων. Και στο Διαδίκτυο, μετά από τρεις δεκαετίες εκθετικής ανάπτυξης, υπάρχουν πια διαθέσιμες αφάνταστες ποσότητες δεδομένων. Και κάθε φορά που ένας από εμάς κάνει οτιδήποτε online – κάτι που συμβαίνει σε όλους μας όλο και πιο συχνά – η πλημμύρα των δεδομένων μεγαλώνει.

Τρίτο, μια μικρή ομάδα οραματιστών επιστημόνων – πρώτος ανάμεσά τους ο Geoff Hinton και οι μαθητές του – δεν σταμάτησαν επί δεκαετίες να κυνηγούν, παρά τις αλλεπάλληλες αποτυχίες και απογοητεύσεις, το όνειρό τους, ένα όνειρο που σε εμάς τους υπόλοιπους φαινόταν από αμφίβολο έως παράλογο: Πίστευαν ακράδαντα ότι η ΤΝ θα θριαμβεύσει μόνο όταν τα Νευρωνικά Δίκτυα ενηλικιωθούν. Τα νευρωνικά δίκτυα είναι συσκευές με πάρα πολλές εσωτερικές παραμέτρους. Aριθμούς δηλαδή – «βάρη» τους ονόμαζε το εισαγωγικό άρθρο – που πρέπει να ρυθμισθούν σωστά για να λειτουργήσει καλά η συσκευή.

Η τέταρτη συνιστώσα είναι μαθηματική, και έχει να κάνει με τη μέθοδο που χρησιμοποιούμε για να βρούμε τις κατάλληλες τιμές των αριθμών ώστε να λειτουργήσει σωστά ένα νευρωνικό δίκτυο – π.χ. να μας λέει κατά πόσον, στη φωτογραφία που ανεβάσαμε ως αρχείο με δέκα χιλιάδες pixel, υπάρχει κάπου μια γάτα. Ο αλγόριθμος λοιπόν που χρησιμοποιούμε είναι ο πιο απλός που θα μπορούσε να σκεφτεί κανείς: Το να ψάχνεις για τους αριθμούς με τους οποίους η συσκευή θα έχει την καλύτερη απόδοση είναι λίγο σαν να ψάχνεις να βρεις το ψηλότερο σημείο σε κάποια περιοχή του χάρτη.  Στον χάρτη βέβαια έχεις δύο αριθμούς, το γεωγραφικό μήκος και πλάτος, αντί για τα εκατομμύρια των αριθμών της συσκευής – και το υψόμετρο στον χάρτη αντιστοιχεί στην απόδοση της συσκευής. Τι θα κάνεις; Πιθανότατα θα προχωρείς πάντα προς την πιο επικλινή ανηφόρα από το σημείο όπου ευρίσκεσαι. Και αυτός είναι χοντρά-χοντρά ο τρόπος με τον οποίο ρυθμίζονται τα νευρωνικά δίκτυα – μόνο που, βέβαια, αντί για δύο αριθμούς, εκεί πρέπει να εξερευνηθούν πολλά εκατομμύρια αριθμών.

Τώρα, αν κινηθούμε με αυτόν τον τρόπο ξεκινώντας από κάποιο σημείο της Ελλάδας, πιθανότατα δεν θα καταλήξουμε στην κορυφή του Ολύμπου που είναι ο στόχος μας, αλλά στον λόφο της γειτονιάς – και για να λειτουργήσουν σωστά τα νευρωνικά δίκτυα πρέπει να είμαστε στον Όλυμπο ή κάπου εκεί κοντά… Να λοιπόν η μαθηματική έκπληξη, που, έντεκα χρόνια αργότερα, ακόμα προσπαθούμε να την καταλάβουμε: Όταν ακολουθούμε την ανηφόρα όχι σε δύο διαστάσεις αλλά σε εκατομμύρια διαστάσεις, όλες οι κορυφές έχουν περίπου το ίδιο ύψος – δεν υπάρχουν λόφοι!

Έτσι λοιπόν ο Geoff και οι συνεργάτες του έφτιαξαν το 2013 ένα νευρωνικό δίκτυο που το ονόμασαν Alexnet, και που αναγνώριζε φωτογραφίες που περιείχαν γάτες – ή σκύλους, λουλούδια, ποδήλατα, πρόσωπα, και άλλα πολλά –
κάτι που μέχρι τότε ήταν άπιαστο όνειρο. Και το κατάφεραν με τη μέθοδο της ανηφόρας: Το Alexnet εκπαιδεύτηκε με εκατομμύρια φωτογραφίες, και κάθε φορά που η απάντησή του ήταν σωστή (π.χ., απαντούσε «γάτα» όταν υπήρχε γάτα στην εικόνα, ή απαντούσε «δεν βλέπω γάτα» όταν δεν υπήρχε) όλοι οι αριθμοί άλλαζαν λιγάκι, και όσοι αριθμοί συνεισέφεραν στη σωστή απάντηση αυξάνονταν – ενώ μειώνονταν όσοι έσπρωχναν προς τη λάθος κατεύθυνση. Και σε περίπτωση λανθασμένης απάντησης, το ακριβώς αντίθετο – και αυτό επαναλήφθηκε με πολλά εκατομμύρια φωτογραφίες. Ετσι  ανέβηκε στον Όλυμπο ο Geoff…

Την πρώτη αυτήν επιτυχία ακολούθησαν χιλιάδες άλλες, ακόμα πιο εντυπωσιακές, γιατί τώρα είχε πια προστεθεί και μια πέμπτη δύναμη: τα μιλιούνια των νέων ερευνητών που, παίρνοντας έμπνευση και θάρρος από την πρώτη επιτυχία, έπεσαν με ενθουσιασμό στα νευρωνικά δίκτυα και δεν άφηναν καμιά γωνιά του τοπίου ανεξερεύνητη. Και σύντομα άρχισαν να εφαρμόζουν παρόμοιες τεχνικές και στη γλώσσα – να δημιουργούν νευρωνικά δίκτυα που μπορούν να προβλέψουν την επόμενη λέξη σε οποιοδήποτε σημείο οποιουδήποτε κειμένου, σε οποιαδήποτε γλώσσα. Μηχανές δηλαδή που κατανοούν, με τον τρόπο τους, την ανθρώπινη γλώσσα, και μαζί με αυτήν όλα όσα μπορεί να περιγράψει η γλώσσα – τον κόσμο ολόκληρο δηλαδή.  Για να το καταφέρουν αυτό, έχουν διαβάσει όλα τα βιβλία σε όλα τα θέματα και σε όλες τις γλώσσες, μαζί και όλη τη Βικιπαίδεια και ό,τι άλλο υπάρχει στο Διαδίκτυο. Αυτή ήταν η δεύτερη, και κατά τη γνώμη μας η πιο σημαντική, φάση των μεγάλων επιτυχιών. Και έτσι φτάσαμε πέρσι στο ChatGPT, και τώρα στους ακόμα πιο εντυπωσιακούς επιγόνους του: τα Μεγάλα Μοντέλα Γλώσσας (ΜΜΓ).

Και ο ανθρώπινος εγκέφαλος;

Οι επιδόσεις των μηχανών αυτών είναι πραγματικά θεαματικές – απαντούν σε ερωτήσεις, συνοψίζουν και μεταφράζουν κείμενα, βγάζουν άκρη στην επιστημονική βιβλιογραφία, γράφουν προγράμματα, σκαρώνουν ποιήματα και ψευδείς ειδήσεις – και με αποτελέσματα που συναγωνίζονται και συχνά φαίνονται να ξεπερνούν τις ανθρώπινες δυνατότητες στις ίδιες δουλειές. Και με όλα αυτά είναι εύκολο να ξεχάσει κανείς ότι πίσω από τo ευφυές και ανθρωπόμορφο προσωπείο ενός ΜΜΓ δεν υπάρχει παρά ένα νευρωνικό δίκτυο – κάτι δισεκατομμύρια αριθμών, δηλαδή – που με τα πολλά κατάφερε να σουλουπώσει ικανοποιητικά τους αριθμούς του και τώρα επιδίδεται στο μοναδικό περίπου κόλπο που ξέρει να κάνει, και αυτό είναι να μαντεύει έξυπνα την επόμενη λέξη σε κάθε κείμενο – συμπεριλαμβανομένης και της απάντησής του στην ερώτησή μας. Αυτό που είναι όντως ιδιοφυές στα ΜΜΓ είναι η ιδέα ότι μπορείς να κατορθώσεις τόσα πολλά με το να μαντεύεις την επόμενη λέξη…

(Επεξηγηματικά σημειώνουμε εδώ ότι την επόμενη λέξη ενός κειμένου πολύ σπάνια μπορούμε να τη μαντέψουμε με σιγουριά. Ακόμα και στο σχετικά εύκολο παράδειγμα «Επιασα ένα μολύβι και άρχισα να _» η πρόβλεψη «γράφω» μπορεί – ανάλογα με τα συμφραζόμενα – να είναι μόνο κατά 80% σίγουρη, με δυνατότητες όπως «σκιτσάρω» και «το ξύνω» να μοιράζονται το υπόλοιπο 20%. Τα ΜΜΓ λοιπόν μαθαίνουν να εκτιμούν σωστά αυτές τις πιθανότητες.)

Λοιπόν, όταν τον Νοέμβρη του 2022 μάς προέκυψε το ChatGPT, σε μια από τις πρώτες συζητήσεις μαζί του το ρωτήσαμε: «Σε ποιους τομείς υπολείπεται ακόμα η ΤΝ του ανθρώπινου εγκεφάλου;». Και, μετά από μερικά πέρα-δώθε – που κάπου θύμιζαν υπεκφυγές – το ChatGPT ομολόγησε το αυτονόητο. Δηλαδή ότι η ΤΝ είναι ακόμα πολύ πίσω σε πέντε πολύ κρίσιμα μέτωπα.

Ενέργεια. Για να εκπαιδευθεί ένα ΜΜΓ πρέπει να καεί ρεύμα περίπου όσο χρειάζεται επί έναν χρόνο μια μικρή γειτονιά – δέκα πολυκατοικίες, ας πούμε. Και για να λειτουργεί – για να απαντάει στις ερωτήσεις μας – πρέπει να ξοδεύει άλλο τόσο, σε συνεχή βάση. Όποιος νοιάζεται για τον πλανήτη δεν πρέπει να το ξεχνάει αυτό. Ενώ ένας εγκέφαλος χρειάζεται μόνο 16 βατ – περίπου όσο ένα κινητό.

Ιδιοφυΐα και εφευρετικότητα. Κάθε ένας από εμάς έχει τη δυνατότητα – με λίγη έμπνευση και τύχη – να σκεφτεί κάτι μοναδικό και πρωτόφαντο. Να ανακαλύψει καινούργιες διασυνδέσεις ανάμεσα σε ιδέες, γεγονότα ή επιστήμες, διασυνδέσεις που κανείς μέχρι τώρα δεν τις είχε φανταστεί. Ή να γράψει κάτι πολύ φρέσκο και όμορφο, ή πολύ κουφό. Ένα ΜΜΓ φιλοδοξεί να προβλέψει σωστά την επόμενη λέξη βασισμένο σε ιδέες που  έχουν ήδη καταγραφεί.

Διά βίου μάθηση. Ως άνθρωποι δεν σταματάμε ποτέ να μαθαίνουμε – να μπουσουλάμε, να μιλάμε, να περπατάμε, να διαβάζουμε και να γράφουμε, πιάνο, ποδήλατο και σκάκι, να είμαστε καλοί πολίτες, σύντροφοι, γονείς – και συνήθως μαθαίνουμε νέα πράγματα δίχως να ξεχνάμε όσα ξέραμε. Στην ΑΙ, κάθε καινούργια γνώση απαιτεί ριζική επανεκπαίδευση με την οποία μπορεί να ξεχαστεί κάτι άλλο.

Συναισθηματική και κοινωνική ευφυΐα. Όλοι ξέρουμε στο πετσί μας τι σημαίνει απογοήτευση και φόβος, και τι είναι ηδονή, ποιες συμπεριφορές μας θα παραξενέψουν τους γύρω μας ή θα εξαγριώσουν τους γονείς μας, και ποιες θα τις εκτιμήσουν οι φίλοι μας. Ένα ΜΜΓ όλα αυτά προσπαθεί να τα συναγάγει από τον τρόπο που οι λέξεις διαδέχονται η μία την άλλη σε κείμενα – ενώ η γνώση αυτή σπάνια καταγράφεται με ακρίβεια σε βιβλία ή στο διαδίκτυο.

Τέλος, αυτό που το λέμε γείωση (grounding) είναι ένα ανθρώπινο γνώρισμα που συμπληρώνει, συνοψίζει και εξηγεί τα παραπάνω: Καθετί που ξέρουμε, το μάθαμε από μια εμπειρία ζωής. Ακόμα και για την πιο αφηρημένη έννοια, έχουμε ζήσει τη στιγμή που κάποιος μάς την πρωτοανέφερε, την εξήγησε, ή τη χρησιμοποίησε. Ενώ ένα ΜΜΓ δεν έχει ζήσει τίποτε πέρα από την ανάγνωση εκείνων των εκατομμυρίων βιβλίων, και το καθετί που ξέρει προήλθε από μια απρόσμενη αλλαγή στον τρόπο που οι λέξεις στα βιβλία αυτά διαδέχονταν η μια την άλλη.

Παραισθήσεις

Αλλά πέρα από τα παραπάνω μειονεκτήματα – για τα οποία έχουν γραφτεί στο διαδίκτυο αρκετά ώστε να μπορεί να μιλάει γι’ αυτά το ChatGPT… – τα ΜΜΓ παθαίνουν και παραισθήσεις (hallucinations): Παρά την υποτιθέμενη σοφία και πολυμάθειά τους, αρκετά συχνά απαντούν με τρόπο που δεν αντιστοιχεί στην ερώτηση, ή αναιρεί τα δεδομένα που έχουν δει. Για παράδειγμα, στην ερώτηση «Σε ποια πόλη γεννήθηκε ο Aϊνστάιν;» ένα ΜΜΓ δεν αποκλείεται να απαντήσει «Στη Βέρνη,» αν και στα δεδομένα που έχει διαβάσει είναι ξεκάθαρο ότι ο Aϊνστάιν γεννήθηκε στο Ουλμ – ή να πει κάτι άσχετο, π.χ. «Ο Aϊνστάιν πέθανε στο Πρίνστον το 1955». Αυτό λοιπόν το πολύ ενοχλητικό κουσούρι – για το οποίο πιο ακριβής θα ήταν ο όρος «παραμύθιασμα,» η συμπεριφορά δηλαδή κάποιου που αισθάνεται υποχρεωμένος να δώσει μια απάντηση παρ’ όλο που δεν γνωρίζει το θέμα – απασχολεί πολύ τους ερευνητές στην περιοχή. Μάλιστα, σύμφωνα με πολύ πρόσφατη έρευνα στα μαθηματικά των ΜΜΓ, οι παραισθήσεις φαίνεται ότι είναι αναπόφευκτες…

Πώς ακριβώς ο ανθρώπινος εγκέφαλος δημιουργεί την ευφυΐα και τη γλώσσα είναι σήμερα ένα μεγάλο μυστήριο της επιστήμης – αλλά ένα πράγμα είναι σίγουρο: είναι τελείως διαφορετικός από τον τρόπο με τον οποίο λειτουργούν τα ΜΜΓ.

Είναι η ΤΝ απειλή για την ανθρωπότητα;

Πολλοί φοβούνται ότι τα ΜΜΓ θα αποκτήσουν μεγάλη δύναμη και θα στραφούν εναντίον μας. Ο φόβος αυτός δεν είναι κατά τη γνώμη μας η προτεραιότητα αυτή τη στιγμή. Όπως έχει λεχθεί «Όποιος ζει με τον φόβο ότι μια μέρα θα μας κυβερνούν μηχανές, προφανώς δεν προσέχει αρκετά αυτούς που μας κυβερνούν σήμερα».

Η προβολή των υπαρξιακών κινδύνων της ΤΝ είναι μια εντυπωσιακή ιστορία που αποσπά την προσοχή μας από τα άμεσα, σοβαρά προβλήματα. Το μεγαλύτερο κοινωνικό πρόβλημα της εποχής μας είναι η τεράστια αύξηση της ανισότητας – όλων των ειδών και σε όλους τους άξονες – μέσα στον τελευταίο μισό αιώνα. Η ΤΝ έχει οξύνει το πρόβλημα: η εισαγωγή της ΤΝ στον εργασιακό χώρο, πέρα από το ότι αφαιρεί θέσεις εργασίας, είναι ήδη γνωστό στους οικονομολόγους ότι αυξάνει την ανισότητα ανάμεσα στους εργαζόμενους της ίδιας επιχείρησης. Και όταν αφαιρεί θέσεις εργασίας, το κάνει με έναν τρόπο ιδιαίτερα ύπουλο και ειδεχθή: Π.χ., ένας δημοσιογράφος μπορεί να χάσει τη δουλειά του και να αντικατασταθεί από ένα εξειδικευμένο ΜΜΓ, το οποίο έχει εκπαιδευθεί στη δημοσιογραφία μελετώντας, μεταξύ άλλων, τα άρθρα του ανθρώπου που αντικατέστησε…

Το πιο επικίνδυνο από όλα είναι ότι η ΤΝ αυξάνει την ανισότητα σε μια διάσταση που γίνεται όλο και πιο κρίσιμη: τον βαθμό στον οποίο οι πολίτες παίρνουν μέρος στις σοβαρές αποφάσεις. Ενώ η εξέλιξη και η εφαρμογή της ΤΝ αφορούν τη ζωή όλων μας, οι αποφάσεις παίρνονται από λίγους, και με γνώμονα αποκλειστικά το κέρδος. Η ΤΝ θα μπορούσε να φέρει στον μέσο πολίτη ελεύθερο χρόνο, αναβάθμιση ζωής, επιμόρφωση, υγεία, περιβάλλον, δικαιοσύνη, ασφαλή και άνετα γηρατειά – αντί να αυξάνει την ανεργία, την ανισότητα, την ανασφάλεια, καθώς και τα κέρδη των μεγάλων εταιρειών.

Η σημερινή τεράστια συγκέντρωση της ΤΝ στις μονοπωλιακές διαδικτυακές πλατφόρμες Google, Microsoft, Amazon, Apple, Facebook – και βέβαια την ψευδεπίγραφη Open AI, την πιο ερμητικά κλειστή και αδιαφανή από όλες – είναι ένα φαινόμενο ιδιαίτερα επικίνδυνο για την ανθρωπότητα. Ας μην ξεχνάμε ότι η ΤΝ είναι το προϊόν της εμπνευσμένης ερευνητικής δουλειάς χιλιάδων πρωτοπόρων επιστημόνων επί οκτώ δεκαετίες, ένα περίτρανο και όμορφο κατόρθωμα της ανθρώπινης ιδιοφυΐας που ανήκει σε όλους μας. Το αποκορύφωμα μιας πανανθρώπινης πορείας που έχει τις ρίζες της στους αρχαίους πολιτισμούς και επιταχύνθηκε με την Αναγέννηση και στην εποχή μας του κομπιούτερ. Τα εκατομμύρια βιβλία που χρησιμοποιήθηκαν στην εκπαίδευση των ΜΜΓ είναι ολόκληρη η πνευματική και πολιτισμική κληρονομιά της ανθρωπότητας, ενώ τα δεδομένα από το διαδίκτυο που χρησιμοποιήθηκαν για τον ίδιο το σκοπό – και τα οποία οι εταιρείες αρνούνται να οριοθετήσουν – σε εμάς ανήκουν και από εμάς τα πήραν. Η συνολική σοφία και δημιουργικότητα όλων των πολιτισμών της ιστορίας και το σύνολο των online ζωών όλων μας, καθώς και οι καρποί της δουλειάς τριών γενεών ερευνητών, χρησιμοποιούνται για την κερδοσκοπία και τη συσσώρευση εξουσίας.

Νομίζουμε ότι η χρήση δεδομένων, στη μαζική, καθολική κλίμακα που απαιτείται για τα ΜΜΓ, πρέπει  να υπόκειται σε δημόσιο έλεγχο. Αυτό πρέπει να ισχύσει και αναδρομικά – να ξαναδούμε δηλαδή πώς έγινε η εκπαίδευση των ΜΜΓ τα τελευταία χρόνια. Τα κοινοβούλια σε όλο τον κόσμο – πρώτο και καλύτερο το Ευρωκοινοβούλιο – έχουν πολλή δουλειά μπροστά τους.

Η κυρία Μάρθα Σιδέρη είναι τ. Καθηγήτρια Τμήματος Πληροφορικής ΟΠΑ και ο κύριος Χρίστος Παπαδημητρίου είναι Καθηγητής Πληροφορικής στο Columbia University και Επικεφαλής Ερευνητή της Μονάδας «Αρχιμήδης» του Ερευνητικού Κέντρου «Αθηνά»