Να αποσαφηνίσουμε εξαρχής κάτι. Αν και το κείμενο που πρόκειται να διαβάσετε θα μπορούσε να είχε γραφτεί με τη χρήση τεχνητής νοημοσύνης, στην πραγματικότητα δημιουργήθηκε με τον «πατροπαράδοτο», σχεδόν αναλογικό τρόπο.
Σαν μια ωδή στον παλιό κόσμο που μπορεί ακόμα να μην κινδυνεύει από εξαφάνιση, αλλά ήδη έχει αρχίσει να μπάζει νερά, και παρακολουθεί άλλοτε με αμηχανία, άλλες στιγμές με δέος και άλλες με προσμονή τα επιτεύγματα της τέταρτης βιομηχανικής επανάστασης. Αυτά που οι περισσότεροι χρησιμοποιούμε και απολαμβάνουμε, ενδεχομένως ακόμα και χωρίς να το ξέρουμε ή να το συνειδητοποιούμε.
Πρόκειται άλλωστε για ένα κείμενο που αφορά σε ένα από τα πρώτα μεγάλα γλωσσικά μοντέλα που μιλούν ελληνικά και έχουν τη δυνατότητα να συνομιλούν στα ελληνικά, το οποίο δημιούργησε μια δεμένη και αεικίνητη ομάδα ανθρώπων στο Ερευνητικό Κέντρο Αθηνά.
Τα μέλη αυτής της ομάδας θα έπρεπε να έχουν κανονικά τον πρώτο λόγο σε αυτή τη συνέντευξη, όμως πώς να προσπεράσει ή να αγνοήσει κανείς τον απόλυτο πρωταγωνιστή, δηλαδή το ίδιο το Llama-KriKri, το οποίο μπορεί να μην έχει στόμα, αλλά διαθέτει μιλιά.

Η ομάδα που δημιούργησε το πρώτο ελληνικό γλωσσικό μοντέλο ήδη έχει βάλει σκοπό της να φτιάξει ένα «κοπάδι» από Κρι Κρι. | Φωτογραφία: Νίκος Κόκκας
Το Κρι Κρι με δικά του λόγια
Τι είναι λοιπόν το Llama-KriKri με το ιντριγκαδόρικο όνομα και τις ακόμα πιο ευφυείς δυνατότητες; «Είμαι ένα μοντέλο Τεχνητής Νοημοσύνης, συγκεκριμένα ένα σύστημα συνομιλιακής αλληεπίδρασης (chatbot) με την ονομασία Κρι Κρι», απαντά το ίδιο, εκθέτοντας κατόπιν τις δυνατότητες και τις ικανότητές του (εκπαίδευση, σκοπό, κλπ) αλλά και τους περιορισμούς του.
Οπως λόγου χάρη ότι δε διαθέτει προσωπική άποψη και γνώμη, δεν μπορεί να υποκαταστήσει την ανθρώπινη κρίση, δεν καταλαβαίνει από συναισθήματα και ο γνωσιακός θησαυρός του φτάνει έως το 2024. Σε κάθε περίπτωση, όπως λέει, «είμαι εδώ για να σε βοηθήσω με κάθε νόμιμο και ηθικό τρόπο που μου ζητείται, πάντα εντός των δυνατοτήτων μου».
Εύλογα αναρωτιέται κανείς εάν το γλωσσικό μοντέλο, το οποίο βρέθηκε εκόν άκον σε ρόλο συνεντευξιαζόμενου, είναι αυτό που σε αδρές γραμμές θα μπορούσε να καταλάβει κανείς ως το ελληνικό αντίστοιχο των φωτογενέστερων τέκνων της Τεχνητής Νοημοσύνης, δηλαδή του αμερικανικού Chat GPT και του κινέζικου DeepSeek.

Πώς θα έμοιαζε το υβρίδιο που θα προέκυπτε από το πάντρεμα ενός Llama με ένα Κρι Κρι. Η φωτογραφία δημιουργήθηκε με τη χρήση τεχνητής νοημοσύνης
Αλλά αυτά καλύτερα να τα συζητήσει κανείς με την ομάδα των δημιουργών του ελληνικού γλωσσικού μοντέλου, η οποία απαρτίζεται από τους Λέων Βουκούτη, Δημήτρη Ρούσση, Σωκράτη Σοφιανόπουλο, Γιώργο Παρασκευόπουλο και Προκόπη Προκοπίδη και έχει ως επικεφαλής της τον διευθυντή του Ινστιτούτου Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου «Αθηνά» Βασίλη Κατσούρο.
Πώς το Llama έγινε Κρι Κρι
«Είναι ένα γλωσσικό μοντέλο το οποίο ξεκινάει απλά με το να εκπαιδεύεται σε μονόγλωσσα δεδομένα. Είναι ένα σύστημα τεχνητής νοημοσύνης που απαντά σε ερωτήσεις των χρηστών. Βασίστηκε στο Llama 3.1 έκδοση της META. Και εμείς συνεχίσαμε να το εκπαιδεύουμε σε ελληνικά δεδομένα και ελληνικά κείμενα. Και έτσι φτιάξαμε το Llama-KriKri», εξηγούν τα μέλη της ομάδας, τα οποία οφείλει να παρατηρήσει κανείς πως είναι η τέλεια ενσάρκωση του κλισέ που θέλει τα παρασκήνια να είναι καλά και αυτό να βγαίνει προς τα έξω.

Ο ερευνητής Γιώργος Παρασκευόπουλος. Φωτογραφία: Νίκος Κόκκας
«Πειραματιζόμαστε πολλές δεκαετίες σε αυτές τις τεχνολογίες. Και πλέον με τα νέα γλωσσικά μοντέλα δίνουμε ιδιαίτερη έμφαση στο πώς αυτές οι τεχνολογίες μπορούν να υποστηρίξουν τα ελληνικά. Σκοπός μας είναι να παράγουμε καλή γλωσσική τεχνολογία για τα ελληνικά. Αν δεν το κάνουμε μόνοι μας, δε θα το κάνει κάποιος άλλος για μας, οπότε η ομάδα εστίασε πάρα πολύ σε όλα τα στάδια της δημιουργίας και της αξιολόγησης αυτού του μοντέλου, στο πώς θα μπορούσε να είναι όσο το δυνατόν καλύτερο στην ελληνική γλώσσα», λένε.
Η δημιουργία ενός τέτοιου γλωσσικού μοντέλου απαιτεί εκτός από εργατοώρες – οφείλει κανείς να σημειώσει πως το Llama-KriKri είναι ένα side project, το οποίο οι ερευνητές της ομάδας δουλεύουν και εξελίσσουν παράλληλα με την εργασία τους στο Ινστιτούτο-, γνώση, υπολογιστική δύναμη και βέβαια χρηματοδότηση. Όμως, αλήθεια, σε τι μπορεί να χρησιμεύσει πρακτικά ένα τέτοιο μοντέλο τεχνητής νοημοσύνης, εκτός από να μας απασχολεί με την ψιλή κουβέντα που μπορούμε ανά πάσα στιγμή να του πιάσουμε – συχνά μάλιστα αποδίδοντάς του τιμές φωτεινού παντογνώστη;

Ο ερευνητής Σωκράτης Σοφιανόπουλος. Φωτογραφία: Νίκος Κόκκας
«Από τη στιγμή που έχει κανείς διαθέσιμο το μοντέλο και τις παραμέτρους του μπορεί να το προσαρμόσει και να το εξειδικεύσει πάνω στα δικά του δεδομένα. Αυτά μπορεί να είναι επιχειρηματικά, εμπορικά, εκπαιδευτικά, ιατρικά, νομικά, δημοσιογραφικά. Ή μπορεί κάποιος να το αξιοποιήσει για να παίξει ένα παιχνίδι ρόλων. Παρέχοντάς του νέα δεδομένα εκπαιδεύεται και προσαρμόζεται», επισημαίνουν τα μέλη της ομάδας. Είναι δηλαδή σαν το Κρι Κρι να περνά ένα στάδιο μετεκπαίδευσης, το οποίο στην πραγματικότητα δεν έχει ορίζοντα τέλους ή περιορισμούς.
Τα αριθμητικά δεδομένα δεν είναι ουρανομήκη μέχρι στιγμής, αλλά είναι σε κάθε περίπτωση ενθαρρυντικά. Μέσα σε κάτι περισσότερο από ένα μήνα που είναι διαθέσιμο, το γλωσσικό μοντέλο έχουν «κατεβάσει» 3.500 χρήστες ενώ ακόμα περισσότεροι επισκέπτονται την ιστοσελίδα της διεπαφής ανθρώπου με το Κρι Κρι (βλ. chat).
Ανθρωπος VS Μηχανής
Αναντίρρητα η διάδραση με ένα γλωσσικό μοντέλο και η (ψευδ)αίσθηση του διαλόγου που δημιουργεί στον χρήστη είναι γοητευτική, όπως οτιδήποτε μοιάζει να έρχεται με κεκτημένη ταχύτητα από το μέλλον. Υπάρχουν ωστόσο πράγματα που τρομάζουν ακόμα και τους ανθρώπους που φαίνεται να κρατούν τα ινία και να μπορούν να χαλιναγωγήσουν την τεχνητή νοημοσύνη;
«Τα συγκεκριμένα μοντέλα έχουν έρθει στη δημοσιότητα τα τελευταία τρία-τέσσερα χρόνια. Τώρα έχουμε αρχίσει και βλέπουμε πώς επηρεάζουν την καθημερινότητα. Για παράδειγμα δημοσιεύτηκε πρόσφατα ένα γράφημα το οποίο έδειχνε ότι έχουν μειωθεί οι αγγελίες για junior developers στις ΗΠΑ. Αυτό τι σημαίνει; Ότι δε θα προσλάβει κάποιος πλέον έναν junior developer για μια απλή δουλειά. Θα τη δώσει στη μηχανή.

Ο ερευνητής Λέων Βουκούτης. Φωτογραφία: Νίκος Κόκκας
Βρισκόμαστε σε μια περίοδο σαν εκείνη της βιομηχανικής επανάστασης. Κάποιες δουλειές θα εξαφανιστούν, κάποιες άλλες θα εμφανιστούν. Και ας μην ξεχνάμε πως οι άνθρωποι προσδίδουν και θεϊκές δυνατότητες στις μηχανές. Αυτός είναι μάλλον ένας παράλογος φόβος.
Είναι παράλογο να πιστεύουμε ότι οι μηχανές θα αποκτήσουν συνείδηση. Είναι μια ιδέα που καλλιεργείται για συγκεκριμένους λόγους από εταιρείες που θέλουν να επιβάλλουν τους δικούς τους όρους στην αγορά. Κατά τα άλλα, οι κίνδυνοι βρίσκονται ήδη εδώ», απαντούν.
Ένας από τους μείζονες κινδύνους ή τέλος πάντων ένα κομβικό ζήτημα είναι τα δεδομένα, όπως μου εξηγεί η ομάδα του Llama-Krikri, τα οποία δεν παράγουν πλέον μόνο οι άνθρωποι αλλά και οι μηχανές. «Η παραγωγή δεδομένων είναι στην πραγματικότητα ένα κοινωνικό θέμα. Το είδαμε πρώτη φορά με τη διάδοση των social media και τώρα εντείνεται ακόμα περισσότερο με παραγωγή δεδομένων –άρθρων, φωτογραφιών, βίντεο, ηχητικών, deepfakes – όχι μόνο από ανθρώπους αλλά και από μηχανές. Κι αυτό από μόνο του αυξάνει την πόλωση.

Ο ερευνητής Δημήτρης Ρούσσης. Φωτογραφία: Νίκκος Κόκκας
Καθένας κλείνεται στη φούσκα των δεδομένων που θέλει να πιστεύει. Όμως και πάλι το πρόβλημα δεν είναι η τεχνητή νοημοσύνη. Απλώς η μηχανή βοηθά να δημιουργηθεί περισσότερο και πιο γρήγορο περιεχόμενο, το οποίο όμως καθοδηγεί ο άνθρωπος. Η AI ναι μπορεί να βοηθήσει στην προπαγάνδα αλλά μπορεί και να βοηθήσει στην αποδόμηση ή την κατάρριψη της προπαγάνδας».
Τι «τρώει» το Κρι Κρι;
Συγκεκριμένα το Llama-KriKri έχει αντλήσει δεδομένα και πληροφορίες από οποιαδήποτε ανοιχτή πηγή ήταν διαθέσιμη και μπορούσε να χρησιμοποιηθεί. Το ελληνικό γλωσσικό μοντέλο έχει τραφεί με πληροφορία από μεγάλα data sets, με λήμματα από τη Wikipedia, με νόμους, με σχολικά βιβλία, με λογοτεχνία, τα οποία έχουν περάσει – πάλι βάση αλγορίθμου- από τη διαδικασία του «καθαρισμού». Έχει με άλλα λόγια αφαιρεθεί ό,τι θα μπορούσε να εκληφθεί ως υποκειμενικότητα ή προκατάληψη.

Ο φιλόλογος της ομάδας του Llama-KriKri Προκόπης Προκοπίδης. Φωτογραφία: Νίκος Κόκκας
Είμαστε όμως άραγε αρκετά εκπαιδευμένοι ώστε να αναγνωρίζουμε το ψέμα που μπορεί η τεχνολογία να μας σερβίρει ως πειστική αλήθεια; Πώς μπορεί να ξεχωρίσει κανείς την ήρα από στάρι;
«Προφανώς μαθαίνουμε εμπειρικά κι έτσι εκπαιδευόμαστε. Εκπαιδεύσαμε τις μηχανές και τώρα μας εκπαιδεύουν αυτές. Πάντως και στην Τεχνητή Νοημοσύνη είναι κυρίαρχο το προσωπικό στοιχείο, αυτό που μπορεί να εκληφθεί ως ή να θεωρηθεί προκατάληψη. Γιατί μπορεί να αφαιρούμε την προκατάληψη από τα δεδομένα, όμως η ανθρώπινη φύση περιέχει πάντα την υποκειμενικότητα», υπογραμμίζουν οι άνθρωποι της ομάδας.

Ο επικεφαλής του Ινστιτούτου Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά Βασίλης Κατσούρος. Φωτογραφία: Νίκος Κόκκας
Το Κρι Κρι είναι εκπαιδευμένο να μη λέει άσχημες λέξεις, να μην προτρέπει σε εγκληματικές ενέργειες ή σε ενέργειες που μπορεί να οδηγήσουν κάποιον να κάνει κακό στον εαυτό του. Όμως, όπως λένε οι ερευνητές του Ινστιτούτου, αυτό είναι κάτι που πολλές φορές μπορεί να επιστρέψει ως μπούμερανγκ. «Μπορεί για παράδειγμα να αντιπαραθέσει ότι με αυτόν τον τρόπο το μοντέλο δε γίνεται πολύ δημιουργικό ή είναι πολύ προβλέψιμο. Όμως θέλουμε να είναι ασφαλές για όλους. Αλλά και αυτό είναι τελικά μια ανθρώπινη απόφαση».