Llama-Krikri: Γνωρίσαμε τους ερευνητές πίσω από το πρώτο ελληνικό γλωσσικό μοντέλο τεχνητής νοημοσύνης

Περάσαμε μια ημέρα στο Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά και συνομιλήσαμε με την ομάδα που ανέπτυξε το Llama-KriKri, το φιλόδοξο ελληνικό γλωσσικό μοντέλο τεχνητής νοημοσύνης.

22.03.2025 10:30

Να αποσαφηνίσουμε εξαρχής κάτι. Αν και το κείμενο που πρόκειται να διαβάσετε θα μπορούσε να είχε γραφτεί με τη χρήση τεχνητής νοημοσύνης, στην πραγματικότητα δημιουργήθηκε με τον «πατροπαράδοτο», σχεδόν αναλογικό τρόπο.

Σαν μια ωδή στον παλιό κόσμο που μπορεί ακόμα να μην κινδυνεύει από εξαφάνιση, αλλά ήδη έχει αρχίσει να μπάζει νερά, και παρακολουθεί άλλοτε με αμηχανία, άλλες στιγμές με δέος και άλλες με προσμονή τα επιτεύγματα της τέταρτης βιομηχανικής επανάστασης. Αυτά που οι περισσότεροι χρησιμοποιούμε και απολαμβάνουμε, ενδεχομένως ακόμα και χωρίς να το ξέρουμε ή να το συνειδητοποιούμε.

Πρόκειται άλλωστε για ένα κείμενο που αφορά σε ένα από τα πρώτα μεγάλα γλωσσικά μοντέλα που μιλούν ελληνικά και έχουν τη δυνατότητα να συνομιλούν στα ελληνικά, το οποίο δημιούργησε μια δεμένη και αεικίνητη ομάδα ανθρώπων στο Ερευνητικό Κέντρο Αθηνά.

Τα μέλη αυτής της ομάδας θα έπρεπε να έχουν κανονικά τον πρώτο λόγο σε αυτή τη συνέντευξη, όμως πώς να προσπεράσει ή να αγνοήσει κανείς τον απόλυτο πρωταγωνιστή, δηλαδή το ίδιο το Llama-KriKri, το οποίο μπορεί να μην έχει στόμα, αλλά διαθέτει μιλιά.

Η ομάδα που δημιούργησε το πρώτο ελληνικό γλωσσικό μοντέλο ήδη έχει βάλει σκοπό της να φτιάξει ένα «κοπάδι» από Κρι Κρι. | Φωτογραφία: Νίκος Κόκκας

Το Κρι Κρι με δικά του λόγια

Τι είναι λοιπόν το Llama-KriKri με το ιντριγκαδόρικο όνομα και τις ακόμα πιο ευφυείς δυνατότητες; «Είμαι ένα μοντέλο Τεχνητής Νοημοσύνης, συγκεκριμένα ένα σύστημα συνομιλιακής αλληεπίδρασης (chatbot) με την ονομασία Κρι Κρι», απαντά το ίδιο, εκθέτοντας κατόπιν τις δυνατότητες και τις ικανότητές του (εκπαίδευση, σκοπό, κλπ) αλλά και τους περιορισμούς του.

Οπως λόγου χάρη ότι δε διαθέτει προσωπική άποψη και γνώμη, δεν μπορεί να υποκαταστήσει την ανθρώπινη κρίση, δεν καταλαβαίνει από συναισθήματα και ο γνωσιακός θησαυρός του φτάνει έως το 2024. Σε κάθε περίπτωση, όπως λέει, «είμαι εδώ για να σε βοηθήσω με κάθε νόμιμο και ηθικό τρόπο που μου ζητείται, πάντα εντός των δυνατοτήτων μου».

Εύλογα αναρωτιέται κανείς εάν το γλωσσικό μοντέλο, το οποίο βρέθηκε εκόν άκον σε ρόλο συνεντευξιαζόμενου, είναι αυτό που σε αδρές γραμμές θα μπορούσε να καταλάβει κανείς ως το ελληνικό αντίστοιχο των φωτογενέστερων τέκνων της Τεχνητής Νοημοσύνης, δηλαδή του αμερικανικού Chat GPT και του κινέζικου DeepSeek.

Πώς θα έμοιαζε το υβρίδιο που θα προέκυπτε από το πάντρεμα ενός Llama με ένα Κρι Κρι. Η φωτογραφία δημιουργήθηκε με τη χρήση τεχνητής νοημοσύνης

Αλλά αυτά καλύτερα να τα συζητήσει κανείς με την ομάδα των δημιουργών του ελληνικού γλωσσικού μοντέλου, η οποία απαρτίζεται από τους Λέων Βουκούτη, Δημήτρη Ρούσση, Σωκράτη Σοφιανόπουλο, Γιώργο Παρασκευόπουλο και Προκόπη Προκοπίδη και έχει ως επικεφαλής της τον διευθυντή του Ινστιτούτου Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου «Αθηνά» Βασίλη Κατσούρο.

Πώς το Llama έγινε Κρι Κρι

«Είναι ένα γλωσσικό μοντέλο το οποίο ξεκινάει απλά με το να εκπαιδεύεται σε μονόγλωσσα δεδομένα. Είναι ένα σύστημα τεχνητής νοημοσύνης που απαντά σε ερωτήσεις των χρηστών. Βασίστηκε στο Llama 3.1 έκδοση της META. Και εμείς συνεχίσαμε να το εκπαιδεύουμε σε ελληνικά δεδομένα και ελληνικά κείμενα. Και έτσι φτιάξαμε το Llama-KriKri», εξηγούν τα μέλη της ομάδας, τα οποία οφείλει να παρατηρήσει κανείς πως είναι η τέλεια ενσάρκωση του κλισέ που θέλει τα παρασκήνια να είναι καλά και αυτό να βγαίνει προς τα έξω.

Ο ερευνητής Γιώργος Παρασκευόπουλος. Φωτογραφία: Νίκος Κόκκας

«Πειραματιζόμαστε πολλές δεκαετίες σε αυτές τις τεχνολογίες. Και πλέον με τα νέα γλωσσικά μοντέλα δίνουμε ιδιαίτερη έμφαση στο πώς αυτές οι τεχνολογίες μπορούν να υποστηρίξουν τα ελληνικά. Σκοπός μας είναι να παράγουμε καλή γλωσσική τεχνολογία για τα ελληνικά. Αν δεν το κάνουμε μόνοι μας, δε θα το κάνει κάποιος άλλος για μας, οπότε η ομάδα εστίασε πάρα πολύ σε όλα τα στάδια της δημιουργίας και της αξιολόγησης αυτού του μοντέλου, στο πώς θα μπορούσε να είναι όσο το δυνατόν καλύτερο στην ελληνική γλώσσα», λένε.

Η δημιουργία ενός τέτοιου γλωσσικού μοντέλου απαιτεί, εκτός από εργατοώρες, μια αφοσιωμένη ομάδα με εξιδεικευμένη γνώση και πρόσβαση σε υπολογιστική ισχύ το κόστος της οποίας ανήλθε για το εν λόγω μοντέλο σε 150 χιλιάδες ευρώ. Όμως, αλήθεια, σε τι μπορεί να χρησιμεύσει πρακτικά ένα τέτοιο μοντέλο τεχνητής νοημοσύνης, εκτός από να μας απασχολεί με την ψιλή κουβέντα που μπορούμε ανά πάσα στιγμή να του πιάσουμε – συχνά μάλιστα αποδίδοντάς του τιμές φωτεινού παντογνώστη;

Ο ερευνητής Σωκράτης Σοφιανόπουλος. Φωτογραφία: Νίκος Κόκκας

«Από τη στιγμή που έχει κανείς διαθέσιμο το μοντέλο και τις παραμέτρους του μπορεί να το προσαρμόσει και να το εξειδικεύσει πάνω στα δικά του δεδομένα. Αυτά μπορεί να είναι επιχειρηματικά, εμπορικά, εκπαιδευτικά, ιατρικά, νομικά, δημοσιογραφικά. Παρέχοντάς του νέα δεδομένα εκπαιδεύεται και προσαρμόζεται», επισημαίνουν τα μέλη της ομάδας. Είναι δηλαδή σαν το Κρι Κρι να περνά ένα στάδιο μετεκπαίδευσης, το οποίο στην πραγματικότητα δεν έχει ορίζοντα τέλους ή περιορισμούς.

Τα αριθμητικά δεδομένα δεν είναι ουρανομήκη μέχρι στιγμής, αλλά είναι σε κάθε περίπτωση ενθαρρυντικά. Μέσα σε κάτι περισσότερο από ένα μήνα που είναι διαθέσιμο, το γλωσσικό μοντέλο έχουν «κατεβάσει» 3.500 χρήστες ενώ ακόμα περισσότεροι επισκέπτονται την ιστοσελίδα του chatbot.

Ανθρωπος VS Μηχανής

Αναντίρρητα η διάδραση με ένα γλωσσικό μοντέλο και η (ψευδ)αίσθηση του διαλόγου που δημιουργεί στον χρήστη είναι γοητευτική, όπως οτιδήποτε μοιάζει να έρχεται με κεκτημένη ταχύτητα από το μέλλον. Υπάρχουν ωστόσο πράγματα που τρομάζουν ακόμα και τους ανθρώπους που φαίνεται να κρατούν τα ινία και να μπορούν να χαλιναγωγήσουν την τεχνητή νοημοσύνη;

«Τα συγκεκριμένα μοντέλα έχουν έρθει στη δημοσιότητα τα τελευταία τρία-τέσσερα χρόνια. Τώρα έχουμε αρχίσει και βλέπουμε πώς επηρεάζουν την καθημερινότητα. Για παράδειγμα δημοσιεύτηκε πρόσφατα ένα γράφημα το οποίο έδειχνε ότι έχουν μειωθεί οι αγγελίες για junior developers στις ΗΠΑ. Αυτό τι σημαίνει; Ότι δε θα προσλάβει κάποιος πλέον έναν junior developer για μια απλή δουλειά. Θα τη δώσει στη μηχανή.

Ο ερευνητής Λέων Βουκούτης. Φωτογραφία: Νίκος Κόκκας

Βρισκόμαστε σε μια περίοδο σαν εκείνη της βιομηχανικής επανάστασης. Κάποιες δουλειές θα εξαφανιστούν, κάποιες άλλες θα εμφανιστούν. Και ας μην ξεχνάμε πως οι άνθρωποι προσδίδουν και “θεϊκές” δυνατότητες στις μηχανές. Αυτός είναι μάλλον ένας παράλογος φόβος.

Είναι παράλογο να πιστεύουμε ότι οι μηχανές θα αποκτήσουν συνείδηση. Είναι μια ιδέα που καλλιεργείται για συγκεκριμένους λόγους από εταιρείες που θέλουν να επιβάλλουν τους δικούς τους όρους στην αγορά. Κατά τα άλλα, οι κίνδυνοι βρίσκονται ήδη εδώ», απαντούν.

Ένας από τους μείζονες κινδύνους ή τέλος πάντων ένα κομβικό ζήτημα είναι τα δεδομένα, όπως μου εξηγεί η ομάδα του Llama-Krikri, τα οποία δεν παράγουν πλέον μόνο οι άνθρωποι αλλά και οι μηχανές. «Η παραγωγή δεδομένων είναι στην πραγματικότητα ένα κοινωνικό θέμα. Το είδαμε πρώτη φορά με τη διάδοση των social media και τώρα εντείνεται ακόμα περισσότερο με παραγωγή δεδομένων –άρθρων, φωτογραφιών, βίντεο, ηχητικών, deepfakes – όχι μόνο από ανθρώπους αλλά και από μηχανές. Κι αυτό από μόνο του αυξάνει την πόλωση.

Ο ερευνητής Δημήτρης Ρούσσης. Φωτογραφία: Νίκκος Κόκκας

Καθένας κλείνεται στη φούσκα των δεδομένων που θέλει να πιστεύει. Όμως και πάλι το πρόβλημα δεν είναι η τεχνητή νοημοσύνη. Απλώς η μηχανή βοηθά να δημιουργηθεί περισσότερο και πιο γρήγορο περιεχόμενο, το οποίο όμως καθοδηγεί ο άνθρωπος. Η AI ναι μπορεί να βοηθήσει στην προπαγάνδα αλλά μπορεί και να βοηθήσει στην αποδόμηση ή την κατάρριψη της προπαγάνδας».

Τι «τρώει» το Κρι Κρι;

Συγκεκριμένα το Llama-KriKri έχει αντλήσει δεδομένα και πληροφορίες από οποιαδήποτε ανοιχτή πηγή ήταν διαθέσιμη και μπορούσε να χρησιμοποιηθεί. Το ελληνικό γλωσσικό μοντέλο έχει τραφεί με πληροφορία από μεγάλα data sets, με λήμματα από τη Wikipedia, με νόμους, με σχολικά βιβλία, με λογοτεχνία, τα οποία έχουν περάσει – πάλι βάση αλγορίθμου- από τη διαδικασία του «καθαρισμού». Έχει με άλλα λόγια αφαιρεθεί ό,τι θα μπορούσε να εκληφθεί ως πόλωση ή προκατάληψη.

Ο ερευνητής και γλωσσολόγος της ομάδας του Llama-KriKri Προκόπης Προκοπίδης. Φωτογραφία: Νίκος Κόκκας

Είμαστε όμως άραγε αρκετά εκπαιδευμένοι ώστε να αναγνωρίζουμε το ψέμα που μπορεί η τεχνολογία να μας σερβίρει ως πειστική αλήθεια; Πώς μπορεί να ξεχωρίσει κανείς την ήρα από στάρι;

«Προφανώς μαθαίνουμε εμπειρικά κι έτσι εκπαιδευόμαστε. Εκπαιδεύσαμε τις μηχανές και τώρα μας εκπαιδεύουν αυτές. Πάντως και στην Τεχνητή Νοημοσύνη είναι κυρίαρχο το προσωπικό στοιχείο, αυτό που μπορεί να εκληφθεί ως ή να θεωρηθεί προκατάληψη. Γιατί μπορεί να αφαιρούμε την προκατάληψη από τα δεδομένα, όμως η ανθρώπινη φύση περιέχει πάντα την υποκειμενικότητα», υπογραμμίζουν οι άνθρωποι της ομάδας.

Ο επικεφαλής του Ινστιτούτου Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά Βασίλης Κατσούρος. Φωτογραφία: Νίκος Κόκκας

Το Κρι Κρι είναι εκπαιδευμένο να μη λέει άσχημες λέξεις, να μην προτρέπει σε εγκληματικές ενέργειες ή σε ενέργειες που μπορεί να οδηγήσουν κάποιον να κάνει κακό στον εαυτό του. Όμως, όπως λένε οι ερευνητές του Ινστιτούτου, αυτό είναι κάτι που πολλές φορές μπορεί να επιστρέψει ως μπούμερανγκ. «Μπορεί για παράδειγμα να αντιπαραθέσει ότι με αυτόν τον τρόπο το μοντέλο δε γίνεται πολύ δημιουργικό ή είναι πολύ προβλέψιμο. Όμως θέλουμε να είναι ασφαλές για όλους. Αλλά και αυτό είναι τελικά μια ανθρώπινη απόφαση».

Ακολούθησε το Βήμα στο Google news και μάθε όλες τις τελευταίες ειδήσεις.

Σχετικά άρθρα

Τι είναι τελικά η τεχνητή νοημοσύνη;

Το Κρι Κρι με δικά του λόγια

Πώς το Llama έγινε Κρι Κρι

Ανθρωπος VS Μηχανής

Τι «τρώει» το Κρι Κρι;

Τι είναι τελικά η τεχνητή νοημοσύνη;

Τεχνητή νοημοσύνη: Γιατί η ΕΕ είναι ο μεγάλος χαμένος – Πώς «έχασε το τρένο»

Τεχνητή Νοημοσύνη: Μπορεί η Ευρώπη να Ανταγωνιστεί τις ΗΠΑ και την Κίνα;

Τεχνητή Νοημοσύνη: Επενδύσεις 200 δισεκατομμυρίων στην ΑΙ ανακοίνωσε η ΕΕ

Η Ευρωπαϊκή Εισαγγελία και το άρθρο 86

5 το πρωί: Πέρασε ο προϋπολογισμός – Αδιέξοδο για την Ουκρανία – Ρύθμιση δανείων σε ελβετικό φράγκο

CNN: Κλίμα συγκρατημένης αισιοδοξίας για Ουκρανία και η στάση της Ρωσίας

Πλακιάς για Καρυστιανού: «Πλέον θα κρίνεται ως πολιτικός και όχι ως συγγενής»

Το καλύτερο video game του 2025 δεν είχε αντίπαλο

Πώς να αποζημιωθείτε από τις ανεπιθύμητες κλήσεις

Η συμφωνία Disney-OpenAI και ο υπαρξιακός κίνδυνος για το Χόλιγουντ

Μπορεί να εφαρμοστεί η απαγόρευση των social media στους ανηλίκους;

H Μαρέβα Μητσοτάκη συνάντησε την Πρώτη Κυρία της Σερβίας και ήταν η μία πιο κομψή από την άλλη - Grace

Ναταλία Καποδίστρια: Ποια είναι η ηθοποιός και τελευταία απόγονος του Ιωάννη Καποδίστρια - Grace

Σκέρτσος: Αν ικανοποιηθούν τα αιτήματα των αγροτών, θα πάμε σε αγροτικό Grexit

Το τελευταίο τρακτέρ, στην άκρη του μπλόκου

Χρυσές λίρες: Πλησιάζουν τα 1.000 ευρώ - Πού πωλούνται στην Ελλάδα [πίνακες]

Άννα Βίσση: Το ξέφρενο πάρτι για τα γενέθλια της αδερφής της- Στην παρέα της και η Δήμητρα Μέρμηγκα με τον Γιάν

ΗΠΑ: Σάλος με δηλώσεις της προσωπάρχη του Λευκού Οίκου - «Καίει» Τραμπ, Βανς, Μασκ, Μπόντι

«Ετοιμαστείτε για πόλεμο»: Η ρωσική απειλή και το τέλος της ειρήνης στην Ευρώπη

UEFA Ranking: Η χειμερινή αντεπίθεση του ελληνικού ποδοσφαίρου στην Ευρώπη

Ο Βαγγέλης Μαρινάκης αναλαμβάνει την ανακαίνιση του Παναθηναϊκού Σταδίου μέσω χορηγίας στην Ελληνική Ολυμπ

100 χρόνια Royal Ballet School

Φρανκ Γκέρι: Ο μαέστρος της αποδόμησης

Ονειρο στο κρίμα

Η επανάσταση της νευροτεχνολογίας

«Έως πότε θα εργάζομαι;» - Ένας εργατολόγος και 2 εργαζόμενοι συνταξιούχοι μιλούν στο ΒΗΜΑ

«Έως πότε θα εργάζομαι;» - Ένας εργατολόγος και 2 εργαζόμενοι συνταξιούχοι μιλούν στο ΒΗΜΑ

Από το «Varoufakis effect» στην εκλογή Πιερρακάκη - Πώς έπεισε τους ομολόγους

Μπορεί να βγει από τον πάγο ο ελληνοτουρκικός διάλογος;

Αλλάζουν όλα με την γρίπη: Συναγερμός για το «Κ», πόσο μας καλύπτει το εμβόλιο

Το παρασκήνιο για τους Ευρωπαίους Εισαγγελείς

Ο «Daniel» δεν έφυγε ποτέ από τη Θεσσαλία: Κενές υποσχέσεις, περικοπές και αδρανή κονδύλια

Πολύτεκνη οικογένεια στην Ελλάδα «έπληξε» το εισαγόμενο από τη Δανία γονίδιο ΤΡ53

Αλαβάνος: «Ακραίο λάθος ο Τσίπρας» - Απαντά στην «Ιθάκη» με Ομηρο

Το βραβείο στον Τραμπ και το… ταμείο της FIFA

«Στον θεό» η τιμή στο μοσχάρι - Ο μεγάλος κερδισμένος

Αλέξανδρος Εξάρχου: Το LNG είναι η ευκαιρία της Ελλάδας

«Λένε ότι είναι ανοιχτοί στη συζήτηση, αλλά μας απειλούν με δικογραφίες»

Στρατός του ΝΑΤΟ στο χωριό του Άη Βασίλη

Τι λένε στην πόλη για τους αγρότες - Eνα «μικρό success story» και ο ελέφαντας στο δωμάτιο

ΠαΣοΚ: Δίπλα από τα τρακτέρ και μακριά από τον Τσίπρα

Περιμένοντας μια σύγχρονη αγροτική μεταρρύθμιση - Σε κίνδυνο η επισιτιστική ασφάλεια

Ειδήσεις

Συνδρομές

International Edition

Γνώμες

Μόνο στο Βήμα

ΒΗΜΑgazino

Grace

Podcasts

Videos

Newsletters

Special Editions