Siri, το «τζίνι» του κινητού

Με τη φωνητική επικοινωνία που μετατρέπει το κινητό σε «γραμματέα», ο Στιβ Τζομπς άφησε την πιο ενδιαφέρουσα κληρονομιά στην τεχνολογία αιχμής. Μπορεί το νέο 4S να μην εντυπωσίασε εκ πρώτης όψεως, αλλά το λογισμικό Siri που φιλοξενεί είναι το νέο... τζίνι

Καθ’ όσον «οι νεκροί δεδικαίωνται», ειπώθηκαν και γράφτηκαν πολλά για τον ιδρυτή και ηγέτη της Apple, τον Στιβ Τζομπς. Τόσο πολλά ώστε, ακόμη και στη χλιδόπτωχη χώρα μας, έφτασαν να πουν ότι «έδωσε στον λαό συσκευές με άψογη ποιότητα και design» – λες και τα Macintosh, τα Macbook ή τα iPhone ήταν για τις τσέπες όλων… Ποια είναι η αλήθεια; Στην πλησιέστερη εκδοχή της, μάλλον είναι αυτή που μου εκμυστηρεύτηκε ο συνεταίρος του στην ίδρυση της Apple, o Στιβ Βόζνιακ, σε συνέντευξή του στις 14 Ιουνίου 2007: Ο Τζομπς μπορεί να μην είχε τις γνώσεις ηλεκτρονικής του Βόζνιακ ή τις γνώσεις προγραμματισμού του Μπιλ Γκέιτς αλλά είχε ως αξίωμα την αισθητική αρμονία και ένα όραμα τελειότητας. Υπηρετώντας την πρώτη και κυνηγώντας τη δεύτερη, κατόρθωνε πάντοτε να παράγει προϊόντα που οι άνθρωποι δεν ζητούσαν ενσυνείδητα και εκ των προτέρων αλλά θα ήθελαν σίγουρα να αποκτήσουν εκ των υστέρων. Το αν θα μπορούσαν να τα αποκτήσουν όλοι ήταν δευτερεύουσας σημασίας για τον δαιμόνιο Συροαμερικανό.

Το ότι αυτή η «αλήθεια» είναι ίσως η πιο ταιριαστή για τον Τζομπς φαίνεται με μια ματιά στο τελευταίο προϊόν που μας παρέδωσε: το iPhone 4s – που δεν πρόλαβε να παρουσιάσει ο ίδιος, στις 4 Οκτωβρίου 2011 – έχει ως κύριο νέο χαρακτηριστικό του την ενσωμάτωση στο λειτουργικό του σύστημα ενός προγράμματος τεχνητής νοημοσύνης, του Siri, που δρα ως… τζίνι, που «του μιλάς και σε υπακούει». Και αν κοιτάξουμε στα πιο πριν, στα όσα εισήγαγε και καθιέρωσε στην πληροφορική ο Τζομπς από το 1975 ως το 2011, θα δούμε τη σταδιακή προσέγγισή του στο θέμα της διεπαφής (interface): πληκτρολόγιο, ποντίκι, οθόνη αφής, φωνή. Μα, ναι! Ο άνθρωπος αυτός είχε συλλάβει τον πραγματικό πόθο του ανθρώπου. Είμαστε φτιαγμένοι για να επικοινωνούμε εν μέρει με τα χέρια και κυρίως με τη φωνή μας. Οι υπολογιστές και τα τηλέφωνα ποτέ δεν θα γίνονταν πραγματικοί «βοηθοί μας» αν δεν έφταναν στο τελευταίο αυτό σκαλοπάτι διεπαφής, τη φωνητική επικοινωνία. Και αυτό είναι που τελικά κληροδότησε στην ανθρωπότητα του 21ου αιώνα ο Στιβ Τζομπς.


Γραμματέας στο τηλέφωνο

Ο τρόπος «επίκλησης του τζίνι» στο νέο iPhone είναι κάτι που μπορούμε όλοι να δούμε στο YouTube (www.youtube.com/watch?v=nZSkvwpBBok). Συνοπτικά, είναι σαν να χειρίζεσαι με φυσική γλώσσα (τα αγγλικά, στην αρχή τουλάχιστον) μια «έξυπνη Google», που αντιλαμβάνεται τι ζητάς, το βρίσκει και σου αντιπροτείνει περαιτέρω ενέργειες. Η «εξυπνάδα» του Siri έχει ως αφετηρία τα στοιχεία ιδιοκτησίας που του δίνεις (ονοματεπώνυμο, διεύθυνση) και ως πεδίο δράσης τις πληροφορίες που αποθησαυρίζουν από το Διαδίκτυο οι μηχανές αναζήτησης, σε λέξεις, αριθμούς, εικόνες και χάρτες. Επαυξάνεται προοδευτικά μαθαίνοντας από τις ερωτήσεις και τις επιλογές απαντήσεων που κάνεις.

Εκείνο που δεν φαίνεται αμέσως είναι πως το Siri ήταν διαθέσιμο επί δύο μήνες δωρεάν στο διαδικτυακό κατάστημα εφαρμογών του iPhone, αυτοπεριγραφόμενο ως Ιδεατός Προσωπικός Βοηθός (Virtual Personal Assistant – VPA). Οπως και το ότι μόλις πέρυσι τον Απρίλιο ο Τζομπς έπεισε το διοικητικό συμβούλιο της Apple να εξαγοράσει την κατασκευάστρια εταιρεία έναντι περίπου 200 εκατ. δολαρίων. Οπότε, για να μάθουμε το πώς φτιάχτηκε το «τζίνι», δεν μας αρκεί να γνωρίζουμε πως η Apple το ονειρευόταν από το 1987 (βλ. https://en.wikipedia.org/wiki/Knowledge_Navigator). Θα πρέπει να πάμε στο 2003 και στη… ΓΓΕΤ του Πενταγώνου, την περίφημη DARPA. Διότι, απλά, «πόλεμος πατήρ πάντων».


Από τα πεδία της μάχης

Η τεχνητή νοημοσύνη, αυτό το πολυδιαφημισμένο υβρίδιο επιστημών μεταξύ πληροφορικής, ψυχολογίας και γλωσσολογίας, είναι κάτι που εμφάνιζε μεμονωμένες επιτυχίες και σε άκρως εξειδικευμένους τομείς ενόσω το χρηματοδοτούσαν μόνο η ακαδημαϊκή έρευνα και οι ενδιαφερόμενες επιχειρήσεις. Οταν όμως ο «πόλεμος εναντίον του Κακού» έστειλε τα αμερικανικά στρατεύματα στα εδάφη της βαβυλωνιακής αυτοκρατορίας, η αναγκαιότητα ενός «φωνητικού βοηθού» για την επικοινωνία του στρατιώτη με τους «αυτόχθονες» άνοιξε την τσέπη του Πενταγώνου. Η DARPA είχε ήδη στα σκαριά το ερευνητικό πρόγραμμα PAL (the Personalized Assistant that Learns), οπότε ευχαρίστως το επεξέτεινε στο CALO (Cognitive Assistant that Learns and Organizes), δανειζόμενη το όνομα από το ελληνικότατης προέλευσης «καλλονίς», που στην αργκό της ρωμαϊκής λεγεώνας σήμαινε… ορντινάτσα του λεγεωναρίου.

Το CALO ανέλαβε να διαχειριστεί η εταιρεία ερευνών SRI International, από το Menlo Park της Καλιφόρνιας. Απασχόλησε 300 ερευνητές από τα κορυφαία 25 πανεπιστήμια των ΗΠΑ, με στόχο «να κατασκευάσουν μια νέα γενιά γνωστικών βοηθών που θα μπορούν να εκλογικεύσουν, να μαθαίνουν από την εμπειρία, να ακούνε το τι έχουν να κάνουν, να εξηγούν τι είναι αυτό που κάνουν, να προβληματίζονται από την εμπειρία τους και να ανταποκρίνονται δυναμικά στην έκπληξη». Το έργο ολοκληρώθηκε το 2007, με μόνη γνωστή μας απόρροια τους «προσωπικούς μεταφραστές» που απέκτησαν οι στρατιώτες των ΗΠΑ στο Ιράκ και στο Αφγανιστάν. Ομως το στέλεχος της SRI Νόρμαν Βινάρσκι (Norman Winarsky) σκέφθηκε ότι ένας Προσωπικός Βοηθός θα είχε απίστευτες ευκαιρίες επιτυχίας και στην ευρύτερη αγορά, οπότε άρχισε να συγκεντρώνει επενδυτικά κεφάλαια και στελέχη για μια νέα εταιρεία. Για τη φωνητική διεπαφή συσκευής – ανθρώπου διασφάλισε τη συνεργασία μιας άλλης εταιρείας που είχε εκκολαφθεί το 1995 στην SRI, της Nuance. To τόλμημα απέφερε γρήγορα καρπούς και είχαν φτάσει στα 19 άτομα προσωπικό… όταν η Apple ενέσκηψε με τα εκατομμύριά της και τους εξαγόρασε. Ο Bινάρσκι παρέμεινε στην SRI, αλλά τρεις από τους πρωτεργάτες της κίνησης εργάζονται πλέον στην Apple.


«Θα αλλάξει τον κόσμο»

Οταν ρωτήθηκε πρόσφατα ο Βινάρσκι από το διαδικτυακό περιοδικό 9to5mac. com πόσο σημαντική θεωρεί ότι είναι η ενσωμάτωση του Siri στο iPhone 4s, απάντησε: «Η εκ μέρους της Apple “μαζικοποίηση” της τεχνητής νοημοσύνης υπό τη μορφή ενός Ιδεατού Προσωπικού Βοηθού είναι μια ριζοσπαστική κίνηση. Θα έφτανα να πω ότι είναι ένα γεγονός που θα αλλάξει τον κόσμο. Ως τώρα κάποιοι άνθρωποι είχαν γευτεί εφαρμογές μερικής τεχνητής νοημοσύνης, όπως το Google Voice Actions, το Vlingo ή το Nuance Go. Το Siri ήταν πολλά βήματα μπροστά από τις τεχνολογίες αυτές, τουλάχιστον πριν από δύο χρόνια που το άφησα. Αυτό είναι πραγματική τεχνητή νοημοσύνη με πραγματική εφαρμογή στην αγορά. Αν οι φήμες είναι αληθινές, η Apple θα δώσει τη δυνατότητα σε εκατομμύρια και εκατομμύρια ανθρώπους να αλληλεπιδρούν με μηχανές μέσω φυσικής γλώσσας. Το ότι ο φωνητικός βοηθός θα φέρνει αποτελέσματα είναι μόνο η κορυφή του παγόβουνου. Μιλάμε για μια άλλη επανάσταση της τεχνολογίας. Μια νέα εποχή των υπολογιστών».

a.kafantaris@gmail.com

Ακολούθησε το Βήμα στο Google news και μάθε όλες τις τελευταίες ειδήσεις.