Γεώργιος Μπαρμπαστάθης: Η αξιοπιστία των μοντέλων εξαρτάται από τα δεδομένα που τους παρέχουμε

Ο έλληνας καθηγητής του ΜΙΤ ανέπτυξε έναν κώδικα μηχανικής μάθησης για την πρόβλεψη της εξάπλωσης του SARS-CoV-2 και εξηγεί τις προϋποθέσεις για να είναι τα μοντέλα αξιόπιστα

Είναι από τους πιο στενούς «συνεργάτες» των επιστημόνων και των κυβερνήσεων παγκοσμίως στην καθημερινή μάχη τους με τον νέο κορωνοϊό. Συνεργάτες που αν και δεν έχουν… στόμα να μιλήσουν, «λένε» πολλά για την εξέλιξη της πανδημίας σε παγκόσμιο αλλά και τοπικό επίπεδο και αποτελούν βασικό «πυλώνα» πάνω στον οποίο χτίζονται οι στρατηγικές για την αντιμετώπιση του ιογενούς εχθρού αλλά και για την επάνοδο στη… νέα (ημι)κανονικότητα που θα βιώσουμε και εμείς από αύριο. Είναι τα μαθηματικά μοντέλα που αποτελούν «πυξίδα» για τους ειδικούς και τα οποία πρέπει να είναι όσο πιο ακριβή και προηγμένα γίνεται ώστε να κάνουν καλά τη δουλειά τους. Ενα τέτοιο άκρως προηγμένο «πανδημικό μοντέλο» ανέπτυξαν ερευνητές του Ινστιτούτου Τεχνολογίας της Μασαχουσέτης (του γνωστού ΜΙΤ) με επικεφαλής τον έλληνα καθηγητή του Τμήματος Μηχανολόγων Μηχανικών κ. Γεώργιο Μπαρμπαστάθη. Το μοντέλο αυτό «παντρεύει» τα δεδομένα της πανδημίας του SARS-CoV-2 με τη μηχανική μάθηση και μέχρι στιγμής έχει δώσει πολύ ενδιαφέρουσες πληροφορίες και προβλέψεις σχετικά με την εξέλιξη της ιο-κατάστασης σε διαφορετικές χώρες. Ο κ. Μπαρμπαστάθης μίλησε στο ΒΗΜΑ-Science για τα όσα πολύτιμα μας μαθαίνει η… μηχανική μάθηση σχετικά με την αποτελεσματικότητα των μέτρων που έχουν ληφθεί για την αντιμετώπιση του νέου κορωνοϊού αλλά και την εξάπλωσή του. Μεταξύ άλλων πολύ σημαντικών κρατήστε αυτό: για να είναι ένα μαθηματικό μοντέλο σχετικά με την πανδημία όσο πιο αξιόπιστο γίνεται – ώστε να προσφέρει και αξιόπιστες πληροφορίες για το τι πρέπει να πράξουν όσοι χαράζουν τη στρατηγική της επόμενης μέρας – χρειάζεται να βασίζεται σε εκτεταμένο διαγνωστικό έλεγχο του πληθυσμού προκειμένου οι χώρες να γνωρίζουν τι συμβαίνει με τη διασπορά του ιού στην κοινότητα. Διαφορετικά, οποιαδήποτε άρση των μέτρων καραντίνας μπορεί να είναι πρόωρη και να σημάνει ένα δεύτερο κύμα εξάπλωσης του ιού και ένα νέο lockdown. Ακρως επίκαιρο διά στόματος ενός ειδήμονα των μοντέλων!

 

Εξειδίκευση και κατηγοριοποίηση

Το τελευταίο διάστημα η ζωή μας έχει γεμίσει με πίνακες και γραφήματα που αναπαριστούν την καμπύλη εξάπλωσης του νέου κορωνοϊού ανά τον κόσμο αλλά και στην κάθε χώρα. Ωστόσο, όπως επεσήμανε ο έλληνας καθηγητής, τα περισσότερα από αυτά τα μοντέλα έχουν αναπτυχθεί με χρήση δεδομένων που αφορούσαν προηγούμενα ξεσπάσματα συγγενών ιών του νέου κορωνοϊού, όπως ο ιός του SARS και του MERS. «Το δικό μας μοντέλο βασίζεται σε δεδομένα σχετικά με τον νέο κορωνοϊό SARS-CoV-2 και ενσωματώνει δύο πεδία: τη μηχανική μάθηση και την επιδημιολογία».

Το επιδημιολογικό μοντέλο που χρησιμοποιήθηκε, εξήγησε ο δρ Μπαρμπαστάθης, είναι ένα από τα πιο βασικά επιδημιολογικά μοντέλα για τη μελέτη ενός πληθυσμού υπό την έξαρση μιας νόσου. Το ακρωνύμιό του είναι S.E.I.R. ή S.I.R., το οποίο προκύπτει από τις ομάδες του πληθυσμού που αναλύονται: πρόκειται για τους επιδεκτικούς στη νόσο (Susceptible), τους εκτεθειμένους σε αυτή (Exposed), τoυς μολυσμένους (Infected) και αυτούς που έχουν αναρρώσει (Recovered). «Στο βασικό αυτό επιδημιολογικό μοντέλο προσθέσαμε μια παράμετρο που μοντελοποιεί τον πληθυσμό των μολυσμένων με τον ιό ατόμων που βρίσκονται σε καραντίνα και έτσι δεν μπορούν να μεταδώσουν τον ιό σε άλλα άτομα. Εκπαιδεύσαμε ένα νευρωνικό δίκτυο ώστε να υπολογίσει τον αριθμό αυτών των ατόμων, καθώς ήταν προφανώς διαφορετικός από μια περιοχή σε άλλη».

 

Φοιτητική πρωτοπορία

Η προηγμένη αυτή δουλειά πήρε «σάρκα και οστά» σε συνεργασία με τον Ρατζ Ντάντεκαρ, υποψήφιο διδάκτορα στο Τμήμα Πολιτικών Μηχανικών και Περιβαλλοντικής Μηχανικής του ΜΙΤ. Ολα ξεκίνησαν στο πλαίσιο μιας εργασίας που έπρεπε να φέρουν εις πέρας οι φοιτητές του καθηγητή Μπαρμπαστάθη στο Μάθημα 2.168 (Learning Machines). Στις αρχές του περασμένου Φεβρουαρίου, καθώς τα νέα για τον SARS-CoV-2 είχαν ήδη αρχίσει να δείχνουν ότι επρόκειτο για μια σημαντική ιογενή απειλή, ο έλληνας καθηγητής πρότεινε μια εργασία για τον κορωνοϊό στους φοιτητές του. Στο συγκεκριμένο μάθημα, στο τέλος του κάθε εξαμήνου, οι φοιτητές καλούνται να αναπτύξουν ένα μοντέλο και έναν αλγόριθμο μηχανικής μάθησης για ένα αληθινό πρόβλημα του αληθινού κόσμου. Αυτή τη φορά ο δρ Μπαρμπαστάθης πρότεινε σε μια ομάδα φοιτητών να προσπαθήσουν να αναπτύξουν ένα μοντέλο μέσω του οποίου θα χαρτογραφούσαν την εξάπλωση του νέου κορωνοϊού στην Ουχάν της Κίνας, από όπου και ξεκίνησε η πανδημία. «Οι φοιτητές άδραξαν αμέσως την ευκαιρία να εργαστούν επάνω στον κορωνοϊό. Εδειξαν ζέση να βρουν λύση στο πρόβλημα… α λα ΜΙΤ» σημείωσε ο καθηγητής.

Ενας από αυτούς τους φοιτητές ήταν ο Ντάντεκαρ. Οπως σχολίασε σε σχετικό δελτίο Τύπου του ΜΙΤ, «η εργασία μού φάνηκε άκρως ενδιαφέρουσα καθώς θα μπορούσα να εφαρμόσω το νέο πεδίο της μηχανικής μάθησης για ένα άκρως επείγον πρόβλημα δημόσιας υγείας». Καθώς όμως οι ημέρες περνούσαν ο νέος κορωνοϊός αποδείχθηκε ότι δεν αποτελούσε μόνο κινεζικό αλλά παγκόσμιο πρόβλημα. Ετσι, η φοιτητική εργασία έλαβε έναν πολύ πιο ευρύ χαρακτήρα – εκτός από την Ουχάν περιελήφθησαν τελικώς για ανάλυση σχετικά με την εξάπλωση του ιού η Ιταλία, η Νότια Κορέα και οι ΗΠΑ – τέσσερα διαφορετικά σημεία του πλανήτη όπου υπήρξε και πολύ διαφορετική απόκριση στην πανδημία σε ό,τι αφορούσε τον χρόνο που αποφασίστηκε η λήψη μέτρων. «Για να τρέξουμε το μοντέλο καταφέραμε να έχουμε πρόσβαση σε δεδομένα από δημόσιες πηγές» υπογράμμισε ο καθηγητής.

Διδάσκοντας νευρωνικά δίκτυα

Συγκεκριμένα, το ντουέτο του ΜΙΤ ξεκίνησε την μοντελοποίηση της εξάπλωσης του ιού μετά την καταγραφή του πεντακοσιοστού κρούσματος σε καθεμία από αυτές τις περιοχές. Οι δύο ερευνητές έχοντας στα χέρια τους ακριβή δεδομένα από την κάθε χώρα χρησιμοποίησαν το βασικό επιδημιολογικό μοντέλο S.E.I.R. και το ενίσχυσαν με ένα νευρωνικό δίκτυο το οποίο «διδάσκεται» πώς τα μολυσμένα με τον ιό άτομα που βρίσκονται σε καραντίνα επιδρούν στον ρυθμό εξάπλωσης της επιδημίας. Το νευρωνικό δίκτυο… πήρε το μάθημά του μέσα από 500 επαναλήψεις ώστε να μπορεί μετά να προβλέπει μοτίβα στην εξάπλωση της νόσου COVID-19.

Τι έδειξε λοιπόν η ανάλυση η οποία είναι διαθέσιμη στην πλατφόρμα ανοιχτής πρόσβασης medRxiv (https://doi.org/10.1101/2020.04.03.20052084); «Ανακαλύψαμε ότι το μοντέλο της καραντίνας που εφαρμόσαμε μπορεί να προβλέψει με επιτυχία το πότε σταματά η διασπορά του ιού ανάλογα με τις διαφορετικές στρατηγικές που ακολουθούνται στις τέσσερις περιοχές που μελετήσαμε. Η τελευταία πρόβλεψη που δημοσιεύσαμε βασίστηκε σε δεδομένα που αφορούσαν την 5η Απριλίου».

Επιβεβαίωση προβλέψεων

Συγκεκριμένα, σύμφωνα με το μοντέλο, σε χώρες όπως η Νότια Κορέα όπου υπήρξε άμεση παρέμβαση και εφαρμογή ισχυρών μέτρων καραντίνας η εξάπλωση του ιού σταθεροποιήθηκε ταχύτερα. Σε χώρες όπως η Ιταλία και οι ΗΠΑ όπου οι κυβερνήσεις καθυστέρησαν να λάβουν μέτρα, ο βασικός αριθμός αναπαραγωγής R0 (o αριθμός δηλαδή των νέων κρουσμάτων που προκαλεί ένα μολυσμένο άτομο) παρέμενε μεγαλύτερος του 1, γεγονός που μεταφραζόταν σε συνέχιση της εκθετικής εξάπλωσης του ιού. Με βάση τον αλγόριθμο μηχανικής μάθησης των ερευνητών και λαμβάνοντας υπόψη τα μέτρα καραντίνας που είχαν ληφθεί τόσο στην Ιταλία όσο και στις ΗΠΑ, η εξάπλωση του ιού υπολογίστηκε ότι έφθασε στο ανώτατο σημείο της και σταθεροποιήθηκε στις δύο αυτές χώρες μεταξύ 15 και 20 Απριλίου – υπολογίστηκε μάλιστα πως σε ό,τι αφορούσε συγκεκριμένα τις ΗΠΑ τα κρούσματα θα έπρεπε να αγγίξουν τις 600 χιλιάδες προτού φθάσει η εξομάλυνση της καμπύλης. Υπογραμμίζεται ότι η πρόβλεψη αυτή ήταν παρόμοια με εκείνες άλλων επιστημόνων όπως του Ινστιτούτου Μέτρησης και Αξιολόγησης της Υγείας (Institute for Health Metrics and Evaluation, IHME). «Το μοντέλο μας έδειξε ότι οι περιορισμοί επιτυγχάνουν να μειώσουν τον βασικό αριθμό αναπαραγωγής από μεγαλύτερο του 1 σε μικρότερο του 1» είπε ο δρ Μπαρμπαστάθης. «Αυτό αντιστοιχεί στο σημείο όπου επιτυγχάνεται εξομάλυνση της επιδημικής καμπύλης (flattening the curve) και αρχίζουμε να βλέπουμε λιγότερα κρούσματα». Ετσι το μοντέλο απέδειξε άμεση σύνδεση μεταξύ μέτρων καραντίνας και μείωσης του βασικού αριθμού αναπαραγωγής του ιού. Στο πλαίσιο αυτό, θα σχολιάσουμε εμείς, τα έγκαιρα μέτρα που ελήφθησαν στην Ελλάδα φαίνεται να… δικαιώνονται.

Και τώρα;

Ωστόσο τώρα βρισκόμαστε πλέον σε μια περίοδο κατά την οποία ολοένα και περισσότερες χώρες σχεδιάζουν τη χαλάρωση των αυστηρών μέτρων – στην Ελλάδα η σταδιακή άρση τους ξεκινά από αύριο. Σύμφωνα πάντως με τους ερευνητές του ΜΙΤ, υπάρχουν μεγάλοι κίνδυνοι που μπορούν να προκύψουν αν τα μέτρα χαλαρώσουν… πριν την ώρα τους. Ρωτήσαμε λοιπόν τον κ. Μπαρμπαστάθη, με δεδομένο ότι ο σχεδιασμός για τέτοιου είδους ζωτικής σημασίας αποφάσεις που αφορούν τη δημόσια υγεία βασίζεται σε μεγάλο βαθμό στα μαθηματικά μοντέλα, πώς μπορούμε να γνωρίζουμε ότι το μοντέλο που χρησιμοποιείται σε μια χώρα για να ληφθεί απόφαση χαλάρωσης μέτρων είναι αξιόπιστο και ότι ακολουθώντας το θα μπορέσουμε να αποφύγουμε μια «αναζωπύρωση» της επιδημίας του νέου κορωνοϊού. «Θα έλεγα ότι σε γενικό πλαίσιο οποιοδήποτε μοντέλο καθίσταται πιο αξιόπιστο αν διευρυμένος διαγνωστικός έλεγχος στον πληθυσμό έχει επαληθεύσει ότι ο αναφερόμενος αριθμός των θετικών στον ιό ατόμων σε μια χώρα είναι ακριβής. Το ίδιο ισχύει και σε ό,τι αφορά τη χαλάρωση των μέτρων της καραντίνας. Σε αντίθετη περίπτωση, αν για παράδειγμα ένας μεγάλος αριθμός θετικών στον ιό αλλά ασυμπτωματικών φορέων του δεν έχει ανιχνευθεί, τότε η χαλάρωση των μέτρων κρύβει τον κίνδυνο αυτοί οι άνθρωποι που είναι μολυσμένοι αλλά δεν το γνωρίζουν να ξεκινήσουν ένα νέο κύμα κρουσμάτων. Και αν αυτό συμβεί, τότε ίσως κριθεί απαραίτητο ένα δεύτερο lockdown. Η περίπτωση του Χοκάιντο στην Ιαπωνία είναι προφανώς ένα τέτοιο παράδειγμα που πρέπει όλοι να λάβουμε υπόψη μας». Να αναφέρουμε εδώ ότι το μικρό αυτό νησί της Ιαπωνίας θεωρήθηκε αρχικώς ως ένα success story στην αντιμετώπιση του SARS-CoV-2 καθώς μετά την εμφάνιση του νέου κορωνοϊού προχώρησε γρήγορα σε επιβολή αυστηρών μέτρων για τον περιορισμό της εξάπλωσής του – ήταν η πρώτη περιοχή της Ιαπωνίας που κήρυξε κατάσταση έκτακτης ανάγκης στα τέλη Φεβρουαρίου. Το αποτέλεσμα ήταν ότι μέσα σε περίπου 15 ημέρες ο αριθμός των νέων επιβεβαιωμένων κρουσμάτων μειώθηκε σε ένα με δύο ημερησίως. Ετσι στις 19 Μαρτίου έγινε άρση της κατάστασης έκτακτης ανάγκης και τα σχολεία άνοιξαν στις αρχές Απριλίου. Ωστόσο τρεις εβδομάδες αργότερα η περιοχή κηρύχθηκε και πάλι σε κατάσταση έκτακτης ανάγκης καθώς άρχισαν να καταγράφονται δεκάδες νέα κρούσματα καθημερινά, τα οποία μάλιστα δεν ήταν «εισαγόμενα» (σε αντίθεση με το πρώτο κύμα της επιδημίας). Πού αποδόθηκε αυτό το πρώην success story που φαίνεται τώρα να στέφεται με… αποτυχία; Στο ότι η άρση των μέτρων δεν συνοδεύθηκε από εκτεταμένους διαγνωστικούς ελέγχους στον πληθυσμό ώστε να αποδειχθεί η διασπορά του ιού στην κοινότητα…

Το κλειδί πρόβλεψης και ο ελεύθερος κώδικας

Και αυτή η «σιωπηλή» εξάπλωση του ιού στον πληθυσμό μέσω των ασυμπτωματικών φορέων του φαίνεται ότι αποτελεί ένα πολύ σημαντικό «κλειδί». Είναι το «κλειδί» που, κατά τον δρα Μπαρμπαστάθη, μπορεί να προσφέρει και στα μαθηματικά μοντέλα, όπως το δικό του, την ικανότητα να προβλέψουν πότε ένα δεύτερο κύμα του ιού μπορεί να «χτυπήσει» μια περιοχή. «Το μοντέλο μας δεν λαμβάνει αυτή τη στιγμή υπόψη τα ασυμπτωματικά άτομα, για τον προφανή λόγο ότι τέτοια δεδομένα είναι δύσκολο να βρεθούν με βάση αξιόπιστες πηγές. Αν ο διαγνωστικός έλεγχος στον πληθυσμό γίνει πολύ πιο ευρύς σε σύγκριση με σήμερα σε συνδυασμό με ακριβή αναφορά του αριθμού των θετικών στον ιό ατόμων και των ασυμπτωματικών φορέων, θα καταστεί δυνατόν να προβλέπουμε με το μοντέλο μας ένα ενδεχόμενο δεύτερο κύμα της επιδημίας».

Παρότι ο δρ Μπαρμπαστάθης επεσήμανε ότι στο μοντέλο του δεν έτρεξαν δεδομένα σχετικά με τη χώρα μας, οπότε δεν μπορούν να εξαχθούν και ελληνικά συμπεράσματα, προσέθεσε ότι «ο κώδικάς μας είναι διαθέσιμος online και καλούμε τους επιστήμονες ανά τον κόσμο να τον δοκιμάσουν στην ηλεκτρονική διεύθυνση https://github.com/RajDandekar/COVID-19-ML-Quarantine-Control-Model». Στο ερώτημα σχετικά με το αν συνεχίζει τώρα την ανάλυση σε ό,τι αφορά την εξέλιξη της πανδημίας και σε άλλες χώρες, απάντησε θετικά. Αρνήθηκε ωστόσο να αποκαλύψει σε αυτή τη φάση περισσότερες λεπτομέρειες και ανέφερε ότι η δημοσίευση νέων αποτελεσμάτων θα γίνει «όταν θα είμαστε σίγουροι για την επιστημονική τους εγκυρότητα».

Οπως διαβάσατε, τα μαθηματικά μοντέλα έχουν και αυτά τις… απαιτήσεις τους για να μπορούν να αποτελούν καλούς «συνεργάτες» επιστημόνων και κρατών. Χρειάζονται αξιόπιστα και αναλυτικά δεδομένα για την εικόνα της εξάπλωσης του εκάστοτε ιού στον πληθυσμό. Αλλιώς, ίσως υποπέσουν σε λάθη (που στην προκειμένη περίπτωση μπορεί να είναι λάθη κυριολεκτικώς ζωής ή θανάτου). Και για τα λάθη δεν θα φταίνε εκείνα…

Who is who

Ο καθηγητής στο Τμήμα Μηχανολόγων Μηχανικών του ΜΙΤ και κύριος ερευνητής στο Κέντρο SMART (Singapore-MIT Alliance of Research and Technology) Γεώργιος Μπαρμπαστάθης έλαβε το δίπλωμά του από τη Σχολή Ηλεκτρολόγων Μηχανικών και Επιστήμης Υπολογιστών του Εθνικού Μετσοβίου Πολυτεχνείου το 1993. Συνέχισε με μεταπτυχιακές σπουδές στο Ινστιτούτο Τεχνολογίας της Καλιφόρνιας (Caltech), όπου εκπόνησε και τη διδακτορική διδιατριβή του, την οποία ολοκλήρωσε το 1997 στο πεδίο των Ηλεκτρολόγων Μηχανικών. Στη συνέχεια εργάστηκε ως μεταδιδακτορικός ερευνητής στο Πανεπιστήμιο του Ιλινόι στην Ουρμπάνα-Σαμπέιν, προτού ξεκινήσει την καριέρα του στο ΜΙΤ το 1999, όπου από το 2010 έχει θέση καθηγητή. Μεταξύ των κύριων ερευνητικών ενδιαφερόντων του είναι η οπτική, η μηχανική μάθηση και η υπολογιστική απεικόνιση. Εχει δημοσιεύσει περισσότερες από 140 μελέτες ενώ έχει υποβάλει αίτηση για περισσότερα από 40 διπλώματα ευρεσιτεχνίας και έχει κατοχυρώσει δεκάδες εξ αυτών. Είναι μέλος της Εταιρείας Οπτικής της Αμερικής και το έργο του έχει ανοίξει δρόμους στην υπολογιστική απεικόνιση με πλήθος εφαρμογών, μεταξύ των οποίων και στην Ιατρική.

Ακολούθησε το Βήμα στο Google news και μάθε όλες τις τελευταίες ειδήσεις.