Στα μέσα του Σεπτεμβρίου έλαβε χώρα στην Αθήνα, και συγκεκριμένα στο Κέντρο Πολιτισμού Ιδρυμα Σταύρος Νιάρχος, το 17ο Ευρωπαϊκό Συνέδριο Υπολογιστικής Βιολογίας (17th European Conference of Computational Biology, ECCB). Την ευθύνη της διοργάνωσης είχε η καθηγήτρια Πληροφορικής του Πανεπιστημίου Θεσσαλίας και ερευνήτρια του Ελληνικού Ινστιτούτου Παστέρ κυρία Αρτεμις Χατζηγεωργίου συνεπικουρούμενη από τον συνάδελφό της κ. Παντελή Μπάγκο, αναπληρωτή καθηγητή στο Πανεπιστήμιο Θεσσαλίας. Με περισσότερους από 1.000 συνέδρους, η εν λόγω επιστημονική συνάντηση αποτελεί πάντοτε την κορωνίδα του εν πλήρει ανθήσει πεδίου της υπολογιστικής βιολογίας και της βιοπληροφορικής. Το ίδιο συνέβη και εφέτος, με την ποιότητα των εργασιών, οι οποίες παρουσιάζονταν παράλληλα σε τρία αμφιθέατρα, να καθιστά δύσκολη την επιλογή στον επίδοξο ακροατή. Προφανώς είναι αδύνατον να μεταφερθούν σε δύο σελίδες εφημερίδας τα τεκταινόμενα τεσσάρων ημερών. Ετσι σταχυολογήσαμε παρουσιάσεις που δόθηκαν στο σύνολο του ακροατηρίου (plenary lectures) δείχνοντας μια προτίμηση σε επιφανείς έλληνες επιστήμονες.
Στην εποχή των «όμικς»
Αλλά ας αρχίσουμε από την αρχή. Η υπολογιστική βιολογία είναι ένα διεπιστημονικό πεδίο, όπου η βιολογία, τα μαθηματικά και η πληροφορική «τέμνονται» προκειμένου να κατανοηθούν σε βάθος βιολογικά φαινόμενα ή/και συστήματα. Αν και τα μαθηματικά, και κυρίως η στατιστική, υπήρξαν πάντα ένα αναπόσπαστο εργαλείο στη βιολογία, η πληροφορική άρχισε να μπαίνει στη βιολογία μετά τη δεκαετία του 1950, όταν έπρεπε να συγκριθούν μεταξύ τους πρωτεϊνικές αλληλουχίες και αργότερα αλληλουχίες γονιδίων. Βεβαίως, από τα τέλη του περασμένου αιώνα και μετά η βιοπληροφορική γνώρισε τεράστια άνθηση και στην πραγματικότητα συνέβαλε καθοριστικά στη διαμόρφωση της σύχρονης βιολογίας. Μιας βιολογίας που, μεταξύ άλλων, χαρακτηρίζεται από μαζική παραγωγή δεδομένων: από την αποκωδικοποίηση του ανθρωπίνου γονιδιώματος (καθώς και γονιδιωμάτων πολλών ακόμα οργανισμών) και τη γένεση του πεδίου της γονιδιωματικής, η βιολογία διαθέτει πια ένα σωρό «όμικς». Η κατάληξη «-omics» στο τέλος των αγγλικών βιολογικών όρων σηματοδοτεί πάντοτε μελέτη του συνόλου: genomics για τη μελέτη του συνόλου των γονιδίων ενός οργανισμού (δηλαδή του γονιδιώματος), proteomics για τη μελέτη του συνόλου των πρωτεϊνών, metabolomics για τη συνολική μελέτη του μεταβολισμού, connectomics για τη μελέτη του συνόλου των εγκεφαλικών συνάψεων, pharmacogenomics για τη μελέτη της επίδρασης των φαρμάκων στο σύνολο του γονιδιώματος και σε διαφορετικά γονιδιώματα, microbiomics για τη μελέτη του συνόλου των μικροοργανισμών που ζουν σε ένα συγκεκριμένο περιβάλλον, κ.ο.κ.
Κανένα από τα παραπάνω «όμικς» δεν θα ήταν δυνατόν να υφίσταται χωρίς τη βοήθεια των υπολογιστών! Πώς να συγκρίνει κανείς, χωρίς υπολογιστή, τα εκατομμύρια βάσεων («γραμμάτων» του DNA) όταν παραδείγματος χάριν αναζητεί μεταλλάξεις που παρέχουν ανθεκτικότητα σε έναν μολυσματικό παράγοντα; Ή πώς να εντοπίσει γονίδια καλά «κρυμμένα» σε περιοχές του DNΑ που δεν κωδικοποιούν για τη σύνθεση πρωτεϊνών; Στην πραγματικότητα η βιοπληροφορική μεγάλωσε προσπαθώντας να ανταποκριθεί στις προκλήσεις που της έθετε η μεταμόρφωση της βιολογίας, η οποία με τη βοήθεια της τεχνολογίας τα τελευταία 20 χρόνια παράγει δεδομένα μεγάλου όγκου. Δεδομένα από τα οποία θα μπορούσε κανείς να εξαγάγει χρήσιμα συμπεράσματα. Φτάνει να είχε τη δυνατότητα να τα διαχειριστεί, να τα αναλύσει. Για τον λόγο αυτό οι βιοπληροφορικοί αναπτύσσουν και χρησιμοποιούν μεθόδους ανάλυσης δεδομένων, ενώ για την επίλυση δυσκολότερων προβλημάτων καταφεύγουν στη μηχανική μάθηση. Είναι χαρακτηριστικό εξάλλου το γεγονός ότι το ένα τρίτο των ομιλιών του συνεδρίου ήταν αφιερωμένο στην αξιοποίηση της τεχνητής νοημοσύνης για την κατανόηση της λειτουργίας του κυττάρου.
«Ψύλλοι στ’ άχυρα του DNA»
Σήμερα η υπολογιστική βιολογία παρέχει στους επιστήμονες τη δυνατότητα να αναζητούν «ψύλλους στ’ άχυρα» και να πετυχαίνουν να τους ανακαλύουν. Πάρτε για παράδειγμα την καθηγήτρια Υπολογιστικής Γενετικής Ελευθερία Ζεγγίνη, η οποία μόλις πριν από λίγες ημέρες αποδέχθηκε τη θέση του επικεφαλής του νέου Ινστιτούτου για τη Μεταφραστική Γενομική (Institute for Translational Genomics) στο Ερευνητικό Κέντρο Helmholtz (Helmholtz Zentrum) του Μονάχου. Τα τελευταία δέκα χρόνια η ελληνίδα καθηγήτρια ήταν επικεφαλής ερευνητικής ομάδας στο Ινστιτούτο Sanger στο Κέιμπριτζ της Βρετανίας και η έρευνά της εστιαζόταν στη διαλεύκανση των γενετικών παραγόντων που συμβάλλουν στην ανάπτυξη ασθενειών. Βλέπετε, οι περισσότερες ασθένειες δεν έχουν μονογονιδιακή βάση, όπως παραδείγματος χάριν συμβαίνει με τη θαλασσαιμία (μεσογειακή αναιμία), όπου μεταλλάξεις σε ένα και μόνο γονίδιο αρκούν για να νοσήσει κάποιος. Αντιθέτως, η πλειονότητα των ασθενειών προκύπτει ως αποτέλεσμα της επίδρασης περιβαλλοντικών παραγόντων σε ένα συγκεκριμένο γενετικό υπόβαθρο, ο εντοπισμός του οποίου είναι όντως αναζήτηση τύπου «ψύλλοι στ’ άχυρα».
Γονίδια οστεοαρθρίτιδας
Τα ευρήματά της σχετικά με την οστεοαρθρίτιδα παρουσίασε στο ECCB η ελληνίδα καθηγήτρια. Η οστεοαρθρίτιδα χαρακτηρίζεται από την αποικοδόμηση του χόνδρου στις αρθρώσεις, γεγονός που έχει σαν συνέπεια απώλεια της λειτουργικότητάς του αλλά και συνεχή πόνο. Η νόσος αφορά το 20% του πληθυσμού άνω των 40 ετών, ενώ στα άτομα ηλικίας 70 ετών και άνω τα ποσοστά της αγγίζουν το 50%. Θεραπευτική αγωγή δεν υπάρχει και οι ασθενείς λαμβάνουν αναλγητικά και εν τέλει υποβάλλονται σε χειρουργική επέμβαση ολικής αντικατάστασης της άρθρωσης. Οι παράγοντες κινδύνου για εμφάνιση οστεοαρθρίτιδας είναι πολλοί: η ηλικία και το φύλο (η νόσος προτιμά τις γυναίκες), το οικογενειακό ιστορικό, οι τραυματισμοί, η καθιστική ζωή, η παχυσαρκία. Με άλλα λόγια, η οστεοαρθρίτιδα είναι όντως από εκείνες τις ασθένειες που για την εμφάνισή τους απαιτείται συνεργασία περιβάλλοντος και γενετικού υποβάθρου.
Τη γενετική συνιστώσα της οστεοαρθρίτιδας αναζήτησαν η Ελευθερία Ζεγγίνη και οι συνεργάτες της στην εκτενέστερη μελέτη που έγινε ποτέ για τη νόσο. Ειδικότερα, οι ερευνητές εξέτασαν 16,5 εκατομμύρια πολυμορφισμούς (μικρές αλλαγές στη σειρά των γραμμάτων του DNA σε συγκεκριμένες θέσεις) σε δείγματα από 30.727 ασθενείς και 297.191 υγιή άτομα. Αξίζει να σημειωθεί ότι τα γενετικά δεδομένα για όλους αυτούς τους ανθρώπους ήταν αποθηκευμένα στη βρετανική βιοτράπεζα (UK Biobank). Η συγκριτική ανάλυση των παραπάνω δεδομένων (η οποία προφανώς και δεν θα μπορούσε ποτέ να γίνει χωρίς προηγμένα υπολογιστικά εργαλεία) κατέδειξε εννέα διαφορετικές θέσεις στο ανθρώπινο γονιδίωμα οι οποίες εμφάνιζαν ισχυρή συσχέτιση με την εμφάνιση της νόσου. Για πέντε από αυτές τις θέσεις οι ερευνητές εντόπισαν τα αντίστοιχα γονίδια, τα οποία μάλιστα εμφάνιζαν διαφορετική έκφραση σε υγιείς και ασθενείς αρθρώσεις. Με άλλα λόγια, τα εν λόγω γονίδια ήταν ενεργά καθώς η νόσος εξελισσόταν και ο χόνδρος των ασθενών καταστρεφόταν. Περιττό να πούμε ότι τα γονίδια αυτά αποτελούν εξαιρετικούς στόχους για την ανάπτυξη φαρμάκων εναντίον της οστεοαρθρίτιδας.
Γενετικά αίτια και περιβαλλοντικές αφορμές
Επειδή όμως η πρόληψη είναι η καλύτερη θεραπεία, η ελληνίδα καθηγήτρια και οι συνεργάτες της πραγματοποίησαν ένα ακόμη είδος στατιστικής ανάλυσης το οποίο τούς επιτρέπει να συσχετίσουν μια νόσο με παράγοντες κινδύνου (causal inference analysis). Ετσι διερεύνησαν αν υπάρχει γενετική συσχέτιση ανάμεσα στην οστεοαρθρίτιδα και την παχυσαρκία, την οστική πυκνότητα, τον διαβήτη τύπου 2 και τα αυξημένα επίπεδα τριγλυκεριδίων στο αίμα. Διαπίστωσαν ότι ούτε ο διαβήτης ούτε τα επίπεδα τριγλυκεριδίων φαίνονται να έχουν επίδραση στην εμφάνιση της νόσου, αλλά επαναβεβαίωσαν την επιδημιολογική παρατήρηση ότι η παχυσαρκία συμβάλλει στην εμφάνιση της οστεοαρθρίτιδας.
Φυσικά η επίτευξη του στόχου, δηλαδή ο εντοπισμός των γονιδίων που σχετίζονται με την εμφάνιση της οστεοαρθρίτιδας, δεν σήμανε και το τέλος των ερευνών της κυρίας Ζεγγίνη στο συγκεκριμένο πεδίο. Αντιθέτως σήμανε την αρχή για περαιτέρω μελέτες, δικές της και άλλων επιστημόνων ανά τον κόσμο, οι οποίες στοχεύουν να πάνε από τα γονίδια στις πρωτεΐνες που αυτά κωδικοποιούν, αλλά να επεκταθούν και στη μελέτη των επιγενετικών παραγόντων και να επανεξετάσουν την ιστοπαθολογία της νόσου υπό τα νέα ευρήματα. Από τη διεξοδική αυτή μελέτη, η οποία πλέον εστιάζεται στη συγκριτική ανάλυση των δεδομένων κάθε κυττάρου χόνδρου που ασθενεί, αναμένονται ευρήματα που θα οδηγήσουν σε θεραπείες για πολλά εκατομμύρια πληγωμένων γονάτων.
Η δύναμη των εικόνων
Μπορεί η βιοπληροφορική να αναδύθηκε αρχικά από την ανάγκη των επιστημόνων να συγκρίνουν μόρια πρωτεϊνών και νουκλεϊνικών οξέων (DNA και RNA), αλλά σήμερα δεν περιορίζεται μόνο σε αυτά. Χαρακτηριστική ήταν η ομιλία του κ. Χρήστου Νταβατζίκου, διευθυντή του Κέντρου Βιοϊατρικής Υπολογιστικής Απεικόνισης (Center for Biomedical Image Computing and Analytics) του Πανεπιστημίου της Πενσιλβάνια στις ΗΠΑ και καθηγητή Ακτινολογίας και Μηχανικής Συστημάτων στο ίδιο πανεπιστήμιο, ο οποίος αναφέρθηκε στην αξιοποίηση της μηχανικής μάθησης για την ακριβέστερη διάγνωση όγκων του εγκεφάλου, αλλά και στη δυνατότητα να συνδυαστεί η οπτική πληροφορία (η οποία αποκτάται με τη βοήθεια της τομογραφίας) με την ανάλυση των γονιδιωμάτων.
Ολοι έχουμε δει εικόνες από αξονικές ή μαγνητικές τομογραφίες. Αυτές οι στιγμιαίες και λεπτομερείς απεικονίσεις των εσωτερικών μας οργάνων παρέχουν ήδη σημαντικές διαγνωστικές πληροφορίες και έχουν γίνει μέρος της καθημερινής κλινικής πράξης. Ωστόσο, ένας υπολογιστής μπορεί να «δει» καλύτερα από τα μάτια και του πιο πεπειραμένου γιατρού! Ιδιαίτερα αν αυτός έχει εκπαιδευθεί, αν έχει δει πλήθος τομογραφιών και διαθέτει το λογισμικό που του επιτρέπει να συσχετίσει τα ποσοστικά δεδομένα των εικόνων με ασθένειες και όχι μόνο. Παραδείγματος χάριν, στην περίπτωση του εγκεφάλου, ο συσχετισμός μπορεί να αφορά αόρατες μέχρι τότε τοπικές διαφορές που μπορεί να σημαίνουν μειωμένες διανοητικές λειτουργίες, επίδραση φαρμάκων ή πρόοδο ενός όγκου.
Αξιοποιώντας μια ιδιαίτερα εξελιγμένη τεχνική (Non-Negative Matrix Factorization) ο έλληνας καθηγητής και οι συνεργάτες του ανακαλύπτουν τις οπτικές υπογραφές ασθενειών (όπως παραδείγματος του γλοιοβλαστώματος), ενώ ενσωματώνοντας σε αυτές και γενετικές πληροφορίες αυξάνουν τη διαγνωστική ικανότητα και συμβάλλουν στην πρόγνωση της εξέλιξης της νόσου και στην επιλογή της αποτελεσματικότερης θεραπείας.
Από τη γενωμική στη θεραπευτική
Οπως θα θυμούνται όσοι παρακολουθούν τα τεκταινόμενα της βιολογίας, η χαρά της ολοκλήρωσης της αποκωδικοποίησης του ανθρωπίνου γονιδιώματος (η οποία μάλιστα είχε αναγγελθεί από τον ίδιο τον τότε αμερικανό πρόεδρο των ΗΠΑ Μπιλ Κλίντον) σύντομα έδωσε τη θέση της στην αμηχανία: ωραία, το διαβάσαμε το γονιδίωμα, αλλά τώρα τι; Πώς θα πάμε από τα γονίδια στις θεραπείες ασθενειών;
Τις προκλήσεις αυτής της διαδρομής έδωσε ο Μανώλης Κέλλης, επικεφαλής της Ομάδας Υπολογιστικής Βιολογίας του Τεχνολογικού Ινστιτούτου της Μασαχουσέτης (ΜΙΤ), επισημαίνοντας ότι η γενετική υπόσχεται να εμβαθύνει στους μηχανισμούς πρόκλησης των ασθενειών, να υποδείξει γονίδια-στόχους για νέες θεραπείες, να μας οδηγήσει στην επονομαζόμενη προσωποποιημένη ιατρική. Αλλά οι προκλήσεις είναι πολλές: για την πλειονότητα των ασθενειών δεν γνωρίζουμε το γενετικό υπόβαθρο, δεν γνωρίζουμε τα γονίδια που εμπλέκονται ούτε τις μεταλλάξεις που ευθύνονται για την εμφάνισή τους, δεν γνωρίζουμε την ταυτότητα των κυττάρων στα οποία επιδρούν οι μεταλλάξεις, ούτε και τα βιοχημικά μονοπάτια που επηρεάζονται. Αν τώρα σε αυτά προσθέσουμε και το γεγονός ότι πολλές ασθένειες διαθέτουν και περιβαλλοντική συνιστώσα, και ότι με τη λέξη «περιβάλλον» εννοούμε ένα πλήθος παραγόντων (από τη διατροφή και την έκθεσή μας σε επικίνδυνα τοξικά μέχρι το κάπνισμα και τα βακτήρια που εποικίζουν τον οργανισμό μας), αντιλαμβάνεται κανείς ότι οι παράμετροι που πρέπει να συνυπολογιστούν είναι ασύλληπτα μεγάλες.
Το γεγονός αυτό δεν αποθαρρύνει τους ερευνητές σαν τον Κέλλη και τους συνεργάτες του, οι οποίοι αναπτύσσοντας εξελιγμένες υπολογιστικές μεθόδους έχουν ήδη υποδείξει μοριακά μονοπάτια που σχετίζονται με ασθένειες (από την παχυσαρκία ως τη νόσο του Αλτσχάιμερ), αλλά και φυσιολογικές διεργασίες. Τι θα γεννηθεί απ’ όλα αυτά; Το αύριο της ιατρικής!
Επαναληψιμότητας εγκώμιον
Ο καθηγητής Ιατρικής του Πανεπιστημίου Στάνφορντ και διευθυντής του κέντρου METRICS (Meta-Research Innovation Center at Stanford) του ίδιου πανεπιστημίου κ. Γιάννης Ιωαννίδης ήταν ο πρώτος προσκεκλημένος ομιλητής του εφετινού συνεδρίου Υπολογιστικής Βιολογίας. Ο έλληνας επιστήμονας, ο οποίος το 2010 άφησε την έδρα Επιδημιολογίας του Πανεπιστημίου Ιωαννίνων για το Στάνφορντ, βρίσκεται στη δεκάδα των επιστημόνων (και πρώτος μεταξύ των γιατρών) οι εργασίες των οποίων αναφέρονται συχνότερα στις εργασίες των συναδέλφων τους.
Διόλου τυχαία η ομιλία του κ. Ιωαννίδη αφορούσε την επαναληψιμότητα, καθώς ο έλληνας γιατρός έχει αφιερώσει μεγάλο μέρος του ερευνητικού χρόνου του στην ανάλυση των δεδομένων των επιστημονικών εργασιών, έχοντας μάλιστα εντοπίσει πολλά «διαμάντια» ιδιαίτερα σε ό,τι αφορά στατιστικούς υπολογισμούς. Οπως χαρακτηριστικά σημείωσε ο κ. Ιωαννίδης, «κατά τον 17ο αιώνα, τότε που τέθηκαν οι βάσεις για τη σύγχρονη επιστήμη, κάθε επιστημονικός ισχυρισμός έπρεπε να αποδειχθεί. Ετσι συχνά ο επιστήμονας καλούνταν να επαναλάβει τον πειραματισμό του μπροστά στους συναδέλφους του».
Τι γίνεται όμως σήμερα που οι επιστημονικές εργασίες μετρώνται σε εκατομμύρια ανά έτος; Για ποια επαναληψιμότητα μπορεί κανείς να μιλήσει; Την επαναληψιμότητα των μεθόδων; Την επαναληψιμότητα των αποτελεσμάτων μιας μελέτης εφόσον έχουν ακολουθηθεί πιστά οι αρχικές μέθοδοι; Ή, τέλος, την επαναληψιμότητα των συμπερασμάτων, ανεξαρτήτως μεθόδου; Περιττό δε να πούμε ότι κάθε πεδίο έχει ιδιαιτερότητες τέτοιες που καθιστούν την έννοια της επαναληψιμότητας διαφορετική. Παρ’ όλα αυτά κανένας δεν διαφωνεί πως πρόκειται για ένα θέμα ζωτικής σημασίας ιδιαίτερα σε ό,τι αφορά ευρήματα της λεγόμενης βασικής έρευνας. Και οι λόγοι είναι προφανείς: φανταστείτε ένα εύρημα του τύπου η Α ουσία επιτελεί την Α λειτουργία, η οποία είναι απαραίτητη για την εξέλιξη της νόσου Χ. Καθώς ευρήματα αυτού του τύπου αποτελούν τη βάση για την ανάπτυξη φαρμάκων, διαδικασία που παίρνει αρκετές δεκαετίες για να ολοκληρωθεί, αντιλαμβάνεται κανείς εύκολα τις συνέπειες (σε κόπο, χρόνο και χρήμα) που θα είχε η μη επαναληψιμότητα του εν λόγω ευρήματος.
Αξίζει δε να σημειωθεί ότι η μη επαναληψιμότητα είναι μια «ασθένεια» που πλήττει πολλά επιστημονικά πεδία (με τις ψυχολογικές έρευνες πάντως να εμφανίζουν εξαιρετικά χαμηλά ποσοστά επαναληψιμότητας). Οσο για τη σημερινή βιολογία των μεγάλων δεδομένων, ο έλληνας καθηγητής εκτιμά ότι η καλύτερη λύση για το θέμα της επαναληψιμότητας είναι η διαφάνεια, και μάλιστα από την αρχή του πειραματισμού. Με άλλα λόγια, αυτό που προτείνεται είναι οι ερευνητές να εκφράζουν την πρόθεσή τους να πραγματοποιήσουν την όποια μελέτη, να γνωστοποιούν το δείγμα τους και τις μεθόδους ανάλυσης και καθώς οι έρευνες θα προχωρούν να είναι όλα διαθέσιμα στην κρίση των συναδέλφων τους. Επιπροσθέτως, ενθαρρύνονται το μοίρασμα και οι ανταλλαγές (δειγμάτων, μεθόδων, αποτελεσμάτων). Ολα αυτά, τα οποία προφανώς αποτελούν μια σαφή και εκ βάθρων αλλαγή φιλοσοφίας στον τρόπο με τον οποίο διεξάγεται η επιστημονική έρευνα, θα οδηγούν σε ασφαλή συμπεράσματα (καθώς ο έλεγχος και οι απαιτούμενες διορθώσεις θα γίνονται καθ’ οδόν).
Δεν είναι εύκολο να προβλέψει κανείς πώς θα ανταποκριθούν οι ερευνητές στην πρόκληση της επαναληψιμότητας και στην προτροπή του μοιράσματος ως απάντηση σε αυτή την πρόκληση. Θα άξιζε όμως να δοκιμαστεί, αφού είναι βέβαιο ότι η κρυψίνοια δεν μας βγάζει και πολύ μακριά. Σκεφθείτε το: ας υποθέσουμε ότι ένας εξαιρετικός ογκολόγος σε μεγάλο νοσοκομείο κρατά για τον εαυτό του και τις έρευνές του τα στοιχεία των ασθενών του με καρκίνο του πνεύμονα, στον οποίο έχει εστιάσει το ερευνητικό ενδιαφέρον του. Οσο πολλές περιπτώσεις ασθενών και να δει στη διάρκεια της σταδιοδρομίας του, πάντα θα είναι καλύτερα αυτές να τις ενώσει με εκείνες που είδε ο αντίστοιχος γιατρός στην Ινδία, στην Αυστραλία, στον Καναδά. Γιατί πάντα το μεγάλο δείγμα δίνει ασφαλέστερα συμπεράσματα. Πράγμα καλύτερο για τον γιατρό, τους ασθενείς, την επιστήμη!