Μέχρι το 2020, οι επιστήμονες είχαν καταφέρει να προσδιορίσουν τη δομή μόλις 170.000 πρωτεϊνών, μορίων που έχουν κρίσιμη σημασία στην ιατρική και τη βιολογία. Τώρα, όμως, έχουν στη διάθεσή τους τις δομές σχεδόν όλων των πρωτεϊνών που γνωρίζει η επιστήμη, πάνω από 200 εκατομμύρια μόρια για μια απεριόριστη ποικιλία εφαρμογών.
«Βρισκόμαστε στο ξεκίνημα μιας νέας εποχής για την ψηφιακή βιολογία» δήλωσε ο Ντέμις Χασάμπις, διευθύνων σύμβουλος της λονδρέζικης DeepMind, θυγατρικής της Google που ανέπτυξε το AlphaFold.
Τίποτα δεν λειτουργεί σωστά στα κύτταρα χωρίς τις πρωτεΐνες, μακριές αλυσίδες από αμινοξέα που αναδιπλώνονται σε περίπλοκα, τρισδιάστατα σχήματα. Το σχήμα κάθε πρωτεΐνης είναι αυτό που καθορίζει τον τρόπο που δρα, είτε πρόκειται για δομικές πρωτεΐνες είτε για ενζυματικές πρωτεΐνες που ρυθμίζουν τον μεταβολισμό.
Γι’ αυτό και η δυνατότητα πρόβλεψης της δομής τους αναμένεται να παίξει σημαντικό ρόλο στη βιολογία, τη βιοχημεία και τελικά την ανάπτυξη φαρμάκων και θεραπειών.
Μέχρι πρόσφατα όμως, η τρισδιάστατη δομή τους μπορούσε να υπολογιστεί μόνο με απαιτητικές και άκρως χρονοβόρες μεθόδους όπως η κρυσταλλογραφία ακτίνων Χ και η κρυοηλεκτρονική μικροσκοπία, μέθοδοι που δεν δίνουν πάντα απαντήσεις.
Βάση δεδομένων της ζωής
Η DeepMind εξέπληξε πριν από δύο χρόνια την επιστημονική κοινότητα παρουσιάζοντας το AlphaFold, έναν αλγόριθμο που μαντεύει με ικανοποιητική ακρίβεια τη δομή των πρωτεϊνών γνωρίζοντας μόνο την αλληλουχία των αμινοξέων τους.
Η εντυπωσιακή επιτυχία αναγνωρίστηκε μάλιστα από το περιοδικό Science ως η σημαντικότερη επιστημονική εξέλιξη του 2021.
Η DeepMind συνεργάζεται τώρα με το Ευρωπαϊκό Εργαστήριο Μοριακής Βιολογίας (EMBL), το οποίο δημιούργησε τη βάση δεδομένων όπου καταχωρούνται οι τρισδιάστατες δομές.
Η βάση περιέχει πλέον 214 εκατομμύριο πρωτεΐνες από περίπου ένα εκατομμύριο οργανισμούς, σχεδόν όλα τα είδη που γνωρίζει σήμερα η βιολογία.
«Ουσιαστικά καλύπτει όλο το Σύμπαν των γνωστών πρωτεϊνών» δήλωσε ο Χασάμπις της DeepMind σε συνέντευξη Τύπου που παρακολούθησε ο δικτυακός τόπoς του Nature.
«Περιλαμβάνει τις προβλεπόμενες δομές για φυτά, βακτήρια, ζώα και πολλούς άλλους οργανισμούς».
«Οι προβλέψεις της δομής πρωτεϊνών που προσφέρει το AlphaFold χρησιμοποιούνται ήδη με μυριάδες τρόπους» πρόσθεσε η δρ Τζέιν Θόρντον του Ινστιτούτου Βιοπληροφορικής του EMBL, το οποίο φιλοξενεί τη βάση δεδομένων.
«Πιστεύω πως αυτή η τελευταία ενημέρωση της βάσης θα οδηγήσει σε χιονοστιβάδα νέων και συναρπαστικών ανακαλύψεων, χάρη στο γεγονός ότι τα δεδομένα είναι ελεύθερα προσβάσιμα από όλους».
Ο όγκος των δεδομένων αυτών φτάνει ήδη τα 23 terabyte, θα συνεχίσει όμως να αυξάνεται καθώς ανακαλύπτονται νέα είδη.