Πώς να στριμώξετε όλα τα δεδομένα του κόσμου σε ένα φορτηγό

Ο χείμαρος των νέων δεδομένων στην εποχή του Διαδικτύου ίσως σύντομα ξεπεράσει τις δυνατότητες των σκληρών δίσκων. Την απάντηση θα μπορούσε να δώσει η αποθήκευση της ψηφιακής πληροφορίας σε μόρια DNA, μια προσέγγιση που μόλις έσπασε κάθε όριο στην πυκνότητα των δεδομένων.

06.03.2017 15:49

Science

Βαγγέλης Πρατικάκης

Πώς να στριμώξετε όλα τα δεδομένα του κόσμου σε ένα φορτηγό

06.03.2017 15:49

Science

Βαγγέλης Πρατικάκης

Ο χείμαρος των νέων δεδομένων στην εποχή του Διαδικτύου ίσως σύντομα ξεπεράσει τις δυνατότητες των σκληρών δίσκων. Την απάντηση θα μπορούσε να δώσει η αποθήκευση της ψηφιακής πληροφορίας σε μόρια DNA, μια προσέγγιση που μόλις έσπασε κάθε όριο στην πυκνότητα των δεδομένων.

Ο χείμαρρος των νέων δεδομένων στην εποχή του Διαδικτύου ίσως σύντομα ξεπεράσει τις δυνατότητες των σκληρών δίσκων. Την απάντηση θα μπορούσε να δώσει η αποθήκευση της ψηφιακής πληροφορίας σε μόρια DNA, μια προσέγγιση που μόλις έσπασε κάθε όριο στην πυκνότητα των δεδομένων.

Αμερικανοί ερευνητές περιγράφουν στο κορυφαίο περιοδικό Science πώς δημιούργησαν ένα σύστημα που μπορεί να αποθηκεύει 215 petabyte (215.000 terabyte) σε ένα γραμμάριο DNA. Όπως σχολιάζει το περιοδικό, ένα τέτοιο σύστημα θα μπορούσε θεωρητικά να αποθηκεύσει όλες τις πληροφορίες του κόσμου σε ένα δοχείο περίπου στο μέγεθος και το βάρος ενός φορτηγού.

Δυαδικό και τετραδικό σύστημα

Οι υπολογιστές αποθηκεύουν τα δεδομένα σε ατελείωτες σειρές από «0» και «1». Οι γενετικές πληροφορίες που αποθηκεύει το DNA βρίσκονται επίσης σε ψηφιακή μορφή, είναι όμως γραμμένες σε αλληλουχίες τεσσάρων αντί για δύο ψηφίων, τις χημικές βάσεις A, T, C και G. Παρόλο όμως που το ένα σύστημα είναι δυαδικό και το άλλο τετραδικό, είναι στην πράξη εύκολο να μεταγράψει κανείς τα δεδομένα από το ένα σύστημα στο άλλο.

Ψηφιακά δεδομένα αποθηκεύτηκαν για πρώτη φορά σε DNA το 2012, όταν η ομάδα του διάσημου γενετιστή του Χάρβαρντ Τζορτζ Τσερτς κωδικοποίησαν ένα βιβλίο των 52.000 λέξεων σε μερικές χιλιάδες μόρια.

Θεωρητικά, το DNA μπορεί να αποθηκεύσει μέχρι 2 bit πληροφορίας σε κάθε βάση. Στην πράξη όμως συμβαίνουν λάθη στην εγγραφή και την ανάκτηση δεδομένων, κάτι που μειώνει το θεωρητικό όριο στα 1,8 bit ανά βάση.

Το βιβλίο του 2012 πετύχαινε απόδοση μόλις 1,28 petabyte ανά γραμμάριο δεδομένων. Η νέα μελέτη στο Science πλησιάζει περισσότερο το θεωρητικό όριο με 1,6 bit ανά βάση.

Αρχή με έξι ψηφιακά αρχεία

Οι ερευνητές του Πανεπιστημίου Κολούμπια και του Κέντρου Γενωμικής της Νέας Υόρκης ξεκίνησαν με έξι ψηφιακά αρχεία: ένα ολόκληρο λειτουργικό σύστημα, έναν ιό υπολογιστών, την παλιά γαλλική ταινία Arrival of a Train at La Ciotat, μια δωροκάρτα της Amazon, ένα αντίγραφο της πλάκας από τη διαστημική αποστολή Pioneer και μια μελέτη του 1948 από τον θεωρητικό της πληροφορίας Κλοντ Σάνο.

Το συνολικό μέγεθος των αρχείων ήταν 2 megabyte, συμπιέστηκαν όμως σε μικρότερα αρχεία και μετά ενώθηκαν σε ένα μεγάλο αρχείο. Το αρχείο αυτό μεταγράφηκε ως αλληλουχίες των τεσσάρων βάσεων του DNA και χωρίστηκε σε μικρά κομμάτια.

Ολα σε ένα μικρό φιαλίδιο DNA

Συνολικά δημιουργήθηκαν οι αλληλουχίες για 72.000 μόρια DNA μήκους 200 βάσεων το καθένα. Οι αλληλουχίες εστάλησαν σε εργαστήριο σύνθεσης DNA, το οποίο παρέδωσε στους ερευνητές ένα μικρό φιαλίδιο με το ζητούμενο DNA.

Για να διαβάσουν τα δεδομένα, οι ερευνητές χρησιμοποίησαν συμβατικές τεχνικές αλληλούχησης DNA αλλά και αλγόριθμους για να ενώσουν τα επιμέρους κομμάτια και να ανασυνθέσουν τις πληροφορίες. To εντυπωσιακό μάλιστα είναι ότι δεν βρέθηκε ούτε ένα λάθος στο DNA.

Επιπλέον, οι ερευνητές μπόρεσαν να δημιουργήσουν αντίγραφα της αποθηκευμένης πληροφορίας -θεωρητικά απεριόριστα αντίγραφα- με μια τεχνική αντιγραφής του DNA που ονομάζεται PCR (αλυσιδωτή αντίδραση πολυμεράσης).

Η μεγαλύτερη πυκνότητα αποθήκευσης δεδομένων

«Πιστεύουμε ότι το σύστημά μας πέτυχε τη μεγαλύτερη πυκνότητα αποθήκευσης δεδομένων που έχει αναφερθεί ποτέ» καμαρώνει ο Γιάβιν Έρλιχ του Πανεπιστημίου Κολούμπια, πρώτος συγγραφέας της μελέτης.

Παραμένει ωστόσο ασαφές αν τα συστήματα αποθήκευσης DNA θα χρησιμοποιηθούν ποτέ ευρέως στην πράξη. Ένας βασικός παράγοντας είναι το κόστος, δεδομένου ότι οι ερευνητές χρειάστηκαν 7.000 δολάρια για να συνθέσουν μόρια DNA με 2 megabyte πληροφορίας, και ακόμα 2.000 δολάρια για να διαβάσουν τα δεδομένα. Επιπλέον, οι διαδικασία της εγγραφής και ανάγνωσης απαιτεί ώρες ή μέρες.

Αυτό σημαίνει ότι το DNA είναι πιθανότερο να χρησιμοποιηθεί στη δημιουργία αντιγράφων ασφαλείας, αντί για την αποθήκευση δεδομένων που παράγονται στη στιγμή.

Ποιος ξέρει όμως: Ίσως μια μέρα οι περισσότερες πληροφορίες της ανθρωπότητας θα αποθηκεύονται στη γλώσσα της ίδιας της ζωής.

Ακολούθησε το Βήμα στο Google news και μάθε όλες τις τελευταίες ειδήσεις.