Το ήξερες ότι 1 σε γραμμάριο DNA μπορούν να αποθηκευθούν δεδομένα όγκου 1.000.000.000 TB για 1000 και πλέον χρόνια?
Μόλις πέρυσι, η Microsoft αγόρασε 10 εκατομμύρια κλώνους συνθετικού DNA από μια startup εταιρία σύνθεσης DNA με έδρα στο San Francisco εν ονόματι Twist Bioscience και συνεργάστηκε με ερευνητές του Πανεπιστημίου της Ουάσινγκτον πάνω στη χρήση του DNA ως μέσου αποθήκευσης δεδομένων.
Ωστόσο, στα τελευταία πειράματα, ένα ζευγάρι ερευνητών από το Πανεπιστήμιο της Κολούμπια και το Κέντρο Γονιδιώματος της Νέας Υόρκης (NYGC) ανακάλυψαν μια νέα τεχνική για την αποθήκευση τεράστιων ποσών δεδομένων με τη χρήση μορίων DNA και τα αποτελέσματα είναι θαυμάσια.
Το δίδυμο αποθηκεύτηκε με επιτυχία περίπου 2mb δεδομένων, κωδικοποιώντας συνολικά έξι αρχεία, τα οποία περιλαμβάνουν:
- Ένα πλήρες λειτουργικό σύστημα υπολογιστή
- Μια γαλλική ταινία 1895 “Άφιξη τρένου στο La Ciotat”
- Μια Amazon gift card αξίας $50
- Έναν ιό υπολογιστών
- Μια Pioneer plaque
- Μια μελέτη του 1948 από τον θεωρητικό πληροφοριών Claude Shannon
Η νέα αυτή έρευνα, των Taniv Erlich και Dina Zielinski, έχει δημοσιευθεί στο περιοδικό Science.
Η ταινία αφου ανακτήθηκε:
Αλλά πώς οι ερευνητές κατάφεραν να αποθηκεύσουν ψηφιακά δεδομένα στο DNA;
Ονομάζοντας τη διαδικασία τους “DNA Fountain”, οι ερευνητές πρώτα συμπιέζουν όλα τα δεδομένα σε ένα ενιαίο κύριο αρχείο και τα χωρίζουν σε μικρότερα κομμάτια δυαδικών ψηφίων, που αποτελούνται από 1 και 0.
Στη συνέχεια, οι ερευνητές χρησιμοποίησαν έναν “erasure-correcting” αλγόριθμο που ονομάζεται “fountain codes“ για την τυχαία στοίχηση των κομματιών σε droplets. Κάθε droplet περιέχει έναν κώδικα barcode στην ακολουθία o οποίος βοήθησε τους ερευνητές να επανασυναρμολογήσουν το αρχείο.
Έπειτα οι ερευνητές “χαρτογράφησαν τα 0 και 1 σε κάθε droplet σε αντιστοίχηση με τις τέσσερις νουκλεοτιδικές βάσεις του DNA: A, G, C και T” και κατέληξαν με μια ψηφιακή λίστα 72.000 κομματιών DNA που περιείχαν τα κωδικοποιημένα δεδομένα.
Αυτός ο κώδικας στάλθηκε έπειτα σε ένα αρχείο κειμένου στην Twist Biosciences, την ίδια εταιρία σύνθεσης DNA από την οποία η Microsoft αγόρασε τα 10 εκατομμύρια κλώνων συνθετικού DΝΑ πέρυσι, και αυτοί με τη σειρά τους μετέτρεψαν τις ψηφιακές πληροφορίες σε βιολογικό DNA.
“Δύο εβδομάδες αργότερα, έλαβαν ένα φιαλίδιο με μία κηλίδα από μόρια DNA. Για να ανακτήσουν τα αρχεία τους, χρησιμοποίησαν μια σύγχρονη τεχνολογία προσδιορισμού αλληλουχίας για να διαβάσουν τα κομμάτια του DNA, έπειτα χρησιμοποίησαν ένα πρόγραμμα ώστε να μετατρέψουν τον γενετικό κωδικά ξανά σε δυαδικό σύστημα. Ανέκτησαν τα αρχεία τους χωρίς κανένα σφάλμα “, γράφει το περιοδικό.
“Η υψηλότερης πυκνότητας συσκευή αποθήκευσης που επινοήθηκε ποτέ”
Οι ερευνητές πιστεύουν ότι το DNA είναι το τέλειο μέσο αποθήκευσης, καθώς είναι εξαιρετικά συμπαγές και μπορεί να διαρκέσει εκατοντάδες χιλιάδες χρόνια αν διατηρείται σε μέρος δροσερό και ξηρό, και υποστηρίζει πως πρόκειται για την “υψηλότερης πυκνότητας συσκευή αποθήκευσης που επινοήθηκε ποτέ”.
Δεδομένου ότι το “ψηφιακό σύμπαν” είναι τεράστιο και μέχρι το 2020 θα περιέχει σχεδόν τόσα ψηφιακά bits όσα αστέρια υπάρχουν στο σύμπαν, τα δεδομένα θα φτάσουν τα 44 zettabytes ή 44 τρισεκατομμύρια gigabytes.
Έτσι, η αποθήκευση δεδομένων DNA θα μπορούσε να βοηθήσει τους μεγάλους οργανισμούς και εταιρείες να αποθηκεύσουν τεράστιες ποσότητες πληροφοριών με τέτοιο τρόπο ώστε να μπορούν να το διαβάσουν ακόμα και σε εκατό χρόνια.
Ωστόσο, το κόστος εξακολουθεί να αποτελεί σημαντικό πρόβλημα καθώς οι ερευνητές δαπάνησαν περίπου 7.000 δολάρια για να συνθέσουν τα 2MB δεδομένων και άλλα 2.000 δολάρια για να ανακτήσουν τα δεδομένα αυτά.
Ωστόσο, με τον καιρό αυτό θα αλλάξει, καθώς μέσω της έρευνας η όλη διαδικασία θα απλουστευτεί κατά έναν μεγάλο βαθμό.
Πηγή: