DNA Als Flashdrive: Waarom Digitale Gegevens In Het Genoom Schrijven - Alternatieve Mening

Inhoudsopgave:

DNA Als Flashdrive: Waarom Digitale Gegevens In Het Genoom Schrijven - Alternatieve Mening
DNA Als Flashdrive: Waarom Digitale Gegevens In Het Genoom Schrijven - Alternatieve Mening

Video: DNA Als Flashdrive: Waarom Digitale Gegevens In Het Genoom Schrijven - Alternatieve Mening

Video: DNA Als Flashdrive: Waarom Digitale Gegevens In Het Genoom Schrijven - Alternatieve Mening
Video: How we can store digital data in DNA | Dina Zielinski 2024, Mei
Anonim

De groei van de hoeveelheid digitale informatie zet wetenschappers ertoe aan om op zoek te gaan naar compactere manieren om deze op te nemen en op te slaan. En wat is er compacter dan DNA? RIA Novosti heeft samen met een expert ontdekt hoe woorden met nucleotiden moeten worden gecodeerd en hoeveel data een molecuul bevat.

Redencodes

DNA is een opeenvolging van nucleotiden. Er zijn er maar vier: adenine, guanine, thymine, cytosine. Om informatie te coderen, krijgen ze allemaal een cijfercode toegewezen. Bijvoorbeeld thymine - 0, guanine - 1, adenine - 2, cytosine - 3. Codering begint met het feit dat alle letters, cijfers en afbeeldingen worden omgezet in een binaire code, dat wil zeggen een reeks nullen en enen, en ze zijn al omgezet in een reeks nucleotiden, dat wil zeggen een quartaire code.

Voordat u de gegevens in DNA codeert, moet u deze vertalen naar een digitale code / illustratie door RIA Novosti. Alina Polyanina
Voordat u de gegevens in DNA codeert, moet u deze vertalen naar een digitale code / illustratie door RIA Novosti. Alina Polyanina

Voordat u de gegevens in DNA codeert, moet u deze vertalen naar een digitale code / illustratie door RIA Novosti. Alina Polyanina.

Er kunnen slechts drie nucleotiden worden gebruikt om een code (ternaire code) te bouwen, en de vierde is om reeksen in delen op te splitsen. Er is een optie met de constructie van bases in de vorm van een binaire code, wanneer twee ervan overeenkomen met nul en twee met één.

Er worden verschillende technieken gebruikt om te lezen. Een van de meest voorkomende is dat een ketting van een DNA-molecuul wordt gekopieerd met basen, die elk een kleurlabel hebben. Vervolgens leest een zeer gevoelige detector de gegevens en de computer gebruikt de kleuren om de nucleotidesequentie te reconstrueren.

“Het DNA-molecuul is erg ruim. Zelfs in bacteriën bevat het gewoonlijk ongeveer een miljoen basen, en bij mensen zelfs drie miljard. Dat wil zeggen, elke menselijke cel bevat een hoeveelheid informatie die vergelijkbaar is met de capaciteit van een flashstation. En we hebben biljoenen van dergelijke cellen. Er kan een enorme hoeveelheid gegevens in DNA worden vastgelegd, maar het schrijven en lezen van een dergelijk medium is nog steeds te traag en kostbaar”, zegt Alexander Panchin, Ph. D., senior onderzoeker bij het Institute for Information Transmission Problems, genoemd naar A. A. Kharkevich, Russian Academy of Sciences.

Promotie video:

De registratiedichtheid neemt toe

In juni 1999 publiceerde het tijdschrift Nature een artikel van Amerikaanse wetenschappers die een techniek ontwikkelden om met behulp van DNA geheime berichten te versturen. Ze synthetiseerden een molecuul door een nucleotidesequentie op te nemen die werd gevormd met behulp van een quaternaire code. Het geheime DNA in het mengsel werd naar een ander laboratorium gestuurd. Haar medewerkers vonden met behulp van speciale chemische sleutels het gewenste molecuul en haalden er informatie uit.

“Over het algemeen zijn er twee manieren om gegevens op DNA vast te leggen. De eerste is wanneer je volledig nieuw DNA synthetiseert met behulp van een chemische synthesizer. Op commando van de computer worden nucleotiden in een bepaalde volgorde aan de oplossing toegevoegd en de benodigde basisketen "groeit" geleidelijk. In het tweede geval worden data gecodeerd in het reeds bestaande DNA van een organisme”, legt Panchin uit.

In mei 2010 publiceerde de groep van Craig Venter, die voor het eerst het menselijk genoom in kaart bracht, een paper over het ontstaan van een kunstmatige bacterie. Ze namen als basis een bacteriecel die uit het genoom was gezuiverd en plaatsten daar de gevormde basensequentie. Het resultaat is een nieuwe bacterie, behoorlijk actief en levend, die alleen verschilt van de gebruikelijke doordat het DNA met de hand is gemaakt. Bovendien toonde het team een gevoel voor schoonheid door hun namen en citaten uit klassiekers te schrijven met behulp van een quartaire code in het bacteriële DNA.

In 2012 nam een groep onder leiding van moleculair bioloog George Church een meer fundamentele benadering en DNA-codeerde een boek van 52.000 woorden Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves, verschillende afbeeldingen en één Java-programma. Ze gebruikten binaire code. De totale hoeveelheid gegevens was 658 kilobytes. De informatiedichtheid bleek bijna 1018 bytes per gram moleculen te zijn. Ter vergelijking: een harde schijf van 1012 bytes weegt ongeveer honderd gram. Het grootste nadeel van deze methode is de instabiliteit van de geregistreerde informatie.

“Het DNA-molecuul heeft de neiging te muteren, waardoor de betrouwbaarheid van de gegevensopslag afneemt. Zeker als de drager van DNA een levende cel is die tot deling kan overgaan: als DNA wordt gedupliceerd, sluipen er bijzonder vaak fouten in. De betrouwbaarheid van de gegevensopslag neemt toe als u duizenden exemplaren van hetzelfde bericht hebt. Of bewaar het DNA gewoon in de vriezer. Bij lage temperaturen is het vermogen van een molecuul om te muteren aanzienlijk verminderd”, legt de expert uit.

Bovendien gaat er soms informatie verloren bij het lezen. Fouten kunnen van chemische aard zijn, wanneer een onjuiste basis aan een element wordt bevestigd, of puur berekend, dat wil zeggen, afhankelijk van de computer.

Duur, betrouwbaar

In maart 2017 publiceerde het tijdschrift Science een artikel van Amerikaanse wetenschappers die erin slaagden 2 * 1017 bytes per gram DNA te schrijven. Biologen benadrukken dat ze geen enkele byte hebben verloren. Simpel gezegd, wat we hebben opgenomen is wat we bij de uitgang kregen.

Voor een gewone gebruiker is een "genetische flashdrive" nog niet beschikbaar, omdat het erg duur is om informatie erop op te slaan en de lees- / schrijfsnelheid laag is. Wetenschappers schatten dat het lezen van slechts één megabyte ongeveer drieënhalf duizend dollar en enkele uren tijd kost.

De onbetwiste voordelen van het vastleggen van informatie op DNA zijn onder meer de enorme opslagdichtheid van gegevens, evenals de stabiliteit van de drager - echter alleen bij lage temperaturen.

Aanbevolen: