Informazione

10.4: Il codice genetico - Biologia

10.4: Il codice genetico - Biologia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Abbiamo allegramente descritto lo scopo dei cromosomi del DNA come portare le informazioni per costruire le proteine ​​della cellula e l'RNA come intermediario per farlo. Esattamente come è possibile, però, che una molecola composta da soli quattro diversi nucleotidi uniti insieme (sebbene migliaia e persino migliaia di migliaia di essi), possa dire alla cellula quale dei venti e più amminoacidi mettere insieme per formare una proteina funzionale ? La soluzione ovvia era che, poiché non ci sono abbastanza singoli nucleotidi unici da codificare per ciascun amminoacido, devono esserci combinazioni di nucleotidi che designano particolari amminoacidi. Un codice doppietto, consentirebbe solo 16 diverse combinazioni (4 possibili nucleotidi in prima posizione x 4 possibili nucleotidi in seconda posizione = 16 combinazioni) e non sarebbe sufficiente per codificare i 20 amminoacidi. Tuttavia, un codice tripletta produrrebbe 64 combinazioni, abbastanza facilmente da codificare 20 amminoacidi. Lo stesso vale per un codice quadruplo o quintupleto, del resto, ma sarebbe uno spreco di risorse e quindi meno probabile. Ulteriori indagini hanno dimostrato l'esistenza di un codice tripletta come descritto nella tabella seguente.

Con così tante combinazioni e solo 20 amminoacidi, cosa fa la cellula con le altre possibilità? Il codice genetico è a codice degenerato, il che significa che c'è ridondanza in modo che la maggior parte degli amminoacidi sia codificata da più di una combinazione di triplette (codone). Sebbene sia un codice ridondante, non è un codice ambiguo: in circostanze normali, un dato codone codifica uno e un solo amminoacido. Oltre ai 20 amminoacidi, ci sono anche tre “codoni di stop” dedicati alla traduzione finale. I tre codoni di stop hanno anche nomi colloquiali: UAA (ocra), UAG (ambra), UGA (opale), con UAA che è il più comune nei geni procarioti.

I nomi colloquiali sono stati avviati quando gli scopritori di UAG hanno deciso di nominare il codone dopo un amico il cui cognome è stato tradotto in "ambra". L'opale e l'ocra sono stati nominati per continuare l'idea di dare nomi di colore ai codoni di stop.

I codoni di stop vengono talvolta utilizzati anche per codificare quelli che oggi sono considerati i 21ns e 22ns aminoacidi, selenocisteina (UGA) e pirrolisina (UAG). È stato scoperto che questi amminoacidi sono codificati in modo coerente in alcune specie di prokarya e archaea.

Si noti che non ci sono codoni di inizio dedicati: invece, codici AUG sia per la metionina che per l'inizio della traduzione, a seconda delle circostanze, come spiegato subito. L'iniziale Met è una metionina, ma nei procarioti è una formil-metionina (f-Met) appositamente modificata. Anche il tRNA è specializzato ed è diverso dal tRNA che trasporta la metionina al ribosoma per l'aggiunta a un polipeptide in crescita. Pertanto, in riferimento a un tRNA iniziatore caricato, la nomenclatura usuale è fMet-tRNAio o fMet-tRNAF. Sembra anche esserci un po' più di margine di manovra nella definizione del sito di inizio nei procarioti rispetto agli eucarioti, poiché alcuni batteri usano GUG o UUG. Sebbene questi codoni normalmente codifichino rispettivamente valina e leucina, quando vengono utilizzati come codoni di inizio, il tRNA iniziatore porta in f-Met.

Sebbene il codice genetico come descritto sia quasi universale, ci sono alcune situazioni in cui è stato modificato e le modifiche sono state mantenute in ambienti evolutivamente stabili. I mitocondri in un'ampia gamma di organismi dimostrano cambiamenti stabili al codice genetico inclusa la conversione dell'AGA dalla codifica dell'arginina in un codone di stop e la modifica dell'AAA dalla codifica della lisina alla codifica dell'asparagina. Raramente si trova un cambiamento nella traduzione di un genoma organismico (nucleare), ma la maggior parte di queste rare alterazioni sono conversioni da o verso codoni di stop.

Esistono anche altre lievi alterazioni del codice genetico, ma l'universalità del codice in generale rimane. Alcuni DNA mitocondriali possono utilizzare diversi codoni di inizio: i ribosomi mitocondriali umani possono utilizzare AUA e AUU. In alcune specie di lievito, i codoni CGA e CGC per l'arginina non sono utilizzati. Molti di questi cambiamenti sono stati catalogati dal National Center for Biotechnology Information (NCBI) sulla base del lavoro di Jukes e Osawa presso l'Università della California a Berkeley (USA) e l'Università di Nagoya (Giappone), rispettivamente.


Codice genetico

I nostri redattori esamineranno ciò che hai inviato e determineranno se rivedere l'articolo.

Codice genetico, la sequenza dei nucleotidi nell'acido desossiribonucleico (DNA) e nell'acido ribonucleico (RNA) che determina la sequenza amminoacidica delle proteine. Sebbene la sequenza lineare dei nucleotidi nel DNA contenga le informazioni per le sequenze proteiche, le proteine ​​non sono prodotte direttamente dal DNA. Invece, una molecola di RNA messaggero (mRNA) viene sintetizzata dal DNA e dirige la formazione della proteina. L'RNA è composto da quattro nucleotidi: adenina (A), guanina (G), citosina (C) e uracile (U). Tre nucleotidi adiacenti costituiscono un'unità nota come codone, che codifica per un amminoacido. Ad esempio, la sequenza AUG è un codone che specifica l'amminoacido metionina. Ci sono 64 possibili codoni, tre dei quali non codificano per gli amminoacidi ma indicano la fine di una proteina. I restanti 61 codoni specificano i 20 amminoacidi che compongono le proteine. Il codone AUG, oltre a codificare per la metionina, si trova all'inizio di ogni mRNA e indica l'inizio di una proteina. La metionina e il triptofano sono gli unici due amminoacidi codificati da un solo codone (rispettivamente AUG e UGG). Gli altri 18 amminoacidi sono codificati da due a sei codoni. Poiché la maggior parte dei 20 amminoacidi è codificata da più di un codone, il codice è chiamato degenerato.

Si è scoperto che il codice genetico, un tempo ritenuto identico in tutte le forme di vita, diverge leggermente in alcuni organismi e nei mitocondri di alcuni eucarioti. Tuttavia, queste differenze sono rare e il codice genetico è identico in quasi tutte le specie, con gli stessi codoni che specificano gli stessi amminoacidi. La decifrazione del codice genetico è stata compiuta dai biochimici americani Marshall W. Nirenberg, Robert W. Holley e Har Gobind Khorana nei primi anni '60.

Le triplette di nucleotidi (codoni) che specificano diversi amminoacidi sono mostrate nella tabella.


I biologi creano cellule con 6 lettere di DNA, anziché solo 4

Per rivedere questo articolo, visita Il mio profilo, quindi Visualizza storie salvate.

Le cellule con un alfabeto genetico espanso potrebbero potenzialmente produrre una gamma più ampia di proteine. Immagine: Synthorx

Per rivedere questo articolo, visita Il mio profilo, quindi Visualizza storie salvate.

Una delle prime cose che impari in Biology 101 è che il codice genetico è composto da quattro lettere: A, T, C e G. Ognuna rappresenta un blocco chimico del DNA, la molecola che codifica le informazioni necessarie per costruire la vita mentre noi lo so. E se non dovessimo accontentarci di sole quattro lettere? Ora, gli scienziati hanno realizzato qualcosa che una volta si pensava impossibile: hanno creato cellule con un alfabeto genetico espanso che include altre due lettere.

"Ora abbiamo una cellula che sopravvive e vive con più informazioni nel suo genoma", ha affermato Floyd Romesberg, il biologo sintetico presso lo Scripps Research Institute di La Jolla, in California, che ha guidato il lavoro.

Avere più lettere con cui lavorare apre potenzialmente la porta a una vasta gamma di nuove molecole. (Un'analogia approssimativa: pensa a quante nuove pazze parole potresti scrivere con 39 lettere invece delle solite 26). Con ulteriori perfezionamenti, le cellule sintetiche potrebbero un giorno essere utilizzate per creare - o evolvere - proteine ​​che non esistono in natura, così come nuove sequenze di DNA e RNA, ognuna delle quali potrebbe essere utile per la ricerca, la diagnosi di malattie, o creare nuove terapie. Ma questo è ancora molto lontano.

Romesberg afferma che il suo laboratorio ha trascorso 15 anni a sviluppare il DNA con due lettere in più. In termini chimici, le lettere sono nucleotidi, i componenti del DNA le cui sequenze scandiscono le istruzioni per produrre le proteine. Le cellule, come ricorderete, producono proteine ​​trascrivendo il DNA in RNA e usando l'RNA come stampo per legare insieme gli amminoacidi in proteine. Le cellule devono anche copiare il loro DNA ogni volta che si dividono per creare più cellule. La sfida più grande, dice Romesberg, è stata assicurarsi che i due nuovi nucleotidi giocassero bene con gli enzimi che fanno tutto questo copia e trascrizione.

Nel 2012, gli scienziati hanno riportato una svolta: hanno dimostrato che il DNA di sei lettere che hanno creato potrebbe essere copiato e trascritto con successo nell'RNA in esperimenti in provetta.

. Immagine: Centro database per le scienze della vita (DBCLS)

Ma il DNA di sei lettere potrebbe effettivamente funzionare nell'ambiente molto più complesso e caotico di una cellula vivente?

Il nuovo studio suggerisce che può. Romesberg e colleghi sono riusciti a convincere E. coli batteri nel prendere il loro DNA di sei lettere e farne copie. Gli enzimi delle cellule hanno copiato le due nuove lettere, che gli scienziati chiamano X e Y in breve (da non confondere con i cromosomi X e Y che differenziano i ragazzi dalle ragazze), insieme alle solite quattro. Le cellule sono cresciute un po' più lentamente del normale, ma per il resto non sembravano peggio per l'usura, riferisce il team oggi in Natura.

Il lavoro è un risultato importante, afferma Steven Benner, un biologo sintetico presso la Foundation for Applied Molecular Evolution a Gainesville, in Florida. Dice che è la prima volta che qualcuno ha dimostrato che le cellule viventi possono replicare il DNA "quotalien" costruito da parti diverse dalle quattro lettere che si trovano in natura.

I prossimi passi, dice Romesberg, saranno determinare se le cellule possono anche trascrivere le coppie di basi innaturali nell'RNA e, in definitiva, usarle per produrre proteine. Con un alfabeto genetico più ampio, le cellule potrebbero potenzialmente codificare amminoacidi sintetici non presenti in natura e produrre nuove proteine ​​che sarebbe difficile, se non impossibile, sintetizzare direttamente.

Dovrebbe anche essere possibile ingannare le cellule sintetiche in proteine ​​in evoluzione o altre molecole che sono ottimizzate per vari compiti biologici, dice Romesberg. Ha avviato una società, Synthorx, per esplorare queste possibilità.

Secondo Benner, tuttavia, il potenziale commerciale potrebbe essere limitato dalla spesa per produrre i precursori molecolari dei nucleotidi X e Y, che devono essere aggiunti al fluido che bagna le cellule batteriche nell'impianto di Romesberg. Per questo motivo Benner sta lavorando a una strategia diversa: provare a riprogettare il metabolismo delle cellule per sintetizzare da sole i precursori. Ma questo approccio ha le sue sfide. È un "problema terribilmente difficile", ha detto Benner. Finora il suo team ha progettato cinque dei sei enzimi necessari, dice. "Ma l'ultimo è un dolore al collo"

Romesberg insiste che il costo non sarà proibitivo. Inoltre, afferma, l'obbligo di continuare ad alimentare i precursori X e Y ai batteri è in realtà un'importante salvaguardia: se alcuni degli insetti scappano dal laboratorio, torneranno rapidamente a produrre DNA naturale di quattro lettere.

Su questo punto Benner è d'accordo. "Il pubblico chiede sempre, creerai un mostro che fuggirà e conquisterà il mondo", ha detto. Benner pensa che quelle paure siano esagerate, specialmente in questo caso. "Se esce dal laboratorio, non andrà allo zoo di San Diego e inizierà a mangiare i pinguini."


Risultati

Idoneità del codice genetico rispetto agli errori di traduzione

Considera il codice genetico naturale. È costituito da 64 codoni, ciascuno costituito da tre basi di DNA consecutive (A, G, C, T) o basi di RNA (A, G, C, U). Questi 64 codoni sono divisi in 21 serie di sinonimi, ciascuno dei quali codifica per uno dei 20 amminoacidi naturali o corrisponde a un segnale di stop quindi, a ciascun codone, C, un amminoacido (o segnale di stop) un viene assegnato tramite una funzione un(C). Consideriamo ora un errore durante la trascrizione da DNA a RNA o durante la traduzione da RNA a proteina, in cui codone C viene scambiato per codone C'. Questo errore si traduce quindi in amminoacido un(C) essendo sostituito da amminoacido a' = a(C'). Il costo associato è stimato da una funzione g(a,a'), che misura la differenza tra gli amminoacidi un e un' per quanto riguarda le loro proprietà fisico-chimiche o il loro ruolo nella (de)stabilizzazione delle strutture proteiche quando un o un' corrisponde a un codone di stop, impostiamo g(a,a') = 0. Diverse funzioni di costo G sarà discusso nella sezione successiva. Seguendo Freeland e Hurst [23], l'idoneità di un codice è misurata dalla media del costo G su tutti i codoni C e tutti gli errori a base singola c -> c'

dove P(C' | C) è la probabilità di fraintendere il codone C come codone C'. Se ci si concentra solo sugli errori di trascrizione, come fanno Haig e Hurst in [22], allora tutto p(c'| c) i valori devono essere considerati uguali. Ma qui consideriamo errori di traduzione, come fanno Freeland e Hurst in [23], e quindi P(C' | C) cambia a seconda che ce c' differiscano nella prima, seconda o terza base, e conducano a una transizione oa una trasversione. Una transizione è la sostituzione di una purina (A, G) in un'altra purina, o una pirimidina (C, U/T) in un'altra pirimidina, mentre una trasversione scambia purine e pirimidine. Sulla base di dati sperimentali che indicano che le transizioni sono più comuni delle trasversioni [28,29,30,31], e che gli errori sulla terza base sono più frequenti degli errori sulla prima base, che a loro volta sono più frequenti degli errori sulla seconda base [10,26,27], Freeland e Hurst [23] hanno scelto i seguenti valori di P(C' |C), che usiamo anche qui:

p(c' | c) = 1/N se c e c' differiscono solo nella terza base,

P(C' | C) = 1/N se c e c' differiscono solo nella prima base e causano una transizione,

P(C' | C) = 0.5/N se c e c' differiscono solo nella prima base e causano una trasversione,

P(C' | C) = 0.5/N se c e c' differiscono solo nella seconda base e causano una transizione,

P(C' | C) = 0.1/N se c e c' differiscono solo nella seconda base e causano una trasversione,

P(C' | C) = 0 se c e c' differiscono di più di 1 base.

dove n è un fattore di normalizzazione che garantisce che ΣC'p(c' | c) = 1. Ovviamente, queste probabilità approssimano solo approssimativamente i veri bias di transizione/trasversione e posizione di base. Tuttavia, è stato dimostrato che l'idoneità calcolata del codice genetico è relativamente insensibile ai loro valori precisi [34].

Incorporare le frequenze degli amminoacidi nella funzione fitness

Torniamo ora alle correlazioni tra il numero di codoni che codificano per un amminoacido e la frequenza di questo amminoacido (vedi Figura 1). King e Jukes [33], che per primi hanno notato questa correlazione, hanno suggerito che la maggior parte degli amminoacidi nei genomi sono derivati ​​da mutazioni casuali che non influenzano le proprietà e la funzione delle proteine. Di conseguenza, il numero di codoni sinonimi determina la frequenza degli amminoacidi.

Un'interpretazione alternativa, assumendo una catena di causalità molto diversa, è che le frequenze degli amminoacidi siano fissate dalle loro proprietà fisico-chimiche. Ad esempio, il triptofano sarebbe un amminoacido raro perché le sue proprietà specifiche sono raramente necessarie nelle proteine ​​o perché è difficile da sintetizzare. La correlazione tra le frequenze degli amminoacidi e il numero di codoni sinonimi (Figura 1) verrebbe quindi interpretata come dovuta ad un adeguamento del codice genetico naturale alla frequenza degli amminoacidi. Le conclusioni raggiunte utilizzando queste due interpretazioni opposte sono affrontate nella Discussione.

Indipendentemente dalla catena di causalità ipotizzata, è naturale aspettarsi che un errore di codone che sostituisce un tipo di amminoacido frequente con un altro porti a errori più assoluti e quindi abbia più conseguenze, almeno in media, di un errore che colpisce un amminoacido raro . Le frequenze con cui i diversi amminoacidi si verificano nelle proteine, che sono simili in diversi organismi (Tabella 1), sono prese in considerazione solo in modo imperfetto nella funzione di fitness Φ FH data dall'equazione (1), a causa dell'imperfetta correlazione tra frequenza degli amminoacidi e numero di codoni sinonimi (Figura 1). Per tenere conto adeguatamente delle frequenze degli amminoacidi, proponiamo una funzione di fitness modificata Φ faa :

dove papà) è la frequenza relativa dell'amminoacido un, e n(C) è il numero di codoni nel blocco a cui C appartiene. In altre parole, n(C) è il numero di sinonimi che codificano per l'amminoacido un(C) Quello C codici per. Si noti che l'equazione (2) suppone che non vi sia alcun codon bias, ovvero che i diversi sinonimi di un dato amminoacido appaiano con la stessa frequenza.

Per misurare l'effetto della frequenza degli aminoacidi sul valore della funzione fitness Φ faa , definiamo, per motivi di confronto, un'altra funzione di fitness Φ equif dove si suppone che tutti gli amminoacidi siano ugualmente frequenti, cioè P(un) = 1/20:

Costo della sostituzione di un amminoacido con un altro

La funzione g(a,un') nelle equazioni (1) e (2) misura il costo - per quanto riguarda la stabilità e la struttura delle proteine ​​- della sostituzione dell'amminoacido un di un'. Questo costo dipende da diversi fattori fisico-chimici ed energetici. È noto che le interazioni idrofobiche costituiscono un contributo energetico dominante alla stabilità delle proteine. Quindi, una scelta naturale per G consiste nel prendere la differenza al quadrato di idrofobicità h degli amminoacidi un e un':

G idro (un, un') = (h(un) - h(un')) 2 (4)

Esistono varie scale di idrofobicità per gli amminoacidi. Ne abbiamo testati due. La prima è la scala di polarità definita da Woese et al. [35], che è quello usato da Haig e Hurst [22] e Freeland e Hurst [23]. Nella seconda scala, h(a) è l'accessibilità media al solvente dell'amminoacido un derivate da un insieme di 141 strutture proteiche ben risolte e raffinate con accessibilità al solvente a bassa identità di sequenza (vedi Metodi) sono calcolate utilizzando SurVol [36]. Indichiamo le funzioni di costo associate come G pol e G accesso , rispettivamente.

Sebbene le forze idrofobiche dominino nelle proteine, anche altri tipi di interazioni contribuiscono alla stabilità delle proteine ​​(vedi [24,25] per le revisioni). Abbiamo quindi anche tentato di escogitare una migliore funzione di costo g(a,a'), misurare più accuratamente la differenza tra gli amminoacidi un e un'. Questa nuova funzione è ispirata da recenti calcoli della variazione di energia libera di una proteina quando un singolo amminoacido è mutato [37,38,39]. Si ottiene mutando in silicio, in tutte le proteine ​​del suddetto insieme di 141 strutture proteiche e in tutte le posizioni, gli amminoacidi wild-type negli altri 19 possibili e valutando i cambiamenti risultanti nell'energia libera di ripiegamento con potenziali di forza medi derivati ​​dallo stesso set di dati di struttura. Gli elementi della matrice m(un,un') sono ottenuti come media di tutte le variazioni di energia libera di ripiegamento calcolate, che corrispondono a una sostituzione un → un'. Dettagli sulla procedura e sul valore degli elementi della matrice M(a,a') sono riportati nella sezione Metodi. Questa matrice è considerata una funzione di costo:

G mutare (un, un') = m(un, un') (5)

Ai fini del confronto G mutare con una matrice di riferimento che riflette esclusivamente la struttura del codice genetico, definiamo la funzione di costo:

G codice (un,un') = 3 - (un,un') (6)

dove (un,un') è zero quando un e un' coincidono, e altrimenti uguale al numero minimo di basi che devono essere cambiate per trasformare un codone che codifica per un in un codone che codifica per un'.

Come una funzione di ultimo costo, utilizzata solo per confronto con lavori precedenti [34,40], consideriamo le mutazioni puntiformi accettate 74-100 (PAM74-100) matrice di sostituzione [41], una delle matrici più comunemente utilizzate nel contesto dell'allineamento sequenza proteine:

G PAM (un, un') = PAM74-100 (un,un') (7)

Questa matrice è derivata dal modello delle frequenze di sostituzione degli amminoacidi osservate all'interno di coppie naturali di sequenze proteiche omologhe altamente divergenti. Tuttavia, l'uso di questa matrice per misurare l'idoneità del codice genetico [34,40] è stato criticato [42], poiché le matrici derivate da schemi di sostituzione osservati in proteine ​​omologhe riflettono non solo la somiglianza tra gli amminoacidi rispetto al loro aspetto fisico-chimico ed energetico proprietà, ma anche la facilità con cui un amminoacido viene mutato in un altro e quindi la loro vicinanza nel codice genetico. Tuttavia, come il PAM74-100 matrice è derivata da sequenze proteiche altamente divergenti, ci si può aspettare che questo effetto sia relativamente limitato. Questo è infatti il ​​caso, poiché il coefficiente di correlazione lineare tra gli elementi non diagonali di G PAM e G codice è solo 0,43. Tuttavia, il coefficiente di correlazione tra G mutare e G codice è ancora molto più basso, vale a dire 0,19, così che G mutare non si può in alcun modo sospettare di includere informazioni sulla prossimità nel codice genetico. Si noti infine che il coefficiente di correlazione tra G mutare e G PAM è pari a 0,60 queste matrici condividono quindi caratteristiche comuni ma contengono anche informazioni diverse. Ciò non sorprende considerando che le loro derivazioni utilizzano punti di partenza molto diversi (strutture tridimensionali proteiche in un caso, somiglianza di sequenza nell'altro).

Il codice genetico contro i codici casuali

Per valutare la robustezza del codice genetico naturale rispetto agli errori di traduzione, abbiamo calcolato le funzioni di fitness Φ FH , equif e faa utilizzando le equazioni da (1) a (3) per il codice genetico naturale e confrontandolo con le corrispondenti fitness dei codici casuali. I codici casuali sono ottenuti mantenendo la struttura a blocchi di codoni del codice genetico naturale, dove ogni blocco corrisponde a sinonimi che codificano per lo stesso amminoacido (o segnale di stop). Quando si genera un codice casuale, il segnale di stop viene mantenuto assegnato allo stesso blocco del codice genetico naturale, mentre i diversi amminoacidi vengono scambiati casualmente tra i 20 blocchi rimanenti. Pertanto, ogni codice casuale è semplicemente specificato da una diversa funzione a(c) nelle equazioni da (1) a (3). Questa è la procedura precedentemente utilizzata da Haig e Hurst [22] e Freeland e Hurst [23].

Quindi, in una prima fase, abbiamo calcolato le funzioni di fitness Φ equif e faa per il codice genetico naturale e per 10 9 codici generati casualmente, utilizzando le tre funzioni di costo G pol , G accesso e G mutare . Abbiamo quindi calcolato la frazione F di codici casuali il cui valore di è inferiore a quello del codice naturale. Questa frazione è presumibilmente una buona stima del merito relativo del codice genetico naturale rispetto ad altri codici. I risultati sono riportati nella Tabella 2. Sembra che questa frazione F è sempre più piccolo per faa che per equif . Ciò è particolarmente vero per la funzione di costo G mutare dove F è 300 volte più piccolo. Questo risultato indica che il codice naturale sembra essere meglio ottimizzato rispetto agli errori di traduzione se si tiene conto delle frequenze degli amminoacidi.

Per approfondire questo aspetto, abbiamo analizzato quale delle funzioni di costo G pol ,G accesso o G mutare il codice genetico sembra essere ottimizzato al meglio per. Abbiamo confrontato la frazione F di codici migliori per ciascuna delle funzioni di costo utilizzando la funzione fitness Φ faa . Per le funzioni di idrofobicità G pol e G accesso , il risultato è più o meno lo stesso: F è circa 0,5-1,0 su 10 6 . L'errore statistico relativo su questo valore è dell'ordine di n -1/2 , dove n è il numero di codici casuali migliore di quello naturale che sono stati trovati nel nostro campione di 10 9 codici casuali quindi, n è circa 650-1.200 e l'errore è insignificante. Per la funzione di costo mutazionale G mutare , F è di parecchi ordini di grandezza inferiore, vale a dire 2 su 10 9 .

Questo risultato mostra che il codice genetico naturale appare ancora più ottimale se la funzione di costo G mutare viene utilizzato rispetto a quando si considerano le funzioni di costo basate sull'idrofobicità. Come G mutare è stata calcolata da variazioni di stabilità proteica effettuate da mutazioni puntiformi, possiamo concludere che il codice genetico è ottimizzato in modo tale da limitare l'effetto degli errori di traduzione sulla struttura tridimensionale e sulla stabilità delle proteine ​​codificate. Si noti che il miglioramento apportato dalla scelta di G mutare risulta dal fatto che probabilmente spiega meglio il costo di una mutazione rispetto a una semplice differenza di idrofobicità, ad esempio, glicina, prolina e cisteina hanno stretti vicini nell'idrofobicità, mentre il costo della loro mutazione come spiegato da G mutare è alto. Ciò è dovuto al loro ruolo speciale nel determinare la struttura delle proteine: la glicina e la prolina possono adottare angoli di torsione dello scheletro essenzialmente inaccessibili ad altri amminoacidi e la cisteina può formare legami disolfuro.

Per verificare la significatività di questo risultato, abbiamo calcolato la frazione F di codici casuali che battono quello naturale per a caso scelte delle frequenze degli amminoacidi, distinte dalle frequenze naturali papà). Abbiamo generato 10 2 serie di casuali P(un) valori, e, per ciascuno di essi, stimata la frazione F (su un campione di 10 6 codici casuali). La percentuale di set di frequenza di amminoacidi casuali che risultano in una frazione inferiore F rispetto alle frequenze naturali è mostrato nella Tabella 3. Troviamo che un'assegnazione casuale delle frequenze degli amminoacidi non diminuisce/nella maggior parte (almeno il 97%) dei casi, e questa tendenza persiste per tutte le funzioni di costo G. Quindi, la probabilità che la diminuzione di F, osservata nella tabella 2, passando da Φ equif a faa , era dovuto al caso è piuttosto limitato. Possiamo quindi concludere che il codice genetico è ottimizzato in modo da tenere conto delle frequenze naturali degli amminoacidi.

Abbiamo anche studiato se il risultato che il codice naturale è meglio ottimizzato se si prendono in considerazione le frequenze degli amminoacidi non dipende in modo cruciale dalle frequenze degli amminoacidi utilizzate. A tal fine, abbiamo calcolato la frazione F di codici casuali con Φ lower inferiore faa valore rispetto al codice genetico per i quattro gruppi di frequenze degli amminoacidi elencati nella tabella 1, che sono calcolati dai genomi di eucarioti, archaea, batteri e da tutti questi genomi insieme. I risultati risultano sostanzialmente insensibili al set di frequenze prescelto: le frazioni F differiscono al massimo per un fattore due, il che lascia invariate tutte le conclusioni.

Abbiamo anche incluso nella Tabella 2 i risultati basati sulla funzione fitness Φ FH . Si può sostenere che questa funzione tiene conto in parte, ma in modo imperfetto, delle frequenze degli amminoacidi. Infatti, per questa funzione di fitness ad ogni codone viene assegnato lo stesso peso, che corrisponde ad ogni amminoacido a cui viene assegnata una frequenza proporzionale al numero di sinonimi n(un) codifica per esso. Nel caso del codice genetico naturale, questa frequenza corrisponde approssimativamente alla frequenza degli amminoacidi in quanto esiste una correlazione tra n(un) e P(un), come mostrato nella Figura 1. Ma per i codici casuali, in cui gli amminoacidi sono scambiati casualmente tra i blocchi di codoni, questa corrispondenza si interrompe. Quindi, il modo in cui Φ FH tiene conto delle frequenze degli amminoacidi dipende dal codice considerato. Questo spiega perché la frazione F di codici casuali migliore di quello naturale è più o meno dello stesso ordine usando Φ FH e equif . Notare che F è sempre più grande per FH che per faa , indicando nuovamente l'importanza delle frequenze degli amminoacidi nell'ottimalità del codice genetico.

Per fare un confronto, abbiamo aggiunto nella Tabella 2 i valori della frazione F di codici casuali con un Φ lower inferiore faa valore rispetto a quello naturale, utilizzando le funzioni di costo G PAM e G codice , che includono informazioni sulla struttura del codice genetico. Insieme a G PAM , la frazione F è lo stesso di con G mutare , mentre con G codice , non abbiamo trovato alcun codice casuale migliore di quello naturale tra i 10 9 codici casuali testati. Stimare F senza dover generare un insieme più ampio, abbiamo utilizzato la procedura seguente. Abbiamo calcolato, dai valori di faa per i 10 9 codici casuali, la funzione di probabilità π (Φ) faa avere un dato valore di faa . Abbiamo montato tronco d'albero(π (Φ) faa ) ad un polinomio di quarto grado, ed estrapolato questa curva fino al valore di faa per il codice naturale. Questo fornisce una stima della frazione F di codici casuali che hanno un . inferiore faa valore. Si noti che questa stima è essenzialmente insensibile al grado del polinomio. Abbiamo trovato con questa procedura che/è dell'ordine di 10 -17 con G codice , e quindi circa 10 8 volte più piccolo di con G PAM eG mutare .

Non sorprende che la frazione F di codici casuali che fa meglio del codice naturale è estremamente piccolo per G codice , in quanto tale matrice riflette esclusivamente la vicinanza degli amminoacidi nel codice genetico e rende tautologo il problema dell'idoneità del codice. Questo è stato sospettato per il G PAM anche funzione di costo [42]. Si può infatti sostenere che G PAM contiene informazioni sulla vicinanza degli amminoacidi nel codice genetico, sovrapposte alla misura desiderata della loro somiglianza nel preservare la struttura proteica, perché è calcolata dalle sostituzioni amminoacidiche nelle famiglie di proteine ​​evolutivamente correlate, che sono più frequenti tra amminoacidi che sono più vicini nel codice genetico. Il fatto che G PAM e G mutare resa simile F i valori (vedi Tabella 2) possono essere presi per indicare che non è così, e quindi che entrambe queste funzioni di costo possono essere utilizzate in modo affidabile per stimare l'idoneità del codice rispetto agli errori di traduzione. Questa interpretazione supporta analisi precedenti che utilizzavano il G PAM matrice [34,40]. Si potrebbe, tuttavia, anche sostenere che G PAM descrive la struttura proteica meno bene di G mutare e include qualche informazione in più sul codice genetico (come monitorato dai coefficienti di correlazione di 0,43 e 0,19 di G PAM e G mutare riguardo a G codice ). Questi due effetti tendono a compensarsi a vicenda e ci si potrebbe aspettare che producano risultati simili F valori per G PAM e G mutare . Sembra quindi più sicuro da usare G mutare come funzione di costo, perché, per la sua stessa definizione, sembra catturare importanti informazioni strutturali ed essere indipendente dalla struttura del codice.

Abbiamo anche studiato quanto sia ottimale il codice genetico rispetto agli scambi di aminoacidi che non influenzano la degenerazione del codone. Abbiamo generato in modo esaustivo tutti i codici alternativi che preservano la degenerazione degli amminoacidi e abbiamo calcolato la frazione F di questi codici che fanno meglio del codice naturale per quanto riguarda la traduzione errata. L'abbiamo trovato F è dell'ordine di 10 -6 per le tre funzioni fitness Φ faa , equif e FH (Tabella 4). È quindi simile al F valore calcolato sull'insieme illimitato di codici alternativi per Φ equif e FH , e molto più grande per Φ faa . Questo risultato riflette semplicemente la correlazione tra la degenerazione del codone e la frequenza degli amminoacidi (Figura 1). Infatti, questa correlazione implica che una proporzione molto maggiore dei codici migliori mantiene la degenerazione, se si tiene conto della frequenza degli amminoacidi nella funzione di fitness, come in faa . Al contrario, in Φ equif e FH la frequenza degli aminoacidi non è considerata e F è dello stesso ordine con gli insiemi ristretti e non ristretti.

È stato proposto che il codice genetico si sia evoluto da un codice ancestrale più semplice, codificando solo pochi amminoacidi presenti in tempi precoci, e che nuovi amminoacidi che apparivano come derivati ​​biosintetici di quelli originali fossero incorporati mediante suddivisione e riassegnazione dei loro codoni sinonimi [4,5,6,7]. Questa cosiddetta ipotesi di coevoluzione è supportata dall'osservazione che gli amminoacidi biosinteticamente correlati sono vicini all'interno del codice genetico [6,43]. Per studiare l'ottimalità del codice genetico nel quadro della coevoluzione, abbiamo calcolato la frazione F di codici alternativi che si comportano meglio del codice naturale contro gli errori di traduzione e che differiscono dal codice naturale mescolando gli amminoacidi appartenenti alla stessa via biosintetica [34,44]. I mescolamenti consentiti sono riportati nella legenda della Tabella 4. Abbiamo scoperto che F è pari a 2,9 × 10 -8 , mentre è pari a 2 × 10 -9 per l'insieme illimitato che consente tutti i rimescolamenti (Tabella 4). Ciò significa che la frazione F di codici migliori è leggermente maggiore nell'insieme limitato dalla biosintesi rispetto all'insieme completo, e quindi il tasso di ottimalità è leggermente inferiore. Questo risultato può essere visualizzato anche in modo diverso. Considerando il numero totale di codici nei due insiemi (che sono dell'ordine di 10 8 e 10 18 ), significa che ci sono solo sei codici che battono il codice naturale nell'insieme ristretto, mentre ci sono 10 9 di tali codici nell'insieme illimitato. Ciò è particolarmente sorprendente dato che le nostre definizioni di funzioni di costo e insiemi di amminoacidi biosinteticamente correlati costituiscono solo approssimazioni [45]. We can thus conclude that the genetic code is quite robust against mistranslation in the space of all alternative codes, and is close to being fully optimal if historical biosynthetic constraints are taken into account.

A complementary measure of the optimality of the genetic code is its percentage of optimization, defined as 100%(Φ codice - Φ Significare)/(Φ migliore - Φ Significare), dove codice is the fitness of the genetic code, Φ migliore fitness of the best of all possible codes and Φ Significare the average fitness over all codes [20,21,46]. This measure indicates how close the fitness value of the genetic code is to the fitness value of the optimal code. Note however that this optimality measure has no absolute meaning and may not be compared among fitness functions Φ defined on the basis of different cost functions G to illustrate this, consider the following example: if G idro is defined by |h(a)-h(a')| invece di (h(a)-h(a')) 2 (see Equation (4)), the fraction F of better codes remains unchanged but the percentage of optimality does change [34]. It is, however, meaningful to compare the percentage of optimization of the genetic code in the unrestricted and biosynthesis restricted sets with a same G funzione. For Φ faa , we find that this percentage is equal to 97% and 98% in the two sets, respectively. This indicates that the fitness value of the genetic code is not very far from that of the best possible code, whether focusing on the subset of alternative codes preserving biosynthetic proximities, or considering all possible codes.


Opzioni di accesso

Ottieni l'accesso completo al diario per 1 anno

Tutti i prezzi sono prezzi NETTI.
L'IVA verrà aggiunta in seguito al checkout.
Il calcolo delle tasse sarà finalizzato durante il checkout.

Ottieni l'accesso completo o limitato agli articoli su ReadCube.

Tutti i prezzi sono prezzi NETTI.


Expanded palette

But Sebastian Greiss and Jason Chin have re-engineered the nematode worm's gene-reading machinery to include a 21st amino acid, not found in nature.

Dr Chin of the Medical Research Council's Laboratory of Molecular Biology (where Francis Crick and James Watson first cracked the structure of DNA) describes the technique as "potentially transformational": designer proteins could be created that are entirely under the researchers' control.

The development builds on techniques first developed at the Scripps Research Institute, in La Jolla, US, where Dr Chin worked 10 years ago.

The genetic code comes in four DNA letters, A,C,G and T the genetic machinery reads it in words three letters long, called codons, which stand for the individual amino acid blocks to be built into a growing protein.

At Scripps, researchers showed in a paper in PNAS how one of those three letter words could be re-assigned, so that cells would read it as an instruction to incorporate an unnatural amino acid, one not normally found in living organisms. But that was in the bacterium E. coli until now, no one had succeeded in doing the same in a whole animal.

Jonathan Hodgkin, professor of genetics at Oxford University, welcomes the new development, saying it "creates exciting new opportunities for research on C. elegans".


Figura 4

Figure 4. Characterization of unnatural amino acid incorporation in yeast with the orthogonal MbPylRS/MmtDNACUA Pyl pair. (A) Amber suppression efficiency of hSOD33TAG-His6 in yeast in the presence or absence of 1 (5 mM), 2 (10 mM), 3 (10 mM), 4 (2 mM), or 5 (1.3 mM) by anti-His6 western blot. Yeast cells containing the hSOD expression construct were transformed with the dicistronic SctDNAUCU Arg −MmtDNACUA Pyl construct for expressing the orthogonal MmtDNACUA Pyl in yeast and the appropriate aminoacyl-tRNA synthetase (aaRS). PylRS (wild-type MbPylRS), AcKRS (a variant of MbPylRS that has been evolved to use 2(3)), TfaKRS (a variant of MbPylRS that can use 3, see text), PcKRS (a variant of MbPylRS that has been evolved to use 4(2)). (B) Coomassie SDS-PAGE analysis of purified hSOD from expressions in the presence and absence of 1, 2, o 3. Full protein MS (C−E) and Glu-C MS/MS (F−H) confirm the incorporation of unnatural amino acids 1 (C/F found 16691 ± 1.5 Da, expected 16691 Da), 2 (D/G found 16651 ± 1.5 Da, expected 16651) and 3 (E/H found 16705 ± 1.5 Da, expected 16705) at the genetically encoded site. hSOD is copurified as a heterodimer with yeast SOD (minor additional peak in spectra at 15722 Da identity was confirmed by Glu-C MS/MS). For full gels and western blots and larger versions of MS and MS/MS data see Supporting Information Figure 2.


Requirements of a Code

The information transfer from DNA to protein, called espressione genica , occurs in two steps. Nel primo passo, chiamato trascrizione , a DNA sequence is copied to make a template for protein synthesis called messenger ribonucleic acid (messenger RNA, or mRNA). During protein synthesis, ribosomi and transfer RNA (tRNA) use the genetic code to convert genetic information contained in mRNA into functional protein. (Formally speaking, the genetic code refers to the RNA-amino acid conversion code and not to DNA, though usage has expanded to refer more broadly to DNA.)

Mathematics reveals the minimum requirements for a genetic code. The ribosome must convert mRNA sequences that are written in four bases — A, G, U, and C — into proteins, which are made up of twenty different amino acids. A one base to one amino acid correspondence would code for only four amino acids (4 1 ). Similarly, all combinations of a two-base code (for example, AA, AU, AG, AC, etc.) will provide for only sixteen amino acids (4 2 ). However, blocks of three RNA bases allow sixty-four (4 3 ) combinations of the four nucleotides, which is more than enough combinations to correspond to the twenty distinct amino acids. So, the genetic code must use blocks of at least three RNA bases to specify each amino acid. (This reasoning assumes that each amino acid is encoded by the same size block of RNA.)

In addition, a ribosome must know where to start synthesizing a protein on an mRNA molecule and where to stop, and start and stop signals require their own RNA sequences. A series of experiments carried out in the 1960s confirmed these mathematical speculations, and went on to determine which triplet sequence (called a codone ) specifies which amino acid.

Indeed, the genetic code uses codons of three bases each, such as ACC or CUG. Therefore, the protein synthesis machinery reads every triplet of bases along the mRNA and builds a chain of amino acids — a protein — accordingly. Reading triplets, however, would allow a ribosome to start at any one of three positions within a given triplet (see Fig. 1). The position that the ribosome chooses is based on the location of the start signal and is called the "reading frame."

Experiments have shown all but three of the sixty-four possible codons that A, G, U, and C specify code for one amino acid each. This means that most amino acids are encoded by more than one codon. In other words, the genetic code is said to be redundant or degenerate. This redundancy allows the protein-synthesizing machinery of the cell to get by with less, as will be seen below. The three that don't, the "nonsense" codons, indicate the end of the protein-coding region of an mRNA, and are termed stop codons.


Expanding and Reprogramming the Genetic Code of Cells and Animals

Genetic code expansion and reprogramming enable the site-specific incorporation of diverse designer amino acids into proteins produced in cells and animals. Recent advances are enhancing the efficiency of unnatural amino acid incorporation by creating and evolving orthogonal ribosomes and manipulating the genome. Increasing the number of distinct amino acids that can be site-specifically encoded has been facilitated by the evolution of orthogonal quadruplet decoding ribosomes and the discovery of mutually orthogonal synthetase/tRNA pairs. Rapid progress in moving genetic code expansion from bacteria to eukaryotic cells and animals (C. elegans e D. melanogaster) and the incorporation of useful unnatural amino acids has been aided by the development and application of the pyrrolysyl–transfer RNA (tRNA) synthetase/tRNA pair for unnatural amino acid incorporation. Combining chemoselective reactions with encoded amino acids has facilitated the installation of posttranslational modifications, as well as rapid derivatization with diverse fluorophores for imaging.


19 Images of The Genetic Code Worksheet Answers

Hi there, Now we bring you some inspiring images that we've gathered in case you need them, for this time we are more concern related with The Genetic Code Worksheet Answers.

When we talk about The Genetic Code Worksheet Answers, below we can see particular variation of photos to complete your references. protein synthesis worksheet answer key, genetics monohybrid crosses worksheet answer key and breaking the code worksheet answers are three main things we want to show you based on the gallery title. Continue with more related things such genetic mutation worksheet answers, dna mutations practice worksheet answer key and simple genetics practice problems worksheet answers.

Our goal is that these The Genetic Code Worksheet Answers photos collection can be a guidance for you, give you more references and also help you get what you need. If you don't mind share your comment with us and our readers at comment form at last part of the page, and also, don't forget to tell people about this gallery if you know there are people out there that want references associated with these photos.

Suggerimenti utili per la progettazione di fogli di lavoro:

Breaking the Code Worksheet Answers attraverso

Protein Synthesis Worksheet Answer Key attraverso

DNA Mutations Practice Answer Key attraverso

Simple Genetics Practice Problems Answers attraverso

Genetic Mutation Answers attraverso

Genetics Monohybrid Crosses Answer Key attraverso

Genetics Answer Key attraverso

Genetics Answer Key attraverso

Mutations Answer Key attraverso

Genetics Review Answers attraverso

Human Genetic Disorders attraverso

Genetic Engineering Answers attraverso

Mutations Answer Key attraverso

Gene Mutations Answer Key attraverso

Mutations Answer Key attraverso

Simple Genetics Practice Problems Answers attraverso

Genetic Variation Answers attraverso

AP Biology Genetics attraverso

DNA Structure Answers attraverso

Our website built from persons which are really appraise original work from every one, without exception! That's why we always keep the original photos without changing anything including the copyright mark. Also, we ensure to include the owner link where we found it, below each photos. Many message came to us about their right in relation with the images on our gallery. If you want to make sure what is your right, you need to contact the website on each pictures, actually we cannot determine what is your right. We notice you, if there is no watermark does not mean the images can be freely used without permission.


Guarda il video: B10. Ereditarietà ed evoluzione - La sintesi delle proteine (Febbraio 2023).