Informazione

Calcolo del numero di amminoacidi nell'mRNA

Calcolo del numero di amminoacidi nell'mRNA


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Supponendo che ci fossero 20 diversi amminoacidi e meno di 40 tipi di diversi tRNA trovati in questo organismo alieno. Quanti amminoacidi si troverebbero nel prodotto traslazionale di un mRNA di 600 nucleotidi?


Sono molto confuso su come dovrei risolvere questa domanda.

Se assumiamo 1 codone = 1 nucleotide,

20 amminoacidi richiedono 20 codoni diversi = 20 nucleotidi diversi < 40 tRNA diversi.

Se assumiamo 1 codone = 2 nucleotidi,

20 amminoacidi richiedono 20 codoni diversi = 5 x 5 combinazioni di nucleotidi? (considerando A, V, C, G, U)?

5 x 5 = 25 < 40 diversi tRNA.

La risposta corretta è considerare 1 codone = 2 nucleotidi.

La mia domanda,

Poiché sia ​​1 codone = 1 nucleotide che 1 codone = 2 nucleotidi soddisfano i requisiti di questa domanda, perché 1 codone = 2 nucleotidi è la risposta corretta?


Penso di aver capito questo. Ho dovuto fare un po' di matematica. Con il nostro sistema a 4 nucleotidi, il numero di possibili codoni è 43 = 64. Questo è il numero di nucleotidi alla potenza della lunghezza del codone. La domanda ci chiede di determinare la lunghezza del codone fornendoci il numero di amminoacidi e un limite superiore sui tRNA. Usando la stessa formula,

#Nucleotidi(Codone-Lunghezza) = #Codoni,
dobbiamo trovare una combinazione di numero di nucleotidi e lunghezza del codone che dia tra 20 e 40 codoni.

Lunghezza codone Nucleotidi 1 2 3 4 5 2 2 4 8 16 32 3 3 9 27 81 243 4 4 16 64 256 1024 5 5 25 125 625 3125 6 6 36 216 1296 7776 7 7 49 343 2401 16807

Quindi, usando questa tabella, vediamo che alcune diverse combinazioni di numero di nucleotidi e lunghezza del codone si adatteranno a quell'intervallo. Un sistema a 2 nucleotidi potrebbe funzionare se ogni codone fosse lungo 5 basi. Un sistema a 3 nucleotidi potrebbe funzionare con 3 codoni lunghi di base. Un sistema a 4 basi non può funzionare, va da meno di 20 a più di 40. Un sistema a 5 basi può funzionare con 2 codoni di base. Un sistema a 6 basi può funzionare anche con codoni a 2 basi. 7 o più basi falliscono perché anche un codone a 2 basi produrrà più di 40 codoni.

Una lunghezza del codone di 1 nucleotide richiederebbe almeno 20 nucleotidi, quindi non sarebbe una buona risposta.

5 è probabilmente la risposta corretta perché funziona con la lunghezza del codone più breve, anche se non so come si otterrebbe l'accoppiamento di basi con un numero dispari di basi. Forse la quinta base si accoppia con se stessa. Un sistema a 6 basi può funzionare anche con la stessa lunghezza del codone e non richiederebbe una base autoaccoppiante. Tuttavia quella tabella mostra che diverse combinazioni potrebbero funzionare, quindi questa domanda potrebbe essere stata per vedere come difendi la tua risposta.


Quanti amminoacidi sono codificati da questa sezione di DNA? GCSE Biologia domanda AIUTO

Bene, su un articolo passato che stavo facendo, mi sono imbattuto in questa domanda:


"Guarda la sequenza delle basi per una sezione di DNA.

1) Quanti amminoacidi sono codificati da questa sezione di DNA?
2) Annotare il codice base del DNA complementare per questa sezione di DNA. "

Conosco la risposta dallo schema dei voti ora, ma non ho la più pallida idea di come si arriva alla risposta.

Qualcuno mi puó aiutare per piacere? e mi spieghi come trovi le risposte a queste due domande? GRAZIE MILLE.

Non è quello che stai cercando? Prova&hellip

1) Tre basi codificano per ogni amminoacido - quindi hai 9 basi -> codificano per 3 amminoacidi

2) C e G sono complementari e A e T sono complementari - quindi la risposta è CATGAGACT

Tre basi (cioè lettere) codificano per un amminoacido. Quindi, ci sono 9 lettere qui che significano 3 amminoacidi.

Il codice base è l'altro lato della doppia elica. Le basi 'G' si accoppiano sempre con le basi 'C'. Allo stesso modo, le basi "T" si accoppiano sempre con le basi "A". Quindi, puoi vedere come ho ottenuto la risposta 2 da quella =]

Tre basi codificano per un amminoacido

Le regole di abbinamento delle basi sono A-T G-C

Grazie!
quindi, SEMPRE, 3 basi codificano per 1 amminoacido? ma non capisco il secondo bit, so che AT-GC sono le coppie di basi complementari ma la risposta è CATGAGACT, come si accoppiano C e A e poi T e G e così via? o mi sbaglio, spiegami? grazie mille!

(Post originale di oli_G)
1) 3 aminoacidi

Tre basi (cioè lettere) codificano per un amminoacido. Quindi, ci sono 9 lettere qui che significano 3 amminoacidi.

Il codice base è l'altro lato della doppia elica. Le basi 'G' si accoppiano sempre con le basi 'C'. Allo stesso modo, le basi "T" si accoppiano sempre con le basi "A". Quindi, puoi vedere come ho ottenuto la risposta 2 da quella =]

(Post originale di SenFer)
Grazie!
quindi, SEMPRE, 3 basi codificano per 1 amminoacido? ma non capisco il secondo bit, so che AT-GC sono le coppie di basi complementari ma la risposta è CATGAGACT, come si accoppiano C e A e poi T e G e così via? o mi sbaglio, spiegami? grazie mille!

Ok, immagina una molecola di DNA come un lungo rettangolo. Da un lato ci sono le basi 'A' 'C' 'G' e 'T'. Questi stanno per le sostanze chimiche che stanno per "adenina", "timina", "guanina" e "citosina", se sei interessato. Ci devono essere basi anche sulla RHS. Il modo in cui queste coppie chimiche sono che "A" si accoppia sempre con "T" e "C" con "G". Quindi puoi immaginare che se conosci un lato di una struttura del DNA, puoi elaborare l'altro.

Ci sono più complicazioni come tRNA, RNA, mRNA e molti di loro che sono più complicati. Il DNA è la forma che questo materiale genetico assume all'interno del nucleo di una cellula corporea =]

(Post originale di oli_G)
Ok, immagina una molecola di DNA come un lungo rettangolo. Da un lato ci sono le basi 'A' 'C' 'G' e 'T'. Questi stanno per le sostanze chimiche che stanno per "adenina", "timina", "guanina" e "citosina", se sei interessato. Ci devono essere basi anche sulla RHS. Il modo in cui queste coppie chimiche sono che "A" si accoppia sempre con "T" e "C" con "G". Quindi puoi immaginare che se conosci un lato di una struttura del DNA, puoi elaborare l'altro.

Ci sono più complicazioni come tRNA, RNA, mRNA e molti di loro che sono più complicati. Il DNA è la forma che questo materiale genetico assume all'interno del nucleo di una cellula corporea =]

giusto se ancora non riesci a capirlo:
ecco come funziona l'abbinamento.

le 4 coppie di basi si accoppiano sempre in quel modo, quindi supponi di avere una sequenza di DNA che recita:

il DNA complementare dovrebbe leggere:

A
DO SOL
DO SOL
sol do
T A
A
G G
DO DO
A

spero questo sia di aiuto

(Post originale di SenFer)
Grazie!
quindi, SEMPRE, 3 basi codificano per 1 amminoacido? ma non capisco il secondo bit, so che AT-GC sono le coppie di basi complementari ma la risposta è CATGAGACT, come si accoppiano C e A e poi T e G e così via? o mi sbaglio, spiegami? grazie mille!

Se aiuta, l'adenina e la guanina (A e G) sono purine e la timina e la citosina (T e C) sono piramidine [come lo è l'uracile nell'RNA].

Le purine hanno due anelli di atomi di carbonio e di azoto e le piramidine hanno un anello di atomi di carbonio e di azoto.

Si accoppiano in modo che la doppia elica del DNA abbia una larghezza costante:
A e T = 2 + 1 anelli
G e C = 2 + 1 anelli

Pertanto il DNA è sempre largo 3 anelli per ogni coppia di basi (ad esempio, A e G sarebbero 4 e T e C sarebbero 2, il che rovinerebbe l'elica).

Non so se volevi davvero tutto questo, ma potrebbe renderlo più chiaro. Mi ha aiutato comunque perché dovrò fare un esame su di esso la prossima settimana.


Metodi

Base dell'approccio

Stima delle probabilità

Identificazione dei residui conservati utilizzando la ricostruzione della sequenza MP

Siano P′(i), P′(conservato), P′(conservato|i), e P′(i|conservato) i valori stimati di P(i), P(conservato), P(conservato|i) , e P(i|conservato), rispettivamente. Per stimare P′(conservato) e P′(i|conservato), occorre prima identificare i residui conservati. Sebbene i residui conservati siano spesso definiti come residui identici in tutte le sequenze discendenti, questa definizione è troppo restrittiva per i nostri scopi. Invece identifichiamo, nel miglior modo possibile, tutti i casi in cui un residuo rimane invariato tra l'antenato e una qualsiasi delle sue sequenze discendenti questo è coerente con la definizione di P(conservato) nelle equazioni (1a) e (1b) . Per facilitare questo processo, le sequenze ancestrali vengono parzialmente ricostruite tramite MP ( Eck e Dayhoff 1966 ), e queste vengono confrontate con sequenze moderne per identificare i residui conservati tra l'antenato e il discendente ( fig. 1B ). In ogni sito s lungo la sequenza, viene tabulato il numero di identità tra l'antenato dedotto e ciascuna delle sequenze discendenti per determinare P′(conservato) in s. Ad esempio, se tre delle quattro sequenze discendenti conservano il residuo originale nel sito s, P′(conservato) in s è 0,75. P′(conservato) viene quindi mediato su tutti i siti. P′(i|conserved) rappresenta semplicemente la composizione dei siti identificati come conservati tra l'antenato e uno qualsiasi dei discendenti ( fig. 1B ).

Come illustrato nella figura 1, questo metodo non identifica tutti i casi in cui è stato conservato un residuo tra l'antenato e il discendente, risultando in errori in P′(conservato) e P′(i|conservato). Tuttavia, questo metodo è preferibile a contare come conservati solo quei siti identici in tutti i discendenti perché in base a tale criterio i residui effettivamente conservati sarebbero molto più sottostimati e quindi P′(conservato) e P′(i|conservato) sarebbero ancora più fazioso. È importante sottolineare che l'errore in P′(i) derivante dall'errore in P′(conservato) e P′(i|conservato) può essere modellato tramite simulazione e preso in considerazione nella derivazione delle stime finali di P(i) (vedi Errore di modellazione in P′(i) attraverso la simulazione sotto).

Stima di P(conservato|i) utilizzando le matrici di probabilità di sostituzione

In teoria, oltre a P′(conservato) e P′(i|conservato), P′(conservato|i) potrebbe essere ottenuto anche attraverso il confronto di sequenze discendenti con sequenze ancestrali parzialmente ricostruite. Tuttavia, ottenere stime di tutte e tre le probabilità in questo modo porterebbe a valori di P′(i) equivalenti alla composizione delle sequenze parzialmente ricostruite (una volta normalizzati i valori per sommare a uno) questi valori di P′(i) sono dovrebbe essere sbilanciato verso quegli amminoacidi che hanno un'alta probabilità relativa di conservazione (questa aspettativa è stata confermata attraverso dati di simulazione non mostrati). Per superare questa difficoltà, vengono introdotte matrici di probabilità di sostituzione basate su dati empirici di proteine ​​come mezzo indipendente per ottenere P′(conservato|i).

Una matrice PAM 1 rappresenta le probabilità di sostituzione medie globali che si tradurranno in circa una sostituzione per 100 residui quando applicata a una sequenza con la stessa composizione media dell'insieme di sequenze utilizzato per derivare le matrici. Le probabilità di sostituzione per distanze evolutive maggiori possono essere calcolate come potenze della matrice PAM 1 (Dayhoff, Schwartz e Orcutt 1978, pp. 345-352) ciò richiede l'assunzione che le probabilità di sostituzione siano indipendenti dal tempo e dalla posizione all'interno della sequenza. Per modellare l'evoluzione composita di un grande insieme di sequenze in cui sono richieste solo probabilità di sostituzione medie, questa ipotesi è una prima approssimazione ragionevole, che è frequentemente utilizzata nella modellazione dell'evoluzione delle proteine ​​(Zhang e Nei 1997). I valori di P(conservato|i) sono quindi rappresentati dagli elementi diagonali della matrice di probabilità PAM corrispondenti a una data distanza evolutiva (Dayhoff, Schwartz e Orcutt 1978). Cioè, P(conservato|i) è la probabilità che l'amminoacido i sia sostituito da se stesso lungo la distanza evolutiva specificata.

L'utilizzo di questo approccio per stimare P(conservato|i) richiede quindi l'assunzione di un modello di evoluzione basato su un insieme di matrici empiriche, comune per le analisi evolutive delle proteine. Poiché si presume un orologio molecolare, indipendentemente dalle relazioni evolutive tra le sequenze discendenti, per qualsiasi amminoacido nell'antenato la frazione prevista di siti discendenti conservati è uguale alla probabilità di conservazione per quell'amminoacido a una data distanza evolutiva. Come notato in precedenza, l'errore nelle stime di P(i) derivante dalla deviazione dall'orologio molecolare presunto può essere modellato e compensato attraverso la simulazione.

Nel nostro approccio, sebbene P(conservato) e P(i|conservato) possano essere stimati come descritto in precedenza, P(i) e la distanza k da cui P(conservato|i) può essere stimato sono entrambi sconosciuti. Abbiamo quindi sviluppato il seguente metodo per identificare la distanza della matrice che separa le sequenze ancestrali e discendenti, e quindi P(conservato|i) e P(i), dato P(conservato) e P(i|conservato). Le matrici PAM di distanza k successivamente crescente vengono utilizzate per fornire P(conservato|i)K. Il metodo determina empiricamente la distanza k che meglio si adatta alle nostre stime di P(conservato) e P(i|conservato) come segue:

(1) Per ogni k(a) stima P(i) di P(i)K = P(i|conservato) × P(conservato)/P(conservato|i)K e (b) poiché queste probabilità dovrebbero sommarsi a 1.0, calcolare il fattore di normalizzazione αK tale che αKP(i)K = 1.0.

(2) Scegliere la matrice per la quale |log αK| è minimizzata, cioè la matrice k per la quale le stime di probabilità di P(i) richiedono la minima quantità di normalizzazione.

I corrispondenti valori normalizzati di P(i)K indicare P(i). Si può dimostrare che il nostro metodo trova l'intero k le cui stime di P(conservato|i) e P(i) minimizzano il termine dato nell'equazione (2c) (vedi Appendice). Lo stesso metodo può essere usato per derivare P′(conservato|i) e P′(i), dati P′(conservato) e P′(i|conservato).

Supponendo che venga analizzato un sottoinsieme rappresentativo di proteine ​​all'interno di un genoma, è più probabile che le matrici di sostituzione basate su buoni allineamenti globali di famiglie di proteine ​​generiche riflettano accuratamente le probabilità relative all'evoluzione dell'insieme. Tali matrici includono la matrice PAM originale di Dayhoff (Dayhoff, Schwartz e Orcutt 1978) e la sua versione aggiornata di Jones, Taylor e Thornton (1992). Poiché le matrici di Gonnet, Cohen e Benner (1992) sono basate su allineamenti di omologhi altamente divergenti, che sono intrinsecamente difficili da allineare, per i nostri scopi sono preferibili le matrici di Jones, Taylor e Thornton (1992). (Queste matrici sono basate su allineamenti di proteine ​​relativamente strettamente correlate [>85% identità].) Le matrici di Jones, Taylor e Thornton (1992), basate sulla versione 22 della banca dati SWISS-PROT, la cui versione attuale è descritta in Bairoch e Apweiler (2000), sono stati quindi utilizzati per tutte le analisi qui descritte. Questa serie è spesso utilizzata per rappresentare le probabilità di sostituzione per la modellazione evolutiva (vedi, ad esempio, Yang, Kumar e Nei 1995 Zhang e Nei 1997). Va notato che né le matrici basate su allineamenti locali, come BLOSUM, che sono sbilanciate verso gli interni proteici ( Henikoff e Henikoff 1992 ), né le matrici derivate da specifiche sottoclassi proteiche, come le proteine ​​transmembrana (ad esempio, Jones, Taylor e Thornton 1994 ), sono idonei a fornire stime di P(conservato|i).

Stime specifiche per lignaggio rispetto a stime aggregate

Piuttosto che mettere insieme i dati di più specie per arrivare a P′(conservato), P′(i|conservato), P′(conservato|i) e infine P′(i), stime indipendenti di P(i) per ogni lineage può essere fatto e poi mediato. Ciò consente l'eliminazione dell'assunzione di un orologio molecolare. Tuttavia, le differenze in P′(i) ottenute utilizzando dati aggregati o specifici del lignaggio erano insignificanti (dati non mostrati). Poiché il raggruppamento dei dati di tutte le linee facilita la modellazione e la correzione degli errori nelle stime, sono state utilizzate stime basate su dati aggregati.

Stima della composizione degli amminoacidi nella LUA

Scelta del set di proteine

Sebbene ci sia stata una discussione molto recente sulla natura della LUA (vedi per esempio Woese 1998), è sufficiente per i nostri scopi pensare alla LUA come una popolazione eterogenea o omogenea di organismi che alla fine si sono divisi nei tre lignaggi primari . Sulla base della loro presenza in eubatteri, archaea ed eucarioti, si ipotizza che circa 325 proteine ​​fossero presenti nella LUA (Kyrpides, Overbeek e Ouzounis 1999).

Si può dedurre che le proteine ​​ortologhe (omologhe sorte per speciazione) che sono presenti in un gruppo di specie moderne siano state presenti nel loro ultimo antenato comune. Per assemblare un insieme di proteine ​​che erano probabilmente presenti nella LUA, abbiamo utilizzato il database Clusters of Orthologous Groups (COG) ( Tatusov, Koonin e Lipman 1997 Tatusov et al. 2001 ) per selezionare tutte le proteine ​​ortologhe comuni a un gruppo di otto specie che includevano membri di ciascuno dei lignaggi primari: due archaea, Archeoglobus fulgidus e Methanobacterium thermoautotrophicum un eucariota, Saccharomyces cerevisiae e cinque eubatteri, Aquifex aeolicus, Thermotoga marittima, sinecocisti PCC6803, Escherichia coli, e Bacillus subtilis. Queste specie sono state scelte perché ci si aspettava che la loro diversità filogenetica massimizzasse l'estensione e l'accuratezza della ricostruzione della sequenza ancestrale. Duecentoquindici famiglie di proteine ​​nel database COG sono presenti in tutte e otto le specie.

L'inclusione nella ricostruzione di paralogs (omologhi derivanti dalla duplicazione genica) sorti prima dell'evento di speciazione che separa le specie invaliderebbe l'albero filogenetico delle specie ipotizzato. Nel database COG, sia gli ortologhi che i paraloghi strettamente correlati sono raggruppati in famiglie di proteine. Per ridurre al minimo la possibilità di includere paraloghi errati nelle ricostruzioni di sequenza, le famiglie di proteine ​​COG sono state incluse se avevano un solo membro proteico per specie per tutte le specie diverse dal lievito o se si poteva chiaramente determinare che i paraloghi esistenti erano sorti dopo la divergenza di specie. (L'albero fornito con ogni famiglia di proteine ​​COG è stato utilizzato per risolvere tutti i problemi relativi all'albero filogenetico delle proteine.) Per molte famiglie di proteine, il lievito ha un paralogo di origine mitocondriale oltre al vero ortologo. Si presumeva che l'omologo del lievito che si raggruppava con le specie archeali rappresentasse il vero ortologo ed è stato scelto per l'analisi. Questa restrizione ha ridotto il set di proteine ​​a 105 famiglie.

Poiché il trasferimento laterale invalida anche l'albero delle specie ipotizzato, è importante ridurre al minimo il numero di proteine ​​trasferite lateralmente incluse nell'insieme. Le analisi dell'intero genoma hanno suggerito che gli alberi filogenetici delle specie sono ampiamente coerenti con l'albero della piccola subunità rRNA (SSU rRNA) (e gli alberi della maggior parte delle proteine ​​informative, cioè proteine ​​che svolgono un ruolo nella replicazione, trascrizione o traduzione [ Fitz-Gibbon e House 1999 Teichmann e Mitchison 1999] ). Pertanto, abbiamo eliminato dal nostro set tutte le proteine ​​i cui alberi non erano coerenti con l'albero dell'rRNA SSU (Olsen, Woese e Overbeek 1994). A questo scopo, abbiamo applicato il criterio secondo cui le proteine ​​del lievito e degli archei dovrebbero raggrupparsi sull'albero proteico. Dopo l'applicazione di questa restrizione, nel set sono rimaste 65 proteine. Queste proteine ​​sono principalmente classificate come informative, la maggior parte svolge un ruolo nella traduzione. Le famiglie di proteine ​​COG incluse nell'analisi sono elencate nella tabella 1 .

Applicazione del metodo

Allineamenti di sequenze multiple creati dal programma Clustal W (1.74) (Thompson, Higgins e Gibson 1994) sono stati inseriti in un programma MP, protpars, parte del pacchetto software filogenetico PHYLIP (Felsenstein 1993). L'albero filogenetico basato sui dati della sequenza di ss rRNA (Olsen, Woese e Overbeek 1994) è stato assunto per la ricostruzione della sequenza. Sulla base del confronto tra le sequenze ricostruite e quelle esistenti, sono stati identificati i residui conservati, consentendo di derivare P′(i|conservato) e P′(conservato). Utilizzando queste stime, P′(conservato|i) e P′(i) sono stati determinati come descritto in precedenza. In totale, sono stati analizzati 164.730 residui delle otto specie per arrivare a P′(i). Ci riferiamo a questa stima come P′(i)LUA. La tabella 2 mostra i valori di P′(i|conservato), P′(conservato) e P′(conservato|i) utilizzati per arrivare a P′(i)LUA.

Errore di modellazione in P′(i) attraverso la simulazione

Le simulazioni sono comunemente impiegate per modellare l'evoluzione delle sequenze, tipicamente sono utilizzate per valutare le prestazioni di metodi filogenetici alternativi su dati noti (vedi per esempio Zhang e Nei 1997). Invece, utilizziamo simulazioni per modellare e correggere l'errore in P′(i) in modo che gli intervalli di confidenza possano essere determinati per P(i)LUA. Anticipiamo l'errore in P′(i|conservato), P′(conservato), e P′(conservato|i), e di conseguenza in P′(i) a causa dell'impossibilità di identificare tutti i veri residui conservati ( fig. 1B ) e violazione dell'assunzione di un orologio molecolare.

Le simulazioni sono state eseguite come segue: un insieme di n sequenze ancestrali di lunghezza determinata è stato generato casualmente secondo un dato P(i). La composizione amminoacidica ancestrale risultante è indicata come P(i)S. Le sequenze ancestrali sono state evolute per produrre sequenze discendenti basate su un albero filogenetico con lunghezze dei rami disuguali che riflettono le distanze evolutive medie all'interno dell'insieme proteico e una matrice di probabilità di sostituzione che rappresenta PAM 1 (Jones, Taylor e Thornton 1992). Pi)S del set di sequenze ancestrale è stato derivato utilizzando il nostro metodo e P(i)S − P′(i)S era determinato. Questa differenza è l'errore in P′(i)S.

Le fonti di errore modellate erano sistematiche e prevedibili. Innanzitutto, P′(conservato) è una sottostima di P(conservato) (valori rispettivamente di 0,3425 e 0,4584). Questa sottostima può essere spiegata dal fatto che qualsiasi posizione di sequenza in cui è stato conservato il residuo in almeno uno dei discendenti, ma per la quale non è stato assegnato un residuo ancestrale tramite MP, porterà a un sottoconteggio di P(conservato) ( vedere la figura 1B ). La sottostima di P(conservato) fa sì che P′(conservato|i)K da scegliere da una distanza PAM k maggiore di quella che sarebbe il vero valore di P(conservato) (più bassa è la conservazione tra le sequenze, maggiore è la distanza evolutiva tra di esse vedi eq. (2a) ).

Per capire come la distorsione in P′(conservato) e P′(conservato|i) interagiscono per provocare la distorsione in P′(i), è utile considerare il rapporto P′(conservato):P′(conservato|i) (vedi eq. (1b) ). All'aumentare della distanza PAM, il rapporto P(conservato):P(conservato|i) per qualsiasi amminoacido i diverge dall'unità (fig. 2). Questa tendenza vale per PAM = da 1 a 150, l'intervallo di distanze rilevanti per il nostro set di dati. Per quegli amminoacidi per i quali P(conservato):P(conservato|i) < 1.0, come il triptofano, il rapporto diminuisce all'aumentare del PAM, mentre per quegli amminoacidi per i quali P(conservato):P(conservato|i) > 1.0, come l'alanina, il rapporto aumenta (fig. 2). Pertanto, come conseguenza della sottostima di P(conservato), si osserva che per quegli amminoacidi per i quali P(conservato):P(conservato|i) < 1.0, P′(conservato):P′(conservato|i ) è una sottostima (P′(conservato):P′(conservato|i)/P(conservato):P(conservato|i) < 1.0 tabella 3 , colonne 2 e 3 fig. 2). Al contrario, per quegli amminoacidi per i quali P(conservato):P(conservato|i) > 1.0, questo rapporto è una sopravvalutazione (tabella 3, colonne 2 e 3 fig. 2).

D'altra parte, P′(i|conservato) è generalmente una sottostima per quegli amminoacidi per i quali P(conservato):P(conservato|i) > 1.0 e una sopravvalutazione per quelli per cui P(conservato):P(conservato |i) < 1.0 (tabella 3, colonna 4), l'arginina è l'unica eccezione. Questi bias osservati possono essere spiegati dal fatto che quegli amminoacidi con un P(conservato|i) relativamente alto hanno maggiori probabilità di essere conservati in un numero sufficiente di sequenze discendenti tale da poter assegnare il residuo ancestrale, e quindi è più probabile che essere correttamente identificati come conservati rispetto a quegli amminoacidi con un P(conservato|i) relativamente basso. Pertanto, i valori per P′(i|conservato) sono distorti a favore di amminoacidi con un P(conservato|i) relativamente alto (tabella 3, colonna 4).

Qualitativamente, il bias in P′(conservato):P′(conservato|i) e P′(i|conservato) si contrappone all'equazione (1b) . Per quegli amminoacidi con un P(conservato|i) relativamente basso, P′(i|conservato) è una sottostima, mentre P′(conservato):P′(conservato|i) è una sopravvalutazione ( tabella 3 , colonne 2– 4). Il contrario è vero per quegli amminoacidi con un P(conservato|i) relativamente alto. Quantitativamente, d'altra parte, la distorsione in P′(i|conservato) e P′(conservato):P′(conservato|i) non compensano con precisione, quindi c'è un errore netto in P′(i).

La natura prevedibile della distorsione rivelata in questo modo ha fornito la certezza che le simulazioni potrebbero essere utilizzate per modellare e correggere l'errore nelle stime basate su dati di sequenza reali.

Posizionamento di un intervallo di confidenza su P(i) nella LUA

Le simulazioni sono state eseguite con i parametri scelti per modellare il set di dati LUA. Per rappresentare l'insieme di sequenze ancestrali, 65 proteine ​​di 320 residui ciascuna (la lunghezza media delle sequenze analizzate) sono state generate casualmente utilizzando P′(i)LUA. Per generare un albero filogenetico che rappresenta l'insieme di sequenze, è stata prima determinata una matrice di distanza contenente le distanze medie a coppie tra le specie per l'intero insieme di proteine ​​LUA utilizzando il programma protdist del pacchetto PHYLIP (Felsenstein 1993). Il programma Fitch del pacchetto PHYLIP è stato utilizzato per convertire queste distanze in un albero filogenetico senza radici con lunghezze dei rami. Questo albero è stato convertito in un albero con la sua radice tra il lignaggio eubatterico e il lignaggio che ha dato origine agli archaea e agli eucarioti. Dopo l'evoluzione simulata per creare otto sequenze discendenti, erano disponibili 166.400 residui (un numero simile ai 164.730 residui del set di dati reale) per derivare P′(i|conservato)S, P′(conservato)S, P′(conservato|i)S, e quindi P′(i)S. Pi)S − P′(i)S, o l'errore in P′(i)S, è stato quindi determinato per ciascuna simulazione. Sono state eseguite cento simulazioni per ricavare le statistiche (media e deviazione standard) dell'errore in P′(i)S. Questo numero di simulazioni è stato sufficiente per stabilizzare i valori di queste statistiche.

La media e la deviazione standard dell'errore in P′(i)S oltre 100 simulazioni (tabella 4, colonne 4 e 5) sono state utilizzate per posizionare P(i)LUA entro intervalli di confidenza del 95%. Primo, bias in P′(i)LUA sono stati corretti aggiungendovi l'errore medio simulato (tabella 4, colonna 6). Limiti inferiore e superiore degli intervalli di confidenza al 95% per P(i)LUA sono stati determinati sottraendo o aggiungendo, rispettivamente, il doppio della deviazione standard dell'errore in P′(i)S a questi valori corretti ( tabella 4 , colonne 7 e 8). Questi intervalli di confidenza si basano sul presupposto che le simulazioni modellizzino accuratamente l'errore in P′(i)LUA.

Riepilogo del metodo utilizzato per stimare la composizione del set di proteine ​​in LUA

Abbiamo spiegato in dettaglio in precedenza in questo articolo ogni passaggio del nostro metodo e la sua applicazione per dedurre la composizione amminoacidica di un insieme di proteine ​​nella LUA. Può essere utile al lettore se ora lo riassumiamo. Innanzitutto, è stato scelto il set di proteine. Successivamente, le proteine ​​sono state allineate e sono state dedotte sequenze ancestrali parziali. Sono state quindi identificate le posizioni della sequenza conservata, consentendo di stimare P(i|conservato) e P(conservato). P(conservato|i) è stato stimato utilizzando una matrice di probabilità di sostituzione. Si potrebbe allora fare una stima iniziale di P(i). Infine, sono state utilizzate simulazioni di sequenza per modellare l'errore nelle stime di P(i), consentendo di posizionare un intervallo di confidenza su P(i) nella LUA.


INTRODUZIONE

I continui miglioramenti nella tecnologia di sequenziamento del DNA stanno rapidamente ampliando la nostra conoscenza dei genomi e, per deduzione (attraverso il codice genetico e la previsione di frame di lettura aperti), i proteomi delle specie esistenti. Queste sequenze di DNA e proteine ​​forniscono informazioni dettagliate sull'evoluzione molecolare. Combinati con le informazioni sulla funzione delle proteine ​​derivate da esperimenti biochimici e genetici, i dati sull'evoluzione molecolare possono far luce sulla relazione tra sequenza e funzione delle proteine. Il database PANTHER ( 1 , 2 ) è stato progettato per modellare le relazioni tra sequenza proteica e funzione per tutte le principali famiglie di proteine, utilizzando la costruzione di alberi di tassonomia molecolare combinata con l'interpretazione biologica umana degli alberi risultanti. Gli alberi vengono utilizzati per localizzare eventi di divergenza funzionale all'interno di famiglie proteiche che definiscono sottofamiglie di proteine ​​con funzione condivisa.

L'attuale versione di PANTHER (6.0) contiene alberi per oltre 5000 famiglie di proteine, suddivise in oltre 30.000 sottofamiglie funzionali. Per ogni famiglia e gruppo di sottofamiglia, viene costruito un allineamento di sequenze multiple che allinea posizioni "equivalenti" (cioè discendono dallo stesso codone ancestrale) in ciascuna delle proteine ​​​​del gruppo. Ciascun allineamento di sequenze multiple viene quindi rappresentato come un modello di Markov nascosto (HMM) che riassume, per ciascuna posizione, le probabilità che ciascuno dei 20 amminoacidi appaia (o di inserimenti e delezioni) in quella posizione nel dato gruppo di sequenze correlate.

I parametri HMM risultanti possono essere utilizzati in numerose applicazioni scientifiche. Ne discutiamo due qui. Il primo è la classificazione di nuove sequenze. Alla corrispondenza tra una sequenza e un HMM viene assegnato un punteggio calcolando la probabilità che la sequenza sia stata "generata" da quell'HMM e confrontandola con la probabilità che la sequenza sia stata generata da un HMM casuale della stessa lunghezza ( 3 ). Per una nuova sequenza, questo "punteggio" HMM può essere calcolato per ciascuna famiglia e sottofamiglia HMM e la sequenza è classificata come appartenente allo stesso gruppo dell'HMM con il punteggio migliore (a condizione che il punteggio sia anche statisticamente significativo). In PANTHER, poiché ogni HMM è classificato in base alle funzioni delle sue proteine ​​costituenti, le sequenze proteiche possono essere assegnate alle classi funzionali in modo robusto e coerente tra i diversi genomi. Attualmente, ci sono tre diverse classificazioni funzionali associate agli HMM PANTHER: funzione molecolare, processo biologico e componente in una via metabolica o di segnalazione nota. I termini della funzione molecolare e del processo biologico sono in gran parte un sottoinsieme di quelli della Gene Ontology ( 4 ), mentre i componenti della via metabolica e di segnalazione sono tratti principalmente dalla letteratura scientifica ( 2 ).

Gli HMM PANTHER, quindi, possono essere utilizzati per classificare i geni (tramite i loro prodotti proteici) in categorie funzionali in modo robusto e completo. Attualmente >75% delle proteine ​​umane [rappresentate dalle voci "riviste" nel database RefSeq ( 5 )] sono classificate in categorie di funzioni molecolari, una percentuale simile alle categorie di processi biologici e ∼25% a componenti in percorsi canonici. I raggruppamenti funzionali di geni sono stati utilizzati per l'analisi statistica dei risultati di esperimenti su scala genomica, come l'analisi dell'espressione genica ( 6 , 7 ), l'analisi dell'espressione proteica ( 8 ) e persino l'analisi della pressione selettiva evolutiva su un gran numero di geni ( 9 ). ).

Un altro uso di modelli statistici di famiglie e sottofamiglie di proteine ​​è la valutazione dei probabili effetti funzionali dei polimorfismi a singolo nucleotide non sinonimi (nsSNPs) ( 1 , 10 ). In questo caso, i modelli di conservazione della sequenza e divergenza trovati in proteine ​​correlate di diversi organismi, o altri geni negli stessi organismi, possono essere utilizzati per suggerire amminoacidi importanti per la funzione anche per varianti dello stesso gene in individui diversi (polimorfismi ). È probabile che gli amminoacidi che sono conservati nelle proteine ​​correlate nonostante un ampio tempo per divergere sono critici per la funzione. Simple conservation, where the same amino acid is found in all related proteins, is only the limiting case of non-random amino acid ‘profiles’ ( 11 ). Other profiles may arise from conservation of charge, hydrophobicity, or a number of other physico-chemical properties of amino acids, or from other functional or evolutionary constraints. These non-random profiles can be used to ‘score’ the likelihood of amino acid substitution to impact function, in a position-specific manner (i.e. different positions will have different amino acid profiles across the set of related sequences).


Source code

dCode retains ownership of the online 'Codons (Genetic Code)' tool source code. Except explicit open source licence (indicated CC / Creative Commons / free), any 'Codons (Genetic Code)' algorithm, applet or snippet (converter, solver, encryption / decryption, encoding / decoding, ciphering / deciphering, translator), or any 'Codons (Genetic Code)' function (calculate, convert, solve, decrypt / encrypt, decipher / cipher, decode / encode, translate) written in any informatic language (Python, Java, PHP, C#, Javascript, Matlab, etc.) and no data download, script, copy-paste, or API access for 'Codons (Genetic Code)' will be for free, same for offline use on PC, tablet, iPhone or Android ! dCode is free and online.


Difference Between Base Sequence and Amino Acid Sequence

Definizione

Base sequence refers to a particular order of nucleotide bases in a DNA or RNA molecule, while amino acid sequence refers to the arrangement of amino acids in a protein.

Type of Macromolecular Formation

Moreover, base sequence is responsible for the formation of either DNA or RNA, while the amino acid sequence is responsible for the formation of the primary structure of a protein.

Type of Bond Formation

Phosphodiester bonds form between two monomer units of the base sequence, while peptide bonds form between two monomer units of an amino acid sequence.

Funzione

The base sequence is responsible for storing genetic information and revealing them for protein synthesis, while the amino acid sequence is responsible for the production of structural or regulatory macromolecules .

Conclusione

A base sequence is a nucleotide sequence of either DNA or an RNA. Here, each nucleotide forms a phosphodiester bond with the adjacent nucleotide. Also, DNA and RNA are responsible for storing genetic information, and this information is important in protein synthesis. In contrast, the amino acid sequence is the sequence of amino acids in the primary structure of a functional protein. However, in between amino acids, peptide bonds occur. Therefore, the main difference between base sequence and amino acid sequence is their structure and functional importance.

Riferimenti:

1. Berg JM, Tymoczko JL, Stryer L. Biochemistry. 5th edition. New York: W H Freeman 2002. Section 5.5, Amino Acids Are Encoded by Groups of Three Bases Starting from a Fixed Point. Available Here.

Cortesia dell'immagine:

1. “DNA RNA structure (full)” By Thomas Shafee – Own work (CC BY 4.0) via Commons Wikimedia
2. “RNA-codon” By The original uploader was Sverdrup at English Wikipedia. (Public Domain) via Commons Wikimedia
3. “Kooditabel” By Yersinia (Public Domain) via Commons Wikimedia
4. “Ribosome mRNA translation en” By LadyofHats – Own work (Public Domain) via Commons Wikimedia
5. � Peptide Bond-01” By OpenStax College – Anatomy & Physiology, Connexions Web site. (CC BY 3.0) via Commons Wikimedia

Circa l'autore: Lakna

Lakna, laureata in biologia molecolare e biochimica, è una biologa molecolare e ha un ampio e vivo interesse per la scoperta di cose legate alla natura


  1. What are the roles of mRNA and tRNA in protein synthesis?
  2. What is the initiation codon?
  3. What are the termination codons and how are they recognized?
  1. mRNA provides the code that determines the order of amino acids in the protein tRNA transports the amino acids to the ribosome to incorporate into the growing protein chain.
  2. AUG
  3. UAA, UAG, and UGA they are recognized by special proteins called release factors, which signal the end of the translation process.

Mrna And Transcription Worksheet

Use the correct complimentary base pairing. Rna polymerase binds to the promoter site tata box start on the dna 2.

Mrna And Transcription Worksheet Answers In 2020 Transcription And Translation Worksheets Scientific Method Worksheet

If several sequences might work choose any one.

Mrna and transcription worksheet. This strand of mrna is edited before leaving the nucleus carrying the code. Genetic information is passed from dna to rna through a process called transcription. Rna polymerase adds rna nucleotides complimentary to the dna strand 3.

Using the genetic code chart fill in the amino acids for each dna strand. Some of the worksheets for this concept are transcription and translation practice work dna transcription translation protein synthesis review work dna replication protein synthesis questions work mrna codingdecoding work transcription and translation work help work dna rna and protein synthesis transcription and translation work fill in dna. To the right construct a messenger rna molecule from a dna strand.

Displaying top 8 worksheets found for mrna and transcription. For each of the following sequences fill in either the dna the mrna sequence the rrna anticodons or the amino acid sequences that have been left blank. On the worksheet make the dna strand into mrna codons review transcription to protein synthesis sheet.

Codons can either encode a specific amino acid a start signal for translation or a stop signal to mark the end of translation. About this quiz worksheet. This quiz worksheet combo will check your understanding of this process.

Previous to referring to mrna and transcription worksheet please recognize that training is definitely our crucial for an even better another day in addition to finding out doesn t only stop after a university bell rings which staying stated most of us provide a number of uncomplicated still beneficial content articles as well as web templates made ideal for any kind of instructional purpose. Making a messenger rna using dna as a template is called. In the cytoplasm mrna delivers the code to the.

Many businesses are using these as a way to capture their customers and potential clients with detailed reports on their clients company and employees. A set of three letter combinations of nucleotides is called a codon. Mrna building is complete when the rna polymerase reaches a termination stop site on the dna 4.

On the worksheet make the mrna codons into trna codons review transcription to protein synthesis sheet. Use colored pencils to show the dna and mrna strands. The mrna that is created in the process of transcription comprises a sequence of nucleotides.

Mrna and transcription worksheet worksheet october 04 2018 17 06 if you re not familiar with mrna and transcription worksheets then you might be losing some business to the competition. Transcription dna message is converted into mrna format translation mrna message is converted into protein dna is the informational molecule which specifies the structure of proteins using rna intermediate.

Transcription Worksheet Key Worksheetsuatechnicsz Transcription And Translation Dna Transcription And Translation Dna Transcription

Dna Coloring Transcription Translation Transcription And Translation Dna Replication Transcription

3c079434ce5efb73da784483f6f0a133 Jpg 736 568 Transcription And Translation Dna Transcription And Translation Dna Transcription

Pin By Catherine Brinfour On Biology Biology Lessons Biology Worksheet Transcription And Translation

Transcription Translation Worksheets Answer Key Transcription And Translation Dna Transcription And Translation Dna Transcription

Translation Transcription Worksheet Biology High School 9th 10th Grade Dna Mr Transcription And Translation Dna Transcription And Translation Biology Worksheet

Transcription Worksheet 6 Rna Worksheet Biological Science Picture Directory Pulpbits Net Science Worksheets Life Skills Dna Facts

Protein Synthesis Worksheet Transcription And Translation Protein Synthesis Science Lessons

Pin On Printable Worksheet

Protein Synthesis Worksheet Answer Key Transcription And Translation Protein Synthesis Biology Worksheet

Transcription And Translation Worksheet 2 Transcription And Translation Practices Worksheets Worksheet Template

Transcription And Translation Worksheet Answers Homeschooldressage Com In 2020 Transcription And Translation Dna Transcription And Translation Dna Transcription

Dna Transcription And Translation Review Transcription And Translation Biology Lessons Transcription

Pin On Printable Worksheet

Protein Synthesis Worksheet Dna And Rna Dna Transcription Transcription And Translation Dna Transcription And Translation

Protein Synthesis Diagram Worksheets Biology Lessons Study Biology Biology Worksheet

Pin By Sentinelblue On This Is Biology Transcription And Translation Dna Transcription And Translation Dna Transcription

Replication Transcription And Translation Worksheet Transcription And Translation Transcription 10th Grade Science


Il codice genetico

How is the information in a gene encoded? The answer is the genetic code. Il genetico codice consists of the sequence of nitrogen bases&mdashA, C, G, U&mdashin an mRNA chain. The four bases make up the &ldquoletters&rdquo of the genetic code. The letters are combined in groups of three to form code &ldquowords,&rdquo called codoni. Each codon stands for (encodes) one amino acid, unless it codes for a start or stop signal.

There are 20 common amino acids in proteins. There are 64 possible codons, more than enough to code for the 20 amino acids. The genetic code is shown in Figura sotto. To see how scientists cracked the genetic code, go to this link: http://www.dnalc.org/view/16494-Animation-22-DNA-words-are-three-letters-long-.html.

The Genetic Code. To find the amino acid for a particular codon, find the cell in the table for the first and second bases of the codon. Then, within that cell, find the codon with the correct third base. For example CUG codes for leucine, AAG codes for lysine, and GGG codes for glycine.

Reading the Genetic Code

As shown in Figura above, the codon AUG codes for the amino acid methionine. This codon is also the codone di inizio that begins translation. The start codon establishes the reading frame of mRNA. Il reading frame is the way the letters are divided into codons. After the AUG start codon, the next three letters are read as the second codon. The next three letters after that are read as the third codon, and so on. Questo è illustrato in Figura sotto. The mRNA molecule is read, codon by codon, until a codone di stop is reached. UAG, UGA, and UAA are all stop codons. They do not code for any amino acids. Stop codons are also known as termination codons.

Reading the Genetic Code. The genetic code is read three bases at a time. Codons are the code words of the genetic code. Which amino acid does codon 2 in the drawing stand for?


Ribosoma

Sguardo veloce:
Un ribosoma funziona come una micro-macchina per produrre proteine. I ribosomi sono composti da proteine ​​speciali e acidi nucleici. La TRADUZIONE delle informazioni e il Collegamento degli AMINOACIDI sono al centro del processo di produzione delle proteine.
Un ribosoma, formato da due subunità che si legano insieme, funziona per: (1) Tradurre le informazioni codificate dal nucleo cellulare fornite dall'acido ribonucleico messaggero (mRNA), (2) Collegare insieme gli amminoacidi selezionati e raccolti dal citoplasma mediante trasferimento di acido ribonucleico ( tRNA). (L'ordine in cui gli amminoacidi sono collegati tra loro è determinato dall'mRNA) e, (3) Esporta il polipeptide prodotto nel citoplasma dove formerà una proteina funzionale.

I ribosomi si trovano ‘liberi’ nel citoplasma o legati al reticolo endoplasmatico (ER) per formare ER ruvido. In una cellula di mammifero possono esserci fino a 10 milioni di ribosomi. Diversi ribosomi possono essere attaccati allo stesso filamento di mRNA, questa struttura è chiamata polisoma. I ribosomi hanno solo un'esistenza temporanea. Quando hanno sintetizzato un polipeptide, le due subunità si separano e vengono riutilizzate o disgregate.

I ribosomi possono unire gli amminoacidi a una velocità di 200 al minuto. Piccole proteine ​​possono quindi essere prodotte abbastanza rapidamente, ma sono necessarie da due a tre ore per proteine ​​più grandi come la titina, una massiccia proteina muscolare da 30.000 amminoacidi.

I ribosomi nei procarioti utilizzano un processo leggermente diverso per produrre proteine ​​rispetto ai ribosomi negli eucarioti. Fortunatamente questa differenza presenta una finestra di opportunità molecolari per l'attacco di farmaci antibiotici come la streptomicina. Sfortunatamente anche alcune tossine batteriche e il virus della poliomielite lo usano per consentire loro di attaccare il meccanismo di traduzione.

Per un diagramma generale della produzione di proteine, fare clic qui.
(Il diagramma si aprirà in una finestra separata)

Questa è un'immagine al microscopio elettronico che mostra una parte del reticolo endoplasmatico ruvido in una cellula radice di una pianta di mais. Le macchie scure sono ribosomi.

(per gentile concessione di Chris Hawes, The Research School of Biology & Molecular Sciences, Oxford Brookes University, Oxford, UK)

UNO SGUARDO PI LUNGO ai ribosomi:

I ribosomi sono unità di produzione macromolecolari. Sono composti da proteine ​​ribosomiali (riboproteine) e acidi ribonucleici (ribonucleoproteine). La parola ribosoma deriva dal prendere 'ribo' dall'acido ribonucleico e aggiungendolo a 'soma', la parola latina per corpo. I ribosomi possono essere legati da una(e) membrana(e) ma non sono membranosi.

Ribosoma: una micro-macchina per la produzione di proteine
Un ribosoma è fondamentalmente una micro-macchina molto complicata ma elegante per la produzione di proteine. Ogni ribosoma completo è costituito da due subunità. Un ribosoma eucariotico è composto da acidi nucleici e circa 80 proteine ​​e ha una massa molecolare di circa 4.200.000 Da. Circa due terzi di questa massa è composta da RNA ribosomiale e un terzo da circa 50+ diverse proteine ​​ribosomiali.

I ribosomi si trovano nelle cellule procariotiche ed eucariotiche nei mitocondri, nei cloroplasti e nei batteri. Quelli trovati nei procarioti sono generalmente più piccoli di quelli negli eucarioti. I ribosomi nei mitocondri e nei cloroplasti sono di dimensioni simili a quelli dei batteri. Ci sono circa 10 miliardi di molecole proteiche in una cellula di mammifero e i ribosomi ne producono la maggior parte. Una cellula di mammifero in rapida crescita può contenere circa 10 milioni di ribosomi. [Una singola cella di E. Coli contiene circa 20.000 ribosomi e questo rappresenta circa il 25% della massa cellulare totale].

Le proteine ​​e gli acidi nucleici che formano le subunità ribosomiali sono prodotte nel nucleolo ed esportate attraverso i pori nucleari nel citoplasma. Le due sottounità sono di dimensioni diverse ed esistono in questo stato fino a quando non sono necessarie per l'uso. La subunità più grande è circa il doppio di quella più piccola.

La subunità più grande ha principalmente una funzione catalitica, quella più piccola ha principalmente una funzione di decodifica. Nella grande subunità ribosomiale l'RNA svolge la funzione di un enzima ed è chiamato ribozima. L'unità più piccola si collega all'mRNA e quindi si aggancia a una subunità più grande. I ribosomi una volta formati non sono unità statiche. Quando la produzione di una specifica proteina è terminata, le due subunità si separano e vengono solitamente scomposte. I ribosomi hanno solo un'esistenza temporanea.

A volte le subunità ribosomiali ammettono l'mRNA non appena l'mRNA emerge dal nucleo. Quando molti ribosomi fanno questo, la struttura è chiamata polisoma. I ribosomi possono funzionare in uno stato "libero" nel citoplasma, ma possono anche "stabilirsi" sul reticolo endoplasmatico per formare un "reticolo endoplasmatico ruvido". Laddove è presente un reticolo endoplasmatico ruvido, l'associazione tra ribosoma e reticolo endoplasmatico (RE) facilita l'ulteriore elaborazione e controllo delle proteine ​​di nuova produzione da parte dell'ER.

La Fabbrica delle Proteine: sito e servizi.

Tutte le fabbriche hanno bisogno di servizi come gas, acqua, drenaggio e comunicazioni. Affinché questi possano essere forniti, è necessario un luogo o un sito.

Anche la produzione di proteine ​​richiede requisiti di servizio. Un sito che richiede la fornitura di servizi viene prodotto in una piccola subunità ribosomiale quando un filamento di mRNA entra attraverso una fessura selettiva e un filamento di tRNA iniziatore attraverso un altro. Questa azione fa sì che la piccola subunità si agganci a una grande subunità ribosomiale per formare un ribosoma completo e attivo. Lo straordinario processo di produzione delle proteine ​​può ora iniziare.

Perché la traduzione e la sintesi proteica avvengano sono coinvolti molti iniziatori e sostanze chimiche di rilascio e hanno luogo molte reazioni che utilizzano enzimi. Ci sono però requisiti generali e questi devono essere soddisfatti. L'elenco seguente mostra i principali requisiti e come vengono forniti:

  • Requisiti: Una struttura sicura (senza contaminazioni) e adatta per il processo di produzione delle proteine.
  • Fornitura: questa funzione è fornita dalle due subunità ribosomiali. Quando le due subunità si uniscono per formare il ribosoma completo, le molecole che entrano ed escono possono farlo solo attraverso fessure o tunnel selettivi nella struttura molecolare.
  • Requisiti: Una fornitura di informazioni in una forma che il ribosoma può tradurre con un alto grado di accuratezza. La traduzione deve essere accurata affinché vengano prodotte le proteine ​​corrette.
  • Fornitura: L'informazione è fornita dal nucleo e consegnata al ribosoma sotto forma di un filamento di mRNA. Quando l'mRNA si forma nel nucleo, gli introni (sezioni non codificanti) vengono tagliati e gli esoni (sezioni codificanti) vengono uniti insieme da un processo chiamato splicing.
  • Requisiti: Un apporto di amminoacidi da cui il meccanismo ribosomiale può ottenere gli amminoacidi specifici necessari.
  • Fornitura: Gli amminoacidi, principalmente forniti dal cibo, sono normalmente disponibili liberamente nel citoplasma.
  • Requisiti: Un sistema in grado di selezionare e agganciare un amminoacido nel citoplasma e consegnarlo al sito di traduzione e sintesi nel ribosoma.
  • Fornitura: Brevi filamenti di acido ribonucleico di trasferimento (tRNA) prodotti nel nucleo e disponibili nel citoplasma fungono da "strumenti adattatori". Quando un filamento di tRNA si è agganciato a un amminoacido, si dice che il tRNA è "carico". Il tRNA si diffonde nella subunità ribosomiale più piccola e ogni breve filamento di tRNA consegnerà UNO amminoacido.
  • Requisiti: Un mezzo per rilasciare nel citoplasma: (un) un polipeptide di nuova formazione, (B) mRNA che è stato utilizzato nel processo di traduzione, e (C) tRNA che ha rilasciato l'amminoacido che stava trasportando ed è ora "scaricato".
  • Disposizione: (a) quando una catena peptidica di nuova formazione viene prodotta in profondità all'interno della grande subunità ribosomiale, viene diretta verso il citoplasma lungo un tunnel o una fessura. (B) L'mRNA "usato" lascia la subunità ribosomiale più piccola attraverso un tunnel sul lato opposto al suo punto di ingresso. Il movimento attraverso il ribosoma è determinato da un movimento unidirezionale intermittente del ribosoma lungo e nella direzione del filamento di mRNA in arrivo. (C) Il tRNA allo stato "non caricato" lascia attraverso un tunnel nell'architettura molecolare della grande subunità ribosoma.

La fabbrica delle proteine: cosa succede all'interno?
– Uno sguardo alla linea di produzione delle proteine ​​che può unire gli amminoacidi alla velocità di 200 al minuto!

Ora che abbiamo considerato i requisiti e le disposizioni necessarie per il funzionamento della macchina per la produzione di proteine, possiamo esaminare il funzionamento interno.

Come accennato in precedenza, nel ribosoma avvengono molte reazioni biochimiche dettagliate e qui viene fornita solo una breve descrizione per illustrare il concetto.
(Si prega di vedere anche "schema del ribosoma" alla fine della sezione)

Nel ribosoma ci sono TRE FASI e TRE SITI operativi coinvolti nella linea di produzione delle proteine.

I tre FASI sono (1) Iniziazione, (2) Allungamento e (3) Terminazione.

I tre operativi o vincolanti SITI sono A, P e E lettura dal sito di ingresso dell'mRNA (convenzionalmente il lato destro).

Siti A e P abbracciano entrambe le subunità ribosomiali con una parte più grande che risiede nella subunità ribosomiale grande e una parte più piccola nella subunità più piccola. Sito E, il sito di uscita, risiede nella subunità ribosomiale grande.

Tabella dei siti di legame, posizioni e funzioni in un ribosoma
(vedi anche lo schema del ribosoma alla fine della sezione)

Sito vincolante

sito di ingresso del filamento di mRNA

termine biologico

Principali processi

Ammissione del codone dell'mRNA e del filamento "carico" del tRNA. Controllo e decodifica e inizio della "consegna" di una molecola di amminoacido

Sintesi peptidica, consolidamento, allungamento e trasferimento della catena peptidica al sito A

siTe E

Preparazione del tRNA "non caricato" per l'uscita

Le tre fasi:

  1. Iniziazione. Durante questa fase una piccola subunità ribosomiale si collega alla "estremità iniziale" di un filamento di mRNA. Anche il 'tRNA iniziatore' entra nella piccola subunità. Questo complesso si unisce quindi a una grande subunità ribosomiale. All'inizio del filamento di mRNA c'è un messaggio di "inizio traduzione" e un filamento di tRNA "caricato" con uno specifico amminoacido, entra sito A del ribosoma. La produzione di un polipeptide è stata avviata. Affinché il tRNA non venga rifiutato, il gruppo di codice a tre lettere che trasporta (chiamato anti-codone) deve corrispondere al gruppo di codice a tre lettere (chiamato codone) sul filamento di mRNA già nel ribosoma. Questa è una parte molto importante del traduzione processo ed è sorprendente come si verifichino pochi "errori di traduzione". [In generale il particolare amminoacido che trasporta è determinato dall'anticodone di tre lettere che porta, ad es. se il codice di tre lettere è CAG (Cytosina, UNdenina, Guanina) quindi selezionerà e trasporterà l'aminoacido Glutammina (Gln)].
  1. Allungamento.Questo termine copre il periodo tra l'inizio e la fine ed è durante questo periodo che viene prodotta la parte principale della proteina designata. Il processo consiste in una serie di cicli, il cui numero totale è determinato dall'mRNA. Uno degli eventi principali durante l'allungamento è traslocazione. Questo è quando il ribosoma si muove lungo l'mRNA di una tacca di codone e inizia un nuovo ciclo. Durante il processo di "avvio" il "tRNA di inizio" si sarà spostato a sito P (vedi schema del ribosoma alla fine della sezione) e il ribosoma sarà ammesso in sito A, un nuovo tRNA "caricato" con un amminoacido. Il tRNA "caricato" risiede in sito A fino a quando non è stato controllato e accettato (o rifiutato) e fino a quando la catena peptidica in crescita si è attaccata al tRNA in sito P, è stato trasferito attraverso gli enzimi, al tRNA "carico" in sito A. Here one new amino acid is donated by the tRNA and added to the peptide chain. By this process the peptide chain is increased in length by increments of one amino acid. [The peptide bond formation between the growing peptide chain and the newly admitted amino acid is assisted by peptidyl transferase and takes place in the large ribosome sub-unit. The reaction occurs between tRNA that carries the nascent peptide chain, peptidyl-tRNA and the tRNA that carries the incoming amino acid, the aminoacyl-tRNA]. When this has taken place the tRNA in sito P, having transferred its peptide chain, and now without any attachments, is moved to site E the exit site.Next, the tRNA in sito A, complete with a peptide chain increased in length by one amino acid, moves to sito P. In sito P riboproteins act to consolidate the bonding of the peptide chain to the newly added amino acid. If the peptide chain is long the oldest part will be moved out into the cytoplasm to be followed by the rest of the chain as it is produced.The next cycle
    Insieme a sito A now empty traslocazione ha luogo. The ribosome moves on by a distance of one (three letter) codon notch along the mRNA to bring a new codon into the processing area. tRNA ‘charged’ with an attached amino acid now enters sito A, and provided a satisfactory match of the mRNA codon and tRNA anti-codon is made, the cycle starts again. This process continues until a termination stage is reached.
  2. Termination. When the ribosome reaches the end of the mRNA strand, a terminal or ‘end of protein code’ message is flagged up. This registers the end of production for the particular protein coded for by this strand of mRNA. ‘Release factor’ chemicals prevent any more amino acid additions, and the new protein (polypeptide) is completely moved out into the cytoplasm through a cleft in the large sub-unit. The two ribosome sub-units disengage, separate and are re-used or broken down.

  • Nearly all the proteins required by cells are synthesised by ribosomes. Ribosomes are found ‘free’ in the cell cytoplasm and also attached to rough endoplasmic reticulum.
  • Ribosomes receive information from the cell nucleus and construction materials from the cytoplasm.
  • ribosomi translate information encoded in messenger ribonucleic acid (mRNA).
  • Essi collegamento together specific amino acids to form polypeptides and they export these to the cytoplasm.
  • A mammalian cell may contain as many as 10 million ribosomes, but each ribosome has only a temporary existence.
  • Ribosomes can link up amino acids at a rate of 200 per minute.
  • Ribosomes are formed from the locking of a small sub-unit on to a large sub-unit. The sub-units are normally available in the cytoplasm, the larger one being about twice the size of the smaller one.
  • Each ribosome is a complex of ribonucleoproteins with two-thirds of its mass is composed of ribosomal RNA and about one-third ribosomal protein.
  • Protein production takes place in three stages: (1) initiation, (2) elongation, and (3) termination.
  • During peptide production the ribosome moves along the mRNA in an intermittent process called traslocazione.
  • Antibiotic drugs such as streptomycin can be used to attack the translation mechanism in prokaryotes. This is very useful. Unfortunately some bacterial toxins and viruses can also do this.
  • After they leave the ribosome most proteins are folded or modified in some way. This is called ‘post translational modification’.

An overview diagram of protein production, including a note about protein modification.


Guarda il video: La sintesi proteica completa HD (Dicembre 2022).