Informazione

Quali sono i limiti della genotipizzazione del DNA di livello commerciale rispetto al sequenziamento completo?

Quali sono i limiti della genotipizzazione del DNA di livello commerciale rispetto al sequenziamento completo?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ho sentito parlare di servizi come 23andme, che offrono test genetici al pubblico in generale. Essendo una persona che sa molto poco di genetica, sono interessato all'argomento e vorrei sapere cosa fa veramente la moderna genotipizzazione di "grado commerciale". Quali sono i limiti della "genotipizzazione" di livello commerciale? Da quello che ho letto, testano il DNA contro circa 100 marcatori diversi, ma non lo sequenziano davvero.

Se ho capito bene, se il DNA è sequenziato, in esso possono essere identificati marcatori genetici e geni, compresi quelli appena scoperti. Tuttavia, (se ho capito bene) se il DNA è genotipizzato, la genotipizzazione è un'operazione one shot che indica se alcuni marcatori genetici sono presenti nel DNA. Per testare contro i marcatori appena scoperti, dovrebbe essere nuovamente genotipizzato, giusto?

Grazie per eventuali chiarimenti!


23andme descrive brevemente la tecnologia che usano qui. Stanno testando il genotipo del tuo DNA in circa 1 milione di località. La tecnologia che usano per farlo è nota come microarray.

I limiti dell'utilizzo di un microarray, rispetto al sequenziamento, sono che troverai solo ciò che stai cercando: le persone spesso descrivono gli svantaggi dei microarray rispetto al sequenziamento con l'effetto/metafora del lampione.

Gli array possono misurare solo le regioni del genoma che sono stati progettati per sondare. Tecnicamente, se sondano 1.000.000 di milioni di posizioni e il genoma umano è di circa 3,4 miliardi di basi... puoi fare i conti.

In pratica, gli SNP ti dicono qualcosa in più sul solo nucleotide che viene interrogato, a causa del disequilibrio del linkage (vedi SNP tag/proxy), quindi l'array potrebbe dirti più di quanto ti aspetti.

Ovviamente, gli errori di sequenziamento modulo, il sequenziamento dell'intero genoma ti diranno "tutto" per quanto riguarda il recupero delle NT che compongono il tuo genoma, ma quante informazioni ti forniranno è un'altra cosa (per ora, cioè).


Giusto per essere trasparente, lavoro in un'azienda di microarray, ma ho anche partecipato a seminari di sequenziamento ad alto rendimento. Penso che questa sia una valutazione abbastanza giusta, ma lasciami un commento se vedi qualcosa fuori linea...

Come sottolineato da @SteveLianoglou, i microarray di genotipizzazione sono i migliori per rivelare se una particolare variante (non solo SNP ma brevi inserimenti e delezioni, variazioni del numero di copie (CNV) in modo affidabile ed economico.

Il sequenziamento del DNA ad alto rendimento ha fatto passi da gigante e le ultime stime dei costi sono di poche migliaia di dollari per un genoma umano completo. Questo è meglio per scoprire nuove varianti, ma attualmente non è un ottimo modo per fare, ad esempio, un test medico per vedere se hai una particolare mutazione. Il problema con il sequenziamento in questo momento è che i sequenziatori hanno pregiudizi sistematici: la sequenza locale può dare lo stesso errore più e più volte. Ci vuole uno sforzo significativo per differenziare l'errore dai dati della variante reale. Nel workshop a cui ho partecipato, i dati consistevano in 38 genomi umani completi con una copertura 30-40x. Nonostante questo profondo livello di sequenziamento, gli errori sistematici erano ancora evidenti (il procedimento è attualmente in corso di stampa - il riferimento dovrebbe apparire presto al link fornito). Quindi può essere abbastanza costoso quando hai eseguito tutte le analisi dei dati e i dati di convalida per ottenere le varianti tramite il sequenziamento. Tutto questo potrebbe cambiare molto rapidamente, ma penso che questo sia accurato allo stato attuale delle cose.


Voglio dare all'OP una leggera variazione sulla risposta di Steve.

È importante notare che la maggior parte del genoma è la stessa tra persone diverse. Non è sorprendente, dal momento che apparteniamo alla stessa specie.

Ad esempio, si stima che ci siano circa 10.000.000 di SNP (posizioni di coppie di basi singole che possono variare) nel genoma umano. Quindi, se controlli 1.000.000 di SNP con un microarray (genotipizzazione), stai coprendo circa il 10% delle possibili differenze. Inoltre, la variazione in alcuni degli SNP è molto comune mentre altri sono molto rari, quindi se controlli i 1.000.000 di SNP più comuni con un microarray, potresti effettivamente coprire una parte molto ampia delle differenze. È anche possibile che se conosci in anticipo alcune informazioni generali sulla persona che stai testando, come l'etnia, potresti essere in grado di eliminare molti SNP non informativi.

Questo ovviamente si riferisce solo alla variazione degli SNP (ma queste sono le variazioni più comuni).


Genotipizzazione di batteri geneticamente monomorfi: sequenziamento del DNA in Mycobacterium tuberculosis Evidenzia i limiti delle metodologie attuali

Poiché i patogeni batterici geneticamente monomorfi ospitano poca diversità nella sequenza del DNA, la maggior parte delle attuali tecniche di genotipizzazione utilizzate per studiare l'epidemiologia di questi organismi si basano su elementi genetici mobili o ripetitivi. I marcatori molecolari comunemente usati in questi batteri includono Clustered Regulatory Short Palindromic Repeats (CRISPR) e Variable Number Tandem Repeats (VNTR). Questi metodi vengono sempre più applicati anche agli studi filogenetici e di genetica delle popolazioni. Usando il Mycobacterium tuberculosis complesso (MTBC) come modello, abbiamo valutato l'accuratezza filogenetica della genotipizzazione basata su CRISPR e VNTR, che in MTBC sono note rispettivamente come spoligotyping e Mycobacterial Interspersed Repetitive Units (MIRU)-VNTR-typing. Abbiamo usato come gold standard le sequenze complete di DNA di 89 geni codificanti da una collezione di ceppi globali. I nostri risultati hanno mostrato che gli alberi filogenetici derivati ​​da questi dati di sequenza multilocus erano altamente congruenti e statisticamente robusti, indipendentemente dai metodi filogenetici utilizzati. Al contrario, le filogenesi corrispondenti dedotte dalla spoligotipizzazione o 15-loci-MIRU-VNTR erano incongruenti rispetto agli alberi basati sulla sequenza. Sebbene 24-loci-MIRU-VNTR abbia funzionato meglio, non è stato ancora in grado di rilevare tutte le linee di ceppo. I dati sulla sequenza del DNA non hanno mostrato praticamente alcuna omoplasia, ma era vero il contrario per la spoligotipizzazione e MIRU-VNTR, che era coerente con gli alti tassi di evoluzione convergente e il basso supporto statistico ottenuto per i raggruppamenti filogenetici definiti da questi marcatori. I nostri risultati hanno anche rivelato che il potere discriminatorio dei 24 loci MIRU-VNTR standard variava in base al ceppo. Presi insieme, i nostri risultati suggeriscono che le linee di ceppo in MTBC dovrebbero essere definite sulla base di marcatori filogeneticamente robusti come polimorfismi a singolo nucleotide o polimorfismi a grande sequenza e che per scopi epidemiologici, i loci MIRU-VNTR dovrebbero essere utilizzati in modo dipendente dal lignaggio. I nostri risultati hanno implicazioni per la tipizzazione del ceppo in altri batteri geneticamente monomorfi.

Citazione: Coma I, Homolka S, Niemann S, Gagneux S (2009) Genotipizzazione di batteri geneticamente monomorfi: sequenziamento del DNA in Mycobacterium tuberculosis Evidenzia i limiti delle metodologie attuali. PLoS UNO 4(11): e7815. https://doi.org/10.1371/journal.pone.0007815

Editore: Anastasia P. Litvintseva, Duke University Medical Center, Stati Uniti d'America

Ricevuto: 31 luglio 2009 Accettato: 15 ottobre 2009 Pubblicato: 12 novembre 2009

Diritto d'autore: © 2009 Coma et al. Questo è un articolo ad accesso aperto distribuito secondo i termini della Creative Commons Attribution License, che consente l'uso, la distribuzione e la riproduzione senza restrizioni con qualsiasi mezzo, a condizione che l'autore e la fonte originali siano citati.

Finanziamento: Questo lavoro è stato sostenuto dal Consiglio di ricerca medica, Regno Unito e Stati Uniti National Institutes of Health concede HHSN266200700022C e AI034238. I finanziatori non hanno avuto alcun ruolo nella progettazione dello studio, nella raccolta e nell'analisi dei dati, nella decisione di pubblicare o nella preparazione del manoscritto.

Interessi conflittuali: Gli autori hanno dichiarato che non esistono interessi concorrenti.


Astratto

L'avvento del sequenziamento di nuova generazione (NGS) ha rivoluzionato gli approcci genomici e trascrittomici alla biologia. Questi nuovi strumenti di sequenziamento sono preziosi anche per la scoperta, la convalida e la valutazione di marcatori genetici nelle popolazioni. Qui esaminiamo e discutiamo le migliori pratiche per diversi metodi NGS per lo sviluppo di marcatori genetici a livello di genoma e la genotipizzazione che utilizzano la digestione con enzimi di restrizione dei genomi bersaglio per ridurre la complessità del bersaglio. Questi nuovi metodi, che includono il sequenziamento a rappresentazione ridotta mediante librerie a rappresentazione ridotta (RRL) o la riduzione della complessità delle sequenze polimorfiche (CRoPS), il sequenziamento del DNA associato al sito di restrizione (RAD-seq) e la genotipizzazione a bassa copertura, sono applicabili a entrambi i modelli organismi con sequenze genomiche di riferimento di alta qualità e, in modo entusiasmante, a specie non modello senza dati genomici esistenti.


Sequenziamento del DNA

La tecnologia di sequenziamento di nuova generazione (NGS) Illumina utilizza l'amplificazione clonale e la chimica del sequenziamento per sintesi (SBS) per consentire un sequenziamento rapido e accurato. Il processo identifica simultaneamente le basi del DNA mentre le incorpora in una catena di acido nucleico. Ogni base emette un segnale fluorescente unico quando viene aggiunta al filamento in crescita, che viene utilizzato per determinare l'ordine della sequenza del DNA.

La tecnologia NGS può essere utilizzata per sequenziare il DNA di qualsiasi organismo, fornendo informazioni preziose in risposta a quasi tutte le domande biologiche. Una tecnologia altamente scalabile, il sequenziamento del DNA può essere applicato a piccole regioni mirate o all'intero genoma attraverso una varietà di metodi, consentendo ai ricercatori di indagare e comprendere meglio la salute e le malattie.

Un decennio di sequenziamento

Esplora le scoperte, i progressi e i progressi.

Vantaggi del sequenziamento del DNA con NGS

  • Sequenzia grandi tratti di DNA in modo massicciamente parallelo, offrendo vantaggi in termini di velocità e scala rispetto al sequenziamento Sanger basato sull'elettroforesi capillare
  • Fornisce alta risoluzione per ottenere una vista base per base di un gene, esoma o genoma
  • Fornisce misurazioni quantitative basate sull'intensità del segnale
  • Rileva praticamente tutti i tipi di alterazioni del DNA genomico, comprese varianti di singoli nucleotidi, inserimenti e delezioni, modifiche del numero di copie e aberrazioni cromosomiche
  • Offre un'elevata produttività e flessibilità per ridimensionare gli studi e sequenziare più campioni contemporaneamente
Sequenziatori di DNA da banco

Confronta la velocità e la produttività dei sistemi di sequenziamento del DNA Illumina per trovare l'opzione migliore per il tuo laboratorio.

Metodi comuni di sequenziamento del DNA

Sequenziamento dell'intero genoma

Il sequenziamento dell'intero genoma è il metodo più completo per analizzare il genoma. La rapida riduzione dei costi di sequenziamento e la capacità di ottenere informazioni preziose sull'intero codice genetico rendono questo metodo un potente strumento di ricerca.

Risequenziamento mirato

Con il risequenziamento mirato, un sottoinsieme di geni o regioni del genoma viene isolato e sequenziato, consentendo ai ricercatori di concentrare tempo, spese e analisi su specifiche aree di interesse.

Sequenziamento chip

Combinando i saggi di immunoprecipitazione della cromatina (ChIP) e il sequenziamento, il sequenziamento ChIP (ChIP-Seq) è un metodo potente per identificare i siti di legame del DNA a livello di genoma per i fattori di trascrizione e altre proteine.

Preparazione della libreria per il sequenziamento del DNA

Il nostro versatile portfolio per la preparazione delle librerie consente di esaminare piccole regioni mirate o l'intero genoma. Abbiamo innovato nella tecnologia di frammentazione senza PCR e on-bead, offrendo risparmi di tempo, flessibilità e prestazioni dei dati di sequenziamento migliorate.


Quali sono i limiti della genotipizzazione del DNA di livello commerciale rispetto al sequenziamento completo? - Biologia

Il crescente interesse per la terapia personalizzata del cancro ha portato a numerosi progressi nel campo della genomica del cancro. Il sequenziamento di nuova generazione (NGS) è uno di questi sviluppi che ha consentito il sequenziamento del genoma a costi inferiori e con un rendimento più elevato. Tuttavia, il vasto numero e tipi di aberrazioni genomiche riscontrate nel cancro significa che l'interpretazione dei dati generati da NGS richiede una notevole complessità analitica. Qui, discutiamo le applicazioni cliniche di NGS e gli ostacoli che devono essere superati prima di un uso diffuso nel processo decisionale clinico.

Parole chiave: Sequenziamento di nuova generazione, revisione, genomica, cancro

introduzione

La terapia personalizzata del cancro richiede l'uso della diagnostica molecolare per adattare i trattamenti agli individui. Al momento, solo poche terapie basate su biomarcatori molecolari, come erlotinib in EGFR-carcinoma polmonare mutato e vemurafenib in BRAF-melanoma mutato, sono stati ampiamente accettati. 1,2 Il sequenziamento di nuova generazione (NGS) ha il potenziale per rivoluzionare l'oncologia attraverso la classificazione dei tumori e l'identificazione di biomarcatori in grado di predire la risposta alla terapia individualizzata.

Fino a poco tempo, il metodo di sequenziamento Sanger era il metodo di sequenziamento più utilizzato e ha portato all'unica sequenza completa del genoma umano. 3 Questa tecnologia si basa sull'incorporazione di dideossinucleotidi che terminano la catena durante la replicazione del DNA. 4 Terminatori etichettati in modo fluorescente, separazione per elettroforesi capillare e rilevamento del segnale laser hanno migliorato la produttività del sequenziamento Sanger. 5 Tuttavia, rimane laborioso, dispendioso in termini di tempo e costoso se eseguito su larga scala. 6 Pertanto, la richiesta di informazioni genomiche più rapide, accurate e convenienti ha portato allo sviluppo di metodi NGS.

I metodi NGS sono tecnologie ad alto rendimento con capacità di sequenziare un gran numero di diverse sequenze di DNA (massivamente parallele) contemporaneamente. Le tecnologie NGS monitorano l'aggiunta sequenziale di nucleotidi a modelli di DNA immobilizzati generati dal tessuto bersaglio. 7 Sfortunatamente, l'aumento della velocità di reazione delle reazioni NGS va a scapito di sequenze più brevi, poiché la maggior parte delle piattaforme di sequenziamento (Illumina, Roche, SoLiD) offre lunghezze di lettura più brevi (30 e 400 bp) rispetto al metodo convenzionale basato su Sanger. 8 Queste sequenze più brevi vengono quindi assemblate in sequenze più lunghe come genomi completi.

Approcci comuni al sequenziamento del DNA includono il sequenziamento dell'intero genoma, il sequenziamento dell'intero esoma, il sequenziamento mirato dell'esoma e il sequenziamento "hotspot". Il sequenziamento dell'intero genoma sequenzia il genoma completo di un campione (cioè DNA cromosomico e DNA mitocondriale, che include regioni introniche ed esoniche). Il sequenziamento dell'intero esoma è una tecnica che sequenzia tutti i geni codificanti proteine ​​(cioè, tutti gli esoni nel genoma). Il sequenziamento mirato dell'esoma utilizza metodi di arricchimento del bersaglio per catturare i geni di interesse. Questo approccio sta diventando sempre più popolare in oncologia per valutare l'intera sequenza dei pannelli genetici correlati al cancro. Il sequenziamento mirato dell'esoma facilita anche il sequenziamento a una maggiore profondità e quindi l'identificazione di mutazioni subclonali. In alternativa, invece di sequenziare l'intera sequenza di geni selezionati, è possibile sequenziare solo regioni selezionate di geni selezionati, concentrandosi su regioni del gene del cancro &ldquohotspot&rdquo&mdash con mutazioni ricorrenti. Sebbene il test di mutazione hotspot faciliti il ​​sequenziamento su larga scala di molti campioni, limita la conoscenza acquisita attraverso il sequenziamento perché limita la valutazione a piccole regioni in geni selezionati. Di conseguenza, aumenta la possibilità di omettere mutazioni rilevanti per le quali non viene condotta una valutazione, limitando così le conoscenze cliniche acquisite tramite NGS. Nonostante i suoi svantaggi, sta diventando una forma ampiamente accettata di NGS.

Applicazione pratica

  • Fornire una breve introduzione ai metodi di sequenziamento di nuova generazione (NGS)
  • Identificare le applicazioni cliniche di NGS, compresa l'identificazione di varie aberrazioni molecolari in diversi tipi di tumore, la progettazione risultante di studi clinici guidati da biomarcatori molecolari e il potenziale per identificare le aberrazioni molecolari che portano alla progressione della malattia e alla resistenza
  • Identificare i limiti di NGS, inclusa la necessità di ampie capacità analitiche, le difficoltà nell'identificazione delle mutazioni driver e il fattore confondente dell'eterogeneità del tumore
  • Identificare potenziali applicazioni future di NGS

Oltre al rilevamento del cambiamento nucleotidico (mutazioni e piccoli inserimenti e delezioni), NGS consente la previsione del numero di copie del DNA. Inoltre, la tecnologia NGS può essere applicata anche all'RNA per valutare il trascrittoma di un tumore. Il sequenziamento dell'RNA (RNA-seq) consente la valutazione dell'espressione genica e l'analisi delle varianti di splicing trascrizionale oltre al rilevamento delle mutazioni. Un tipico flusso di lavoro NGS dalla raccolta dei campioni alla cattura e al sequenziamento dei geni di interesse e all'analisi dei dati è illustrato in Figura 1.

Identificazione della genomica del cancro

Negli ultimi anni, l'NGS è stato utilizzato per caratterizzare alterazioni genomiche come mutazioni, inserzioni/delezioni e modifiche del numero di copie e la frequenza con cui si verificano in vari tipi di tumore. Sforzi come l'International Cancer Genome Consortium (ICGC) e The Cancer Genome Atlas (TCGA) mirano a catalogare tali alterazioni genomiche in molti tipi di tumore. 9,10 Tuttavia, la ricchezza di informazioni che viene generata attraverso questo processo rivela potenzialmente il più grande ostacolo della medicina genomica: come analizziamo l'abbondanza di informazioni che viene generata per prendere decisioni informate riguardo alla terapia? L'analisi dei genomi del cancro rivela che la maggior parte dei tumori contiene alterazioni multiple. 11-14 Di conseguenza, è molto importante distinguere le mutazioni "driver" che contribuiscono allo sviluppo del tumore dai "passeggeri" che non lo fanno. 15

Il confronto dei genomi sequenziati con i genomi di riferimento consente l'identificazione di alterazioni del genoma che possono essere rilevanti nello sviluppo e nella progressione della malattia. 16 Tuttavia, tale confronto dipende dalla creazione di genomi di riferimento estesi e accurati, che è un compito arduo. Inoltre, la complessità delle aberrazioni genomiche nel cancro rende difficile fare affidamento su genomi di riferimento standard. 8 Pertanto, sono necessari metodi semplificati per identificare le mutazioni del driver. Esistono diverse teorie per la potenziale identificazione delle mutazioni del driver. Una di queste ipotesi è che le mutazioni che si verificano con maggiore frequenza hanno maggiori probabilità di contribuire allo sviluppo e alla crescita del tumore. 17 Gli studi di associazione a livello di genoma (GWAS) mirano a confrontare l'incidenza dei polimorfismi a singolo nucleotide (SNP) comunemente noti nei genomi di pazienti con e senza una malattia specifica. Gli SNP che si verificano con una frequenza più elevata nella popolazione malata sono identificati come potenzialmente causali. Se una specifica mutazione non viene trovata in alta frequenza, ma la stessa via molecolare contiene frequenti alterazioni genomiche, anche tali alterazioni possono essere rilevanti. Un'altra teoria è che le alterazioni presenti in entrambe le linee germinali

e il tessuto tumorale dello stesso paziente possono essere parte integrante dello sviluppo del tumore. Ad esempio, alcune mutazioni nei geni di predisposizione al cancro come BRCA1/2 chiaramente contribuiscono allo sviluppo e al mantenimento del cancro. Ciò, tuttavia, richiede che il tessuto germinale venga raccolto in ciascun paziente. Ancora un'altra teoria è che il sequenziamento del DNA e dell'RNA dallo stesso campione identificherà le mutazioni che successivamente alterano l'espressione e sono quindi significative. Tuttavia, tutti questi metodi iniziano solo a restringere lo spettro delle alterazioni genomiche che possono essere clinicamente rilevanti. I cambiamenti della scala cromosomica e i cambiamenti epigenomici non possono essere valutati in questo modo. Molti studi si stanno ora concentrando sullo sviluppo di strumenti bioinformatici per aiutare nell'identificazione delle mutazioni del driver. 18

Supporto alle decisioni cliniche

Una volta che le mutazioni driver sono state identificate in un tumore, il passaggio successivo consiste nel valutare se tali mutazioni sono "azionabili". Le alterazioni attuabili influiscono sulla funzione di un gene correlato al cancro e possono essere mirate con terapie approvate o sperimentali. La valutazione della funzionalità è un compito difficile e richiede una conoscenza predittiva delle alterazioni del genoma. Spesso vengono utilizzati studi in fase iniziale per valutare il ruolo delle varie mutazioni in base ai tassi di risposta alle terapie mirate. Tuttavia, l'iscrizione a tali studi richiede che i medici siano consapevoli delle alterazioni del genoma e dei potenziali studi per ciascun paziente.

Un'indagine su 160 medici presso un centro oncologico completo designato dal National Cancer Institute (NCI) per l'assistenza terziaria ha rivelato che una percentuale considerevole di medici ha scarsa fiducia nelle proprie conoscenze genomiche. 19 Di conseguenza, molte istituzioni hanno istituito comitati per i tumori per aumentare la consapevolezza e l'accesso a terapie mirate in modo appropriato. 20 Allo stesso modo, l'American Society of Clinical Oncology ha presentazioni mensili che esplorano le attuali strategie di trattamento e nuove terapie in vari tipi di tumore per aumentare la conoscenza delle nuove terapie mirate. Altri studi come l'NCI Molecular Analysis for Therapy Choice Program (NCI-MATCH) hanno semplificato il processo decisionale progettando algoritmi e creando regole per designare le alterazioni come attuabili e per dare priorità agli obiettivi se viene identificato più di un obiettivo. In questo studio di ricerca del segnale, 3000 pazienti saranno sottoposti a NGS tumorale per abbinare le alterazioni genomiche a studi di fase 2 indipendenti dall'istologia di agenti approvati dalla Food and Drug Administration (FDA) (in altre malattie) e terapie sperimentali (figura 2).

Se si osserva un segnale di risposta negli studi in fase iniziale, la rilevanza clinica e le implicazioni terapeutiche delle mutazioni attuabili possono essere valutate attraverso un'attenta ricerca guidata dai biomarcatori. Possono essere progettati studi preclinici guidati da ipotesi e studi clinici per valutare terapie mirate in vari tipi di tumore. Tali studi consentono il reclutamento di pazienti selezionati in studi clinici per migliorare la valutazione di tali terapie mirate. In definitiva, l'obiettivo è implementare studi clinici randomizzati per valutare la terapia a bersaglio molecolare in modo selezionato o stratificato con biomarcatore. L'Adjuvant Lung Cancer Enrichment Marker Identification and Sequencing Trials (ALCHEMIST) è un esempio di tale studio in cui i pazienti con adenocarcinoma polmonare in fase iniziale vengono sottoposti a screening per EGFR e ALK mutazioni e successivamente randomizzati in studi di terapia mirata pertinente se vengono trovate mutazioni. Con la tecnologia NGS, un elevato numero di pazienti può essere sottoposto a test per valutare la loro idoneità per gli studi clinici entro un lasso di tempo clinicamente ragionevole.

Evoluzione genomica ed eterogeneità intertumorale e intratumorale

A complicare ulteriormente l'implementazione della medicina genomica è il fatto che le mutazioni driver possono evolversi nel corso del cancro. Man mano che i tumori vengono trattati o man mano che crescono, può emergere una varietà di alterazioni genomiche acquisite. Ad esempio, è stato dimostrato che il melanoma trattato con inibitori BRAF o MEK acquisisce amplificazioni BRAF e alterazioni a valle che portano alla riattivazione della via della chinasi MAP. 21-23 Allo stesso modo, l'aumento del segnale attraverso la via fosfatidilinositolo 3-chinasi/Akt può contribuire alla resistenza a trastuzumab nel carcinoma mammario HER2-positivo. 24 Pertanto, la natura dinamica del cancro richiede che le informazioni genomiche siano applicate

Oltre all'evoluzione genomica, i tumori possono anche sviluppare eterogeneità intertumorale e intratumorale. L'eterogeneità intertumorale si riferisce alle differenze nelle alterazioni dei tumori in siti diversi, mentre l'eterogeneità intratumorale si riferisce alle differenze nelle alterazioni all'interno di un tumore. Sia l'eterogeneità intertumorale che intratumorale possono complicare ulteriormente la determinazione delle mutazioni rilevanti perché significa che il tessuto per NGS deve essere ottenuto da siti rilevanti e in un momento rilevante nel corso del trattamento. Ciò può comportare biopsie ripetute. Inoltre, i siti metastatici come ossa e cervello possono essere difficili da testare. Tuttavia, il confronto di tumori primari con metastasi abbinate ha mostrato una concordanza relativamente alta nei loro profili mutazionali, suggerendo che potrebbero non essere sempre necessarie ulteriori biopsie. 25,26

Sebbene la valutazione genomica renda difficile identificare le aberrazioni rilevanti, il riconoscimento dell'evoluzione genomica è uno strumento potente per comprendere meglio la progressione del cancro. L'analisi genomica del cancro nelle diverse fasi, dalle lesioni precancerose ai tumori localizzati alla malattia metastatica, può identificare gli eventi genetici che guidano la crescita del tumore. Ad esempio, gli studi genomici che analizzano le alterazioni genomiche nel carcinoma duttale della mammella in situ (DCIS) possono aiutare a progettare un modello predittivo per le lesioni che potrebbero evolvere in carcinoma rispetto a quelle che non lo sono. 27 Allo stesso modo, l'analisi basata su NGS delle cellule resistenti ai farmaci può aiutare a identificare i meccanismi di resistenza. Ad esempio, il sequenziamento di tumori di pazienti con carcinoma mammario positivo al recettore per gli estrogeni (ER) e che si sono ripresentati o è progredito dopo il trattamento con terapia antiestrogenica ha rivelato mutazioni nel gene ESR1, queste mutazioni erano costitutivamente attive.28 È interessante notare che le mutazioni del gene ESR1 non sono state osservate nell'analisi TCGA, che includeva solo i tumori primari.11 Insieme, questi studi suggeriscono che le mutazioni attivanti nel gene ESR1 sono un meccanismo acquisito di resistenza alla terapia antiestrogenica. Allo stesso modo, il sequenziamento dell'RNA di cellule di cancro al seno sensibili e resistenti al tamoxifene ha rivelato cambiamenti di espressione genica che implicano una serie di meccanismi di resistenza che potrebbero essere raggruppati in funzioni ER, regolazione del ciclo cellulare, trascrizione/traduzione e disfunzione mitocondriale. 29

Applicazioni e indicazioni future

Diverse applicazioni aggiuntive di NGS sono in fase di sviluppo. Una potenziale applicazione futura dell'NGS è la valutazione delle cellule tumorali circolanti o del DNA plasmatico libero per rilevare recidive precoci o cancro residuo. 20 Una volta che le alterazioni del genoma tumore-specifiche sono state identificate mediante NGS, i saggi PCR potrebbero essere utilizzati per rilevare le cellule tumorali circolanti o il DNA del plasma libero che ospita le stesse alterazioni. Lo stato della malattia, la risposta ai farmaci e la ricaduta potrebbero essere valutati in serie. La strategia di monitoraggio, tuttavia, richiederebbe che la mutazione da testare sia presente in tutte le cellule tumorali e rimanga presente per tutto il corso della malattia. Come discusso in precedenza, a causa dell'evoluzione genomica e dell'eterogeneità del tumore, tali mutazioni sono difficili da identificare. In modo ottimale, le mutazioni utilizzate per il monitoraggio sarebbero mutazioni troncali e mutazioni dash nel modello di eterogeneità "ramo-tronco", e quindi rappresentano mutazioni driver ubique presenti in ogni subclone e regione del tumore. 31 Tuttavia, il monitoraggio seriale potrebbe anche identificare nuove alterazioni che si verificano sotto la pressione selettiva del trattamento, che potrebbero fornire approfondimenti sui meccanismi di resistenza acquisita.

Un'altra potenziale applicazione dell'NGS è migliorare la diagnosi del cancro. Il campionamento e l'elaborazione inadeguati dei tessuti possono spesso rendere difficile una diagnosi istologica. Inoltre, i fenotipi tumorali misti a volte possono rendere difficile determinare l'origine del tumore. Tuttavia, l'analisi del tessuto basata su NGS può essere eseguita su piccole quantità di tessuto vitale ed è accurata quando sono note informazioni sufficienti sulle mutazioni causali. Una valutazione di 143 noduli tiroidei benigni e maligni ha rivelato che la genotipizzazione dei campioni di aspirazione con ago sottile (FNA) dei noduli utilizzando un ampio pannello NGS ha fornito un'elevata sensibilità e specificità nella diagnosi di questi campioni. 32 Tali diagnosi richiederebbero una convalida clinica prima di un uso diffuso. Inoltre, man mano che la genomica di diversi tumori diventa evidente, l'NGS può essere utilizzato per identificare diversi sottotipi molecolari, cosa che sta già diventando un luogo comune con le proteine ​​di fusione del sarcoma.

Infine, l'NGS può identificare le aberrazioni molecolari che rendono i tumori estremamente sensibili a determinate terapie, dando luogo a risposte eccezionali. Risultati così straordinari possono migliorare la nostra comprensione delle caratteristiche molecolari che possono prevedere la risposta a determinati farmaci. A tal fine, l'NCI ha intrapreso l'iniziativa Exceptional Responders, attraverso la quale i tumori di responder eccezionali saranno sottoposti al sequenziamento del DNA e dell'RNA per definire le alterazioni genetiche che potrebbero aver determinato tali risposte.

Il sequenziamento di nuova generazione ha aperto un'ampia nuova area di ricerca con il potenziale per rivoluzionare la medicina oncologica personalizzata. Tuttavia, l'ulteriore sviluppo di questo campo richiede la conoscenza in tempo reale delle alterazioni del genoma che possono essere utilizzate nel processo decisionale clinico. Ciò richiede una solida infrastruttura di dati, un miglioramento continuo nella tecnologia di sequenziamento, lo sviluppo di strumenti analitici e studi preclinici e clinici guidati da biomarcatori in corso. In definitiva, tuttavia, i dati NGS hanno il potenziale per guidare i medici nell'adattare il trattamento ai cambiamenti genomici dinamici nei singoli tumori.


Potenziali effetti delle bias sulle inferenze

I problemi sopra descritti possono modellare i set di dati in modi che li rendono più o meno appropriati o distorti per analisi sistematiche superficiali a valle. L'acquisizione di sequenze e i set di dati RAD-Seq producono risultati ampiamente concordanti per le analisi filogenetiche tra le specie, a seconda dei passaggi utilizzati per l'assemblaggio del set di dati (Leaché et al. 2015 Collins e Hrbek 2015 Manthey et al. 2016), ma la loro relativa utilità per la popolazione le analisi genetiche e filogeografiche applicate all'interno delle specie sono in gran parte inesplorate. In questa sezione, discutiamo di come questi problemi potrebbero avere un impatto su una serie di tipiche analisi genetiche, filogeografiche e filogenetiche di popolazione che vengono spesso applicate su scale temporali poco profonde. I risultati delle analisi dei set di dati empirici qui presentati non sono intesi come un confronto diretto dell'applicabilità di RAD-Seq e dati di acquisizione di sequenze, che in realtà probabilmente non sarebbero esaminati con gli stessi metodi, ma piuttosto per dimostrare come i problemi discusso sopra può portare a deduzioni divergenti tra i metodi.

Le scansioni dell'intero genoma per identificare le firme della selezione o del flusso genico sono spesso condotte in studi che utilizzano loci RAD-Seq a causa della loro densa distribuzione attraverso il genoma (Hohenlohe et al. 2010). Le regioni conservate mirate alla cattura della sequenza potrebbero non essere sufficientemente disperse nel genoma per l'uso nelle scansioni dell'intero genoma. Come discusso in precedenza, la mappatura dei loci RAD-Seq su genomi divergenti è impegnativa, quindi RAD-Seq potrebbe non essere appropriato per identificare il contesto genomico dei loci anomali in specie senza assemblaggi genomici disponibili. Come con molti marcatori, i loci RAD-Seq possono provenire da regioni genomiche eterogenee influenzate da diversi processi neutri e non neutri, quindi le scansioni dovranno tenere conto di spiegazioni alternative di loci anomali o alleli migranti.

L'inferenza demografica è popolare nella genetica delle popolazioni e nella filogeografia e può essere influenzata dalla distribuzione delle frequenze alleliche in un set di dati. La selezione purificante sulle regioni conservate può lasciare segni, come un eccesso di alleli rari, che complicano la stima delle storie demografiche neutre. La perdita di alleli e le carenze degli eterozigoti nei set di dati RAD-Seq possono anche influenzare le stime dei parametri demografici inclusi theta ( θ = 4 N e μ ) e la miscela. Abbiamo stimato i parametri demografici utilizzando alberi genici in BP&P v.3.2 (Yang e Rannala 2010) e utilizzando spettri di frequenza SNP in ∂ a ∂ i v.1.7.0 (Gutenkunst et al. 2009) sia con RAD-Seq che con dati di cattura di sequenza da X.minutus. Il modello demografico utilizzato includeva due popolazioni figlie che comprendevano i quattro campioni a ovest delle Ande e i quattro campioni a est delle Ande, entrambi divergenti da una popolazione ancestrale comune. Abbiamo confrontato le stime della dimensione effettiva della popolazione normalizzando le stime del tempo di divergenza da RAD-Seq e set di dati di acquisizione di sequenze. We found that in both BP&P and ∂ a ∂ i results, effective population sizes in the daughter populations were fairly similar between data sets (Supplementary Tables S3 and S4, available on Dryad), but the estimate of ancestral effective population size was lower from sequence capture than from RAD-Seq data ( Fig. 4b and Supplementary Fig. S7, available on Dryad). The higher ancestral population size in the RAD-Seq data could be due either to the loss of shared variation among the daughter populations as a result of allele dropout in the RAD-Seq data set, or to the high frequency of rare alleles restricted to a single population in the sequence capture alignments. In addition, heterozygote deficiencies in the RAD-Seq data set may underlie the somewhat lower population sizes estimated in the daughter populations than those estimated in the sequence capture data set.

Impacts of data set biases on inferences from systematic analyses of Xenops minutus data from RAD-Seq and sequence capture. a) Relative pairwise JC69-corrected distances between individuals, b) mutation-scaled effective population size (theta) estimates for daughter and ancestral populations, c) BUCKy tree from sequence capture and d) BUCKy tree from RAD-Seq, with node values representing the proportion of gene trees from that data set containing each clade.

Impacts of data set biases on inferences from systematic analyses of Xenops minutus data from RAD-Seq and sequence capture. a) Relative pairwise JC69-corrected distances between individuals, b) mutation-scaled effective population size (theta) estimates for daughter and ancestral populations, c) BUCKy tree from sequence capture and d) BUCKy tree from RAD-Seq, with node values representing the proportion of gene trees from that data set containing each clade.

Phylogenetic tree estimation to reconstruct the relationships between populations is commonly used in shallow systematics studies. Phylogeny estimation may be complicated if allele loss results in a downward bias in the mutational spectrum ( Huang and Knowles 2014). This bias may produce shallower gene trees and lower genetic distances ( Harvey et al. 2015), particularly between the most divergent individuals in a study. We examined branch lengths from X. minutus trees inferred using BUCKy v.1.4.3 ( Larget et al. 2010), which are estimated in coalescent units based on quartet concordance factors for each branch. As observed in prior studies ( Leaché et al. 2015), internal branch lengths from BUCKy trees estimated from RAD-Seq data were short relative to those estimated from sequence capture data in X. minutus, perhaps as a result of the loss of the most divergent alleles ( Fig. 4c,d). Terminal branches in BUCKy trees for X. minutus are determined by the gene trees from loci in which individuals are homozygous for rare alleles. These branch lengths are longer in the RAD-Seq tree than in the sequence capture tree, consistent with the high levels of homozygosity we observed in the RAD-Seq data set. The difference in relative branch lengths between RAD-Seq and sequence capture trees was not evident in trees estimated from SNPs using SNAPP ( Bryant et al. 2012), likely because SNAPP removes sites with missing data, which would bias overall tree depth rather than relative branch lengths (Supplementary Fig. S8, available on Dryad). Despite the differences in phylogenetic branch lengths, relative genetic distances corrected using a JC69 model ( Jukes and Cantor 1969) among individuals were highly correlated between RAD-Seq and sequence capture X. minutus data sets (CADM test coefficient of concordance = 0.935, p < 0.001 ⁠ , Fig. 4a).

Both RAD-Seq and, to a lesser extent, sequence capture loci have low per-locus information relative to many of the genes traditionally targeted for Sanger sequencing in systematics. Low per-locus information content complicates analyses that depend on accurate parameter estimates from individual loci. It may be challenging to fit models of molecular evolution to loci due to their low information content, and poorly resolved gene trees may complicate analyses such as gene tree–species tree estimation ( Lanier et al. 2014). Concordance analysis of gene trees from RAD-Seq and sequence capture in X. minutus using BUCKy ( Larget et al. 2010) revealed that consensus relationships were supported by relatively few loci ( Fig. 4c,d). Most gene trees contained polytomies as a result of low information content in alignments. Concordance was lower among RAD-Seq loci than among sequence capture loci, presumably due to the lower resolution of RAD-Seq gene trees. The consensus trees inferred across loci from both methods were topologically identical, however, both using BUCKy ( Fig. 4c,d) and SNAPP (Supplementary Fig. S8, available on Dryad). Moreover, nearly all nodes had high support in the SNAPP trees from both RAD-Seq and sequence capture. Methods that successfully integrate across the small amounts of information present in many loci, including methods that examine independent SNPs, may be desirable for sequence capture and particularly RAD-Seq data sets.

The large data sets produced by RAD-Seq and sequence capture raise computational concerns. Although the sizes of both RAD-Seq and sequence capture data sets can be tailored according to researcher needs, RAD-Seq data sets are generally larger. Depending on the question being addressed, very large data sets may not be needed and additional data may unnecessarily complicate analyses ( Davey et al. 2011). Conversely, evolutionary events that are difficult to estimate may require large amounts of data to address, and larger data sets also offer the ability to subsample loci informing a research question post-hoc. To take advantage of the information in large data sets, computationally demanding methods may have to take a back seat to faster summary methods (e.g., Liu et al. 2009 Larget et al. 2010 Chaudhary et al. 2014).


Multifactorial Inheritance and Complex Diseases

11.4.8 Marker Allele Frequency and Hardy–Weinberg Equilibrium Filter

The Hardy–Weinberg equilibrium (HWE) test compares the observed genotypic proportion at the marker versus the expected proportion. Deviation from HWE at a marker locus can be due to population stratification, inbreeding, selection, nonrandom mating, genotyping error, actual association to the disease or trait under study, or a deletion or duplication polymorphism. However, HWE is typically used to detect genotyping errors . SNPs that do not meet HWE at a certain threshold of significance are usually excluded from further association analysis. It is also important to discard SNPs based on minor allele frequency (MAF). Most GWAS are powered to detect a disease association with common SNPs (MAF ≥ 0.05). The rare SNPs may lead to spurious results due to the small number of homozygotes for the minor allele, genotyping errors, or population stratification.


Genotyping by sequencing (GBS) and SNP marker analysis of diverse accessions of pecan (Carya illinoinensis)

Pecan (Carya illinoinensis) is an outcrossing, highly heterozygous, and slow-to-mature tree native to North America. In order to better understand cultivar characteristics, appreciate regional adaptation, and improve selection in pecan breeding programs, improved genomic tools that are cost-effective and capable of high-throughput screening are necessary. A diverse panel of 108 cultivars and accessions from the National Collection of Genetic Resources for Pecans and Hickories (NCGR-Carya) was selected to represent regionally adapted native pecans, controlled cross progeny and their parents, selected wild relative species, and interspecific hybrids between those species and pecans. We implemented a genotyping-by-sequencing (GBS) technique to discover 87,446 informative single nucleotide polymorphisms (SNPs) throughout the pecan genome. SNPs were used to develop genomic profiles to confirm, refute, or inform questions of cultivar origin. Native accessions show strong genetic relationships by geographic region of origin. Matrices were developed to facilitate evaluation of pedigree relationships between cultivars. A genome-wide association study (GWAS) was performed to discover 17 SNPs from a contiguous region significantly associated with the expression of the simply inherited trait controlling flowering type (dichogamy). The information, techniques, and resources developed will benefit the pecan community by improving the ability to characterize germplasm and use marker data for marker-assisted breeding. This should reduce breeding time by facilitating more informed and efficient selection of parents and progeny.

Questa è un'anteprima del contenuto dell'abbonamento, accedi tramite il tuo istituto.


Microbiologia

The main utility of NGS in microbiology is to replace conventional characterisation of pathogens by morphology, staining properties and metabolic criteria with a genomic definition of pathogens. The genomes of pathogens define what they are, may harbour information about drug sensitivity and inform the relationship of different pathogens with each other which can be used to trace sources of infection outbreaks. The last recently received media attention, when NGS was used to reveal and trace an outbreak of methicillin-resistant Staphylococcus aureus (MRSA) on a neonatal intensive care unit in the UK. 4 What was most remarkable was that routine microbiological surveillance did not show that the cases of MRSA that occurred over several months were related. NGS of the pathogens, however, allowed precise characterisation of the MRSA isolates and revealed a protracted outbreak of MRSA which could be traced to a single member of staff.


Nebula Genomics: Your whole genome and all of your data, too

Nebula Genomics does not rely on a blood sample, offers full genome sequencing, and makes it easy to access all of your own data.

Many services will provide consumers with no-blood testing, but Nebula Genomics is unique in that we offer a 30x Whole Genome Sequencing service that sequences 100% of your DNA. The other services compared above use DNA microarray technology to profile your genome, characterizing only some of your genome. For example, it is common for microarray sequencing to characterize

500,000 positions, which is less than 0.1% of the whole human genome. Microarray-based genotyping may be a bit more affordable, but it misses a lot of important information. Our 30x Whole Genome Sequencing sample collection is safe for women who are pregnant, will not be compromised by the genetic material of the fetus, and can provide you with complete DNA sequencing. The results are processed in CLIA/CAP-accredited laboratories, and all of your data remains secure and yours.

If you are interested in obtaining medical advice, you need access to your own data. Nebula makes it easy to bring your test results, including your raw data, to your physician or genetic counselors who can use our data to counsel you. We include several industry-standard file types (FASTQ, BAM, VCF) that will allow you to get the most out of your test. As always, individuals who believe they are at risk for a genetic disorder should consult a healthcare provider before taking a DNA test while pregnant.

For more information on genetic sequencing technology, check out our Intro to DNA Testing Methods and our Test for Paternity post. HomeDNA is a popular at home paternity test available at most major retailors.

If you want to focus on your maternal and/or paternal lineages, you can look at YFull or YSeq, services which analyze mtDNA or the Y chromosome to determine specific lineage haplotypes. Full Genomes also offers Y chromosome sequencing and analysis.

Other DNA testing companies that do carrier screenings for diseases that may be passed down to children include:


Guarda il video: La terza legge di Mendel (Febbraio 2023).