Informazione

Genomica* - Biologia

Genomica* - Biologia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Genomica

Lo studio degli acidi nucleici è iniziato con la scoperta del DNA, è passato allo studio dei geni e dei piccoli frammenti ed è ora esploso nel campo della genomica. La genomica è lo studio di interi genomi, compreso l'insieme completo di geni, la loro sequenza e organizzazione nucleotidica e le loro interazioni sia all'interno di una specie che con altre specie. I progressi nella genomica sono stati resi possibili dalla tecnologia di sequenziamento del DNA. Proprio come la tecnologia dell'informazione ha portato a Google Maps, che ci consente di ottenere informazioni dettagliate sulle posizioni in tutto il mondo, le informazioni genomiche vengono utilizzate per creare mappe simili del DNA di diversi organismi.

Mappatura dei genomi

La mappatura del genoma è il processo per trovare la posizione dei geni su ciascun cromosoma. Le mappe che vengono create sono paragonabili alle mappe che usiamo per navigare le strade. UN mappa genetica è un'illustrazione che elenca i geni e la loro posizione su un cromosoma. Le mappe genetiche forniscono il quadro generale (simile a una mappa delle autostrade interstatali) e utilizzano marcatori genetici (simili ai punti di riferimento). Un marcatore genetico è un gene o una sequenza su un cromosoma che mostra un legame genetico con un tratto di interesse. Il marcatore genetico tende ad essere ereditato con il gene di interesse. Una misura della distanza tra loro è la frequenza di ricombinazione durante la meiosi; i primi genetisti chiamarono questa analisi di linkage.

Mappe fisiche entrare nei dettagli intimi delle regioni più piccole dei cromosomi (simile a una mappa stradale dettagliata). Una mappa fisica è una rappresentazione della distanza fisica, in nucleotidi, tra geni o marcatori genetici. Per costruire un quadro completo del genoma sono necessarie sia mappe di collegamento genetico che mappe fisiche. Avere una mappa completa del genoma rende più facile per i ricercatori studiare i singoli geni. Le mappe del genoma umano aiutano i ricercatori nei loro sforzi per identificare i geni che causano malattie umane legati a malattie come cancro, malattie cardiache e fibrosi cistica, solo per citarne alcuni. Inoltre, la mappatura del genoma può essere utilizzata per aiutare a identificare gli organismi con tratti benefici, come i microbi con la capacità di ripulire gli inquinanti o addirittura prevenire l'inquinamento. La ricerca che coinvolge la mappatura del genoma delle piante può portare a metodi agricoli che producono raccolti più elevati o allo sviluppo di piante che si adattano meglio ai cambiamenti climatici.

Figura 1. Questa è una mappa fisica del cromosoma X umano.

Credito: modifica del lavoro di NCBI, NIH

Le mappe genetiche forniscono il contorno e le mappe fisiche forniscono i dettagli. È facile capire perché entrambi i tipi di tecniche di mappatura del genoma sono importanti per mostrare il quadro generale. Le informazioni ottenute da ciascuna tecnica vengono utilizzate in combinazione per studiare il genoma. La mappatura genomica viene utilizzata con diversi organismi modello utilizzati per la ricerca. La mappatura del genoma è ancora un processo in corso e, man mano che vengono sviluppate tecniche più avanzate, sono attesi ulteriori progressi. La mappatura del genoma è simile al completamento di un puzzle complicato utilizzando tutti i dati disponibili. Le informazioni cartografiche generate nei laboratori di tutto il mondo vengono inserite in database centrali, come il National Center for Biotechnology Information (NCBI). Si cerca di rendere le informazioni più facilmente accessibili ai ricercatori e al pubblico in generale. Proprio come utilizziamo sistemi di posizionamento globale invece di mappe cartacee per navigare attraverso le strade, NCBI ci consente di utilizzare uno strumento di visualizzazione del genoma per semplificare il processo di data mining.

Sequenziamento dell'intero genoma

Sebbene ci siano stati progressi significativi nelle scienze mediche negli ultimi anni, i medici sono ancora confusi da molte malattie e i ricercatori stanno usando il sequenziamento dell'intero genoma per andare a fondo del problema. Sequenziamento dell'intero genoma è un processo che determina la sequenza del DNA di un intero genoma. Il sequenziamento dell'intero genoma è un approccio a forza bruta alla risoluzione dei problemi quando c'è una base genetica al centro di una malattia. Diversi laboratori ora forniscono servizi per sequenziare, analizzare e interpretare interi genomi.

Nel 2010, il sequenziamento dell'intero genoma è stato utilizzato per salvare un ragazzo il cui intestino presentava più ascessi misteriosi. Il bambino ha subito diverse operazioni al colon senza alcun sollievo. Infine, un'intera sequenza del genoma ha rivelato un difetto in una via che controlla l'apoptosi (morte cellulare programmata). Un trapianto di midollo osseo è stato utilizzato per superare questa malattia genetica, portando a una cura per il ragazzo. È stata la prima persona a essere diagnosticata con successo utilizzando il sequenziamento dell'intero genoma.

I primi genomi ad essere sequenziati, come quelli appartenenti a virus, batteri e lieviti, erano più piccoli in termini di numero di nucleotidi rispetto ai genomi di organismi multicellulari. I genomi di altri organismi modello, come il topo (Mus musculus), il moscerino della frutta (Drosophila melanogaster), e il nematode (Caenorhabditis elegans) sono ormai noti. Una grande quantità di ricerca di base viene eseguita in organismi modello perché le informazioni possono essere applicate ad altri organismi. Un organismo modello è una specie studiata come modello per comprendere i processi biologici in altre specie che possono essere rappresentati dall'organismo modello. Ad esempio, i moscerini della frutta sono in grado di metabolizzare l'alcol come gli esseri umani, quindi i geni che influenzano la sensibilità all'alcol sono stati studiati nei moscerini della frutta nel tentativo di comprendere la variazione della sensibilità all'alcol negli esseri umani. Avere interi genomi sequenziati aiuta con gli sforzi di ricerca in questi organismi modello.

Figura 2. Molta ricerca di base è fatta con organismi modello, come il topo, Mus musculus; il moscerino della frutta, Drosophila melanogaster; il nematode, Caenorhabditis elegans; il lievito, Saccharomyces cerevisiae; e l'erbaccia comune, Arabidopsis thaliana.

Credit: "mouse": modifica dell'opera di Florean Fortescuecredit; "nematodi": modifica del lavoro di "snickclunk"/Flickr; "erba comune": modifica del lavoro di Peggy Greb, USDA; dati della barra di scala di Matt Russell

La prima sequenza del genoma umano è stata pubblicata nel 2003. Il numero di interi genomi che sono stati sequenziati aumenta costantemente e ora include centinaia di specie e migliaia di singoli genomi umani.

Applicare la genomica

L'introduzione del sequenziamento del DNA e dei progetti di sequenziamento dell'intero genoma, in particolare il Progetto Genoma Umano, ha ampliato l'applicabilità delle informazioni sulla sequenza del DNA. La genomica viene ora utilizzata in un'ampia varietà di campi, come la metagenomica, la farmacogenomica e la genomica mitocondriale. L'applicazione più comunemente conosciuta della genomica è capire e trovare cure per le malattie.

Predire il rischio di malattia a livello individuale

La previsione del rischio di malattia implica lo screening e l'identificazione di individui attualmente sani mediante l'analisi del genoma a livello individuale. L'intervento con cambiamenti dello stile di vita e farmaci può essere raccomandato prima dell'insorgenza della malattia. Tuttavia, questo approccio è più applicabile quando il problema deriva da una singola mutazione genetica. Tali difetti rappresentano solo il 5% circa delle malattie riscontrate nei paesi sviluppati. La maggior parte delle malattie comuni, come le malattie cardiache, sono multifattoriali o poligeniche, che si riferiscono a una caratteristica fenotipica determinata da due o più geni, e anche da fattori ambientali come la dieta. Nell'aprile 2010, gli scienziati della Stanford University hanno pubblicato l'analisi del genoma di un individuo sano (Stephen Quake, uno scienziato della Stanford University, che ha sequenziato il suo genoma); l'analisi prevedeva la sua propensione ad acquisire varie malattie. È stata effettuata una valutazione del rischio per analizzare la percentuale di rischio di Quake per 55 diverse condizioni mediche. È stata trovata una rara mutazione genetica che lo ha mostrato a rischio di infarto improvviso. Si prevedeva anche che avesse un rischio del 23% di sviluppare il cancro alla prostata e un rischio dell'1,4% di sviluppare il morbo di Alzheimer. Gli scienziati hanno utilizzato database e diverse pubblicazioni per analizzare i dati genomici. Anche se il sequenziamento genomico sta diventando più accessibile e gli strumenti analitici stanno diventando più affidabili, restano da affrontare le questioni etiche relative all'analisi genomica a livello di popolazione. Ad esempio, tali dati potrebbero essere legittimamente utilizzati per addebitare più o meno costi per l'assicurazione o per influenzare i rating del credito?

Studi di associazione a livello di genoma

Dal 2005, è stato possibile condurre un tipo di studio chiamato studio di associazione genome-wide, o GWAS. Un GWAS è un metodo che identifica le differenze tra individui nei polimorfismi a singolo nucleotide (SNP) che possono essere coinvolti nel causare malattie. Il metodo è particolarmente adatto a malattie che possono essere colpite da uno o più cambiamenti genetici in tutto il genoma. È molto difficile identificare i geni coinvolti in una tale malattia utilizzando le informazioni sulla storia familiare. Il metodo GWAS si basa su un database genetico in sviluppo dal 2002 chiamato International HapMap Project. Il progetto HapMap ha sequenziato i genomi di diverse centinaia di individui da tutto il mondo e ha identificato gruppi di SNP. I gruppi includono SNP che si trovano vicini l'uno all'altro sui cromosomi, quindi tendono a stare insieme attraverso la ricombinazione. Il fatto che il gruppo rimanga unito significa che l'identificazione di un marker SNP è tutto ciò che è necessario per identificare tutti gli SNP nel gruppo. Ci sono diversi milioni di SNP identificati, ma identificarli in altri individui che non hanno sequenziato il loro genoma completo è molto più facile perché devono essere identificati solo gli SNP marcatori.

In un progetto comune per un GWAS, vengono scelti due gruppi di individui; un gruppo ha la malattia e l'altro gruppo no. Gli individui di ciascun gruppo sono abbinati in altre caratteristiche per ridurre l'effetto delle variabili confondenti che causano differenze tra i due gruppi. Ad esempio, i genotipi possono differire perché i due gruppi sono per lo più presi da diverse parti del mondo. Una volta scelti gli individui, e in genere il loro numero è di mille o più affinché lo studio funzioni, si ottengono campioni del loro DNA. Il DNA viene analizzato utilizzando sistemi automatizzati per identificare grandi differenze nella percentuale di particolari SNP tra i due gruppi. Spesso lo studio esamina un milione o più SNP nel DNA. I risultati del GWAS possono essere utilizzati in due modi: le differenze genetiche possono essere utilizzate come marcatori di suscettibilità alla malattia in individui non diagnosticati e i particolari geni identificati possono essere bersagli per la ricerca sul percorso molecolare della malattia e sulle potenziali terapie. Una propaggine della scoperta delle associazioni geniche con la malattia è stata la formazione di società che forniscono la cosiddetta "genomica personale", che identificherà i livelli di rischio per varie malattie sulla base del complemento SNP di un individuo. La scienza dietro questi servizi è controversa.

Poiché GWAS cerca associazioni tra geni e malattie, questi studi forniscono dati per altre ricerche sulle cause, piuttosto che rispondere a domande specifiche. Un'associazione tra una differenza genetica e una malattia non significa necessariamente che ci sia una relazione causa-effetto. Tuttavia, alcuni studi hanno fornito informazioni utili sulle cause genetiche delle malattie. Ad esempio, tre diversi studi nel 2005 hanno identificato un gene per una proteina coinvolta nella regolazione dell'infiammazione nel corpo che è associata a una cecità che causa la malattia chiamata degenerazione maculare senile. Questo ha aperto nuove possibilità per la ricerca sulla causa di questa malattia. Un gran numero di geni è stato identificato per essere associato alla malattia di Crohn usando GWAS e alcuni di questi hanno suggerito nuovi ipotetici meccanismi per la causa della malattia.

Farmacogenomica

Farmacogenomica comporta la valutazione dell'efficacia e della sicurezza dei farmaci sulla base delle informazioni provenienti dalla sequenza genomica di un individuo. Le informazioni sulla sequenza del genoma personale possono essere utilizzate per prescrivere farmaci che saranno più efficaci e meno tossici sulla base del genotipo del singolo paziente. Lo studio dei cambiamenti nell'espressione genica potrebbe fornire informazioni sul profilo di trascrizione genica in presenza del farmaco, che può essere utilizzato come indicatore precoce del potenziale di effetti tossici. Ad esempio, i geni coinvolti nella crescita cellulare e nella morte cellulare controllata, se disturbati, potrebbero portare alla crescita di cellule cancerose. Gli studi sull'intero genoma possono anche aiutare a trovare nuovi geni coinvolti nella tossicità dei farmaci. Le firme genetiche potrebbero non essere completamente accurate, ma possono essere testate ulteriormente prima che si manifestino sintomi patologici.

Metagenomica

Tradizionalmente, la microbiologia è stata insegnata con l'idea che i microrganismi siano meglio studiati in condizioni di coltura pura, il che comporta l'isolamento di un singolo tipo di cellula e la sua coltura in laboratorio. Poiché i microrganismi possono attraversare diverse generazioni in poche ore, i loro profili di espressione genica si adattano molto rapidamente al nuovo ambiente di laboratorio. D'altra parte, molte specie resistono ad essere coltivate in isolamento. La maggior parte dei microrganismi non vive come entità isolate, ma in comunità microbiche note come biofilm. Per tutti questi motivi, la coltura pura non è sempre il modo migliore per studiare i microrganismi. metagenomica è lo studio dei genomi collettivi di più specie che crescono e interagiscono in una nicchia ambientale. La metagenomica può essere utilizzata per identificare più rapidamente nuove specie e per analizzare l'effetto degli inquinanti sull'ambiente. Le tecniche di metagenomica possono ora essere applicate anche a comunità di eucarioti superiori, come i pesci.

Figura 3. La metagenomica implica l'isolamento del DNA da più specie all'interno di una nicchia ambientale. Il DNA viene tagliato e sequenziato, consentendo di ricostruire intere sequenze genomiche di più specie dalle sequenze di pezzi sovrapposti.

Creazione di nuovi biocarburanti

La conoscenza della genomica dei microrganismi viene utilizzata per trovare modi migliori per sfruttare i biocarburanti da alghe e cianobatteri. Le principali fonti di combustibile oggi sono carbone, petrolio, legno e altri prodotti vegetali come l'etanolo. Sebbene le piante siano risorse rinnovabili, è ancora necessario trovare più fonti di energia rinnovabili alternative per soddisfare le esigenze energetiche della nostra popolazione. Il mondo microbico è una delle maggiori risorse per i geni che codificano nuovi enzimi e producono nuovi composti organici, e rimane in gran parte non sfruttato. Questa vasta risorsa genetica ha il potenziale per fornire nuove fonti di biocarburanti.

Figura 4. I combustibili rinnovabili sono stati testati nelle navi e negli aerei della Marina al primo Forum sull'energia navale.

Credito: modifica del lavoro di John F. Williams, US Navy

Genomica mitocondriale

I mitocondri sono organelli intracellulari che contengono il proprio DNA. Il DNA mitocondriale muta rapidamente ed è spesso usato per studiare le relazioni evolutive. Un'altra caratteristica che rende interessante lo studio del genoma mitocondriale è che nella maggior parte degli organismi multicellulari, il DNA mitocondriale viene trasmesso dalla madre durante il processo di fecondazione. Per questo motivo, la genomica mitocondriale viene spesso utilizzata per tracciare la genealogia.

Genomica nell'analisi forense

Le informazioni e gli indizi ottenuti dai campioni di DNA trovati sulla scena del crimine sono stati utilizzati come prove in casi giudiziari e i marcatori genetici sono stati utilizzati nelle analisi forensi. Anche l'analisi genomica è diventata utile in questo campo. Nel 2001 è stato pubblicato il primo uso della genomica in medicina legale. È stato uno sforzo collaborativo tra istituti di ricerca accademici e l'FBI per risolvere i misteriosi casi di antrace trasportati dal servizio postale degli Stati Uniti. I batteri dell'antrace sono stati trasformati in una polvere infettiva e spediti ai media e a due senatori degli Stati Uniti. La polvere ha contagiato il personale amministrativo e gli impiegati delle poste che hanno aperto o maneggiato le lettere. Cinque persone sono morte e 17 si sono ammalate a causa dei batteri. Utilizzando la genomica microbica, i ricercatori hanno determinato che un ceppo specifico di antrace è stato utilizzato in tutte le spedizioni; alla fine, la fonte è stata rintracciata in uno scienziato in un laboratorio nazionale di biodifesa nel Maryland.

Figura 5. Bacillus anthracis è l'organismo che causa l'antrace.

Credito: modifica dell'opera da parte di CDC; dati della barra di scala di Matt Russell

Genomica in agricoltura

La genomica può ridurre in una certa misura le prove e i fallimenti coinvolti nella ricerca scientifica, il che potrebbe migliorare la qualità e la quantità dei raccolti in agricoltura. Il collegamento dei tratti ai geni o alle firme genetiche aiuta a migliorare l'allevamento delle colture per generare ibridi con le qualità più desiderabili. Gli scienziati utilizzano i dati genomici per identificare i tratti desiderabili e quindi trasferiscono tali tratti a un organismo diverso per creare un nuovo organismo geneticamente modificato, come descritto nel modulo precedente. Gli scienziati stanno scoprendo come la genomica può migliorare la qualità e la quantità della produzione agricola. Ad esempio, gli scienziati potrebbero utilizzare i tratti desiderabili per creare un prodotto utile o migliorare un prodotto esistente, ad esempio rendendo un raccolto sensibile alla siccità più tollerante della stagione secca.

Figura 6. Le piante agricole transgeniche possono essere fatte per resistere alle malattie. Queste prugne transgeniche sono resistenti al virus del vaiolo della prugna.

Credito: Scott Bauer, USDA ARS

Proteomica

Le proteine ​​sono i prodotti finali dei geni che svolgono la funzione codificata dal gene. Le proteine ​​sono composte da amminoacidi e svolgono ruoli importanti nella cellula. Tutti gli enzimi (eccetto i ribozimi) sono proteine ​​e agiscono come catalizzatori che influenzano la velocità delle reazioni. Le proteine ​​sono anche molecole regolatrici e alcune sono ormoni. Le proteine ​​di trasporto, come l'emoglobina, aiutano a trasportare l'ossigeno ai vari organi. Anche gli anticorpi che difendono dalle particelle estranee sono proteine. Nello stato malato, la funzione proteica può essere compromessa a causa di cambiamenti a livello genetico oa causa dell'impatto diretto su una proteina specifica.

Un proteoma è l'intero insieme di proteine ​​prodotte da un tipo di cellula. I proteomi possono essere studiati utilizzando la conoscenza dei genomi perché i geni codificano per mRNA e gli mRNA codificano per proteine. Lo studio della funzione dei proteomi è chiamato proteomica. La proteomica integra la genomica ed è utile quando gli scienziati vogliono testare le loro ipotesi basate sui geni. Anche se tutte le cellule di un organismo multicellulare hanno lo stesso insieme di geni, l'insieme di proteine ​​prodotte in diversi tessuti è diverso e dipende dall'espressione genica. Pertanto, il genoma è costante, ma il proteoma varia ed è dinamico all'interno di un organismo. Inoltre, gli RNA possono essere uniti alternativamente (tagliati e incollati per creare nuove combinazioni e nuove proteine) e molte proteine ​​vengono modificate dopo la traduzione. Sebbene il genoma fornisca un progetto, l'architettura finale dipende da diversi fattori che possono modificare la progressione degli eventi che generano il proteoma.

Si stanno studiando genomi e proteomi di pazienti affetti da malattie specifiche per comprendere le basi genetiche della malattia. La malattia più importante studiata con approcci proteomici è il cancro (Figura 7). Vengono utilizzati approcci proteomici per migliorare lo screening e la diagnosi precoce del cancro; ciò si ottiene identificando proteine ​​la cui espressione è influenzata dal processo patologico. Una singola proteina è chiamata a biomarcatore, mentre un insieme di proteine ​​con livelli di espressione alterati è chiamato a firma proteica. Affinché un biomarcatore o una firma proteica sia utile come candidato per lo screening precoce e la rilevazione di un cancro, deve essere secreto nei fluidi corporei come sudore, sangue o urina, in modo che gli screening su larga scala possano essere eseguiti in modo non invasivo .

Il problema attuale con l'utilizzo di biomarcatori per la diagnosi precoce del cancro è l'alto tasso di risultati falsi negativi. Un risultato falso negativo è un risultato del test negativo che avrebbe dovuto essere positivo. In altre parole, molti casi di cancro non vengono rilevati, il che rende i biomarcatori inaffidabili. Alcuni esempi di biomarcatori proteici utilizzati nella rilevazione del cancro sono CA-125 per il cancro ovarico e PSA per il cancro alla prostata. Le firme proteiche possono essere più affidabili dei biomarcatori per rilevare le cellule tumorali. La proteomica viene anche utilizzata per sviluppare piani di trattamento individualizzati, che prevedono la previsione se un individuo risponderà o meno a farmaci specifici e gli effetti collaterali che l'individuo potrebbe avere. La proteomica viene utilizzata anche per prevedere la possibilità di recidiva della malattia.

Figura 7. Questa macchina si sta preparando a eseguire un'analisi del modello proteomico per identificare tumori specifici in modo da poter effettuare una prognosi accurata del cancro.

Credito: Dorie Hightower, NCI, NIH

Il National Cancer Institute ha sviluppato programmi per migliorare l'individuazione e il trattamento del cancro. Le tecnologie proteomiche cliniche per il cancro e l'Early Detection Research Network sono sforzi per identificare le firme proteiche specifiche per i diversi tipi di cancro. Il programma di proteomica biomedica è progettato per identificare le firme proteiche e progettare terapie efficaci per i malati di cancro.

Riepilogo della sezione

La mappatura del genoma è simile alla risoluzione di un puzzle grande e complicato con informazioni provenienti da laboratori di tutto il mondo. Le mappe genetiche forniscono uno schema per la posizione dei geni all'interno di un genoma e stimano la distanza tra geni e marcatori genetici sulla base della frequenza di ricombinazione durante la meiosi. Le mappe fisiche forniscono informazioni dettagliate sulla distanza fisica tra i geni. Le informazioni più dettagliate sono disponibili tramite la mappatura della sequenza. Le informazioni provenienti da tutte le fonti di mappatura e sequenziamento vengono combinate per studiare un intero genoma.

Il sequenziamento dell'intero genoma è l'ultima risorsa disponibile per il trattamento delle malattie genetiche. Alcuni medici utilizzano il sequenziamento dell'intero genoma per salvare vite umane. La genomica ha molte applicazioni industriali tra cui lo sviluppo di biocarburanti, l'agricoltura, i prodotti farmaceutici e il controllo dell'inquinamento.

L'immaginazione è l'unico ostacolo all'applicabilità della genomica. La genomica viene applicata alla maggior parte dei campi della biologia; può essere utilizzato per la medicina personalizzata, la previsione dei rischi di malattia a livello individuale, lo studio delle interazioni farmacologiche prima della conduzione di studi clinici e lo studio dei microrganismi nell'ambiente rispetto al laboratorio. Viene anche applicato alla generazione di nuovi biocarburanti, alla valutazione genealogica utilizzando i mitocondri, ai progressi nelle scienze forensi e ai miglioramenti nell'agricoltura.

La proteomica è lo studio dell'intero insieme di proteine ​​espresse da un dato tipo di cellula in determinate condizioni ambientali. In un organismo multicellulare, diversi tipi di cellule avranno diversi proteomi e questi varieranno con i cambiamenti nell'ambiente. A differenza di un genoma, un proteoma è dinamico e in costante flusso, il che lo rende più complicato e più utile della sola conoscenza dei genomi.


Genetica, genomica e biologia dei sistemi

Il Committee on Genetics, Genomics & Systems Biology (GGSB) è un programma di borse di dottorato interdisciplinare che riunisce oltre 60 biologi di molti dipartimenti accademici. Il programma GGSB ha lo scopo di formare borsisti di dottorato per carriere come scienziati indipendenti nella ricerca e nell'istruzione biomedica di base e applicata. GGSB offre un programma di studi di base che porta al Dottore in Filosofia in Genetica. Il nostro programma di formazione di dottorato combina una base nell'analisi genetica moderna con la formazione sui metodi attuali per formulare e affrontare questioni biologiche nel contesto di sistemi complessi. Tali sistemi sono studiati in contesti fisiologici, evolutivi ed evolutivi. Gli oltre 60 docenti di formazione di GGSB rappresentano numerosi dipartimenti diversi dell'Università di Chicago. La presenza di scienze sia di base che cliniche nella divisione di scienze biologiche migliora l'ampio approccio interdisciplinare del GGSB all'insegnamento e alla ricerca. Il programma GGSB offre un ambiente entusiasmante in cui perseguire una formazione rigorosa e di alta qualità con flessibilità nella progettazione di programmi per soddisfare le esigenze individuali. Il nostro obiettivo è fornire un ambiente intellettualmente stimolante, collegiale e di supporto affinché gli studenti possano progredire senza intoppi dalla formazione alla ricerca all'indipendenza della ricerca.


Che cos'è un genoma?

L'insieme completo di DNA di un organismo è chiamato genoma. Praticamente ogni singola cellula del corpo contiene una copia completa dei circa 3 miliardi di coppie di basi del DNA, o lettere, che compongono il genoma umano.

Con il suo linguaggio di quattro lettere, il DNA contiene le informazioni necessarie per costruire l'intero corpo umano. Un gene si riferisce tradizionalmente all'unità di DNA che porta le istruzioni per produrre una proteina specifica o un insieme di proteine. Ciascuno dei 20.000-25.000 geni stimati nel genoma umano codifica per una media di tre proteine.

Situati su 23 coppie di cromosomi racchiusi nel nucleo di una cellula umana, i geni dirigono la produzione di proteine ​​con l'assistenza di enzimi e molecole messaggere. Nello specifico, un enzima copia le informazioni nel DNA di un gene in una molecola chiamata acido ribonucleico messaggero (mRNA). L'mRNA viaggia fuori dal nucleo e nel citoplasma della cellula, dove viene letto da una minuscola macchina molecolare chiamata ribosoma e l'informazione viene utilizzata per collegare insieme piccole molecole chiamate amminoacidi nell'ordine giusto per formare una proteina specifica.

Le proteine ​​costituiscono strutture corporee come organi e tessuti, controllano le reazioni chimiche e trasportano segnali tra le cellule. Se il DNA di una cellula è mutato, può essere prodotta una proteina anormale, che può interrompere i normali processi del corpo e portare a una malattia come il cancro.

L'insieme completo di DNA di un organismo è chiamato genoma. Praticamente ogni singola cellula del corpo contiene una copia completa dei circa 3 miliardi di coppie di basi del DNA, o lettere, che compongono il genoma umano.

Con il suo linguaggio di quattro lettere, il DNA contiene le informazioni necessarie per costruire l'intero corpo umano. Un gene si riferisce tradizionalmente all'unità di DNA che porta le istruzioni per produrre una proteina specifica o un insieme di proteine. Ciascuno dei 20.000-25.000 geni stimati nel genoma umano codifica per una media di tre proteine.

Situati su 23 coppie di cromosomi racchiusi nel nucleo di una cellula umana, i geni dirigono la produzione di proteine ​​con l'assistenza di enzimi e molecole messaggere. Nello specifico, un enzima copia le informazioni nel DNA di un gene in una molecola chiamata acido ribonucleico messaggero (mRNA). L'mRNA viaggia fuori dal nucleo e nel citoplasma della cellula, dove viene letto da una minuscola macchina molecolare chiamata ribosoma e l'informazione viene utilizzata per collegare insieme piccole molecole chiamate amminoacidi nell'ordine giusto per formare una proteina specifica.

Le proteine ​​costituiscono strutture corporee come organi e tessuti, controllano le reazioni chimiche e trasportano segnali tra le cellule. Se il DNA di una cellula è mutato, può essere prodotta una proteina anormale, che può interrompere i normali processi del corpo e portare a una malattia come il cancro.


L'obiettivo del ramo è dimostrare che i risultati della ricerca e le opportunità derivanti dalle tecnologie genetiche e genomiche possono essere tradotte in diagnosi, trattamenti e prevenzione migliori delle malattie umane. Utilizzando le eccellenti risorse dei laboratori intramurali NHGRI, del Centro clinico NIH e delle collaborazioni intramurali tra gli NIH, la filiale è impegnata nella ricerca di base, traslazionale e clinica, portando le ultime tecnologie genomiche e genetiche allo studio delle malattie umane.

I nostri ricercatori sviluppano e valutano rapidamente nuovi approcci traslazionali e tecnologie avanzate. Inoltre, le collaborazioni con il NIH Clinical Center, il NIH Intramural Sequencing Center e il NIH Chemical Genomics Center supportano progetti che espandono l'ampiezza dei laboratori di un singolo ricercatore. Le strutture principali di NHGRI sono componenti ugualmente importanti di tutti gli sforzi di ricerca del ramo, dando ai nostri ricercatori l'accesso a tecnologie bioinformatiche, transgenico-animale, citometria a flusso, genomiche e citogenetiche all'avanguardia. Queste risorse hanno permesso ai nostri ricercatori di sviluppare studi clinici per la terapia genica dell'immunodeficienza e lo sviluppo preclinico della terapia genica per i disturbi metabolici. Inoltre, i nostri ricercatori hanno scoperto i geni delle malattie e identificato piccole molecole per il trattamento di malattie ereditarie e neoplasie.

Il tutoraggio e la preparazione dei tirocinanti per le loro future carriere sono una priorità per la filiale. I docenti di filiale forniscono un'esperienza di apprendimento su vasta scala per i tirocinanti che viene estesa e integrata con i programmi di formazione e seminario intramurali NHGRI e NIH. I nostri investigatori partecipano ad attività di sensibilizzazione e opportunità di apprendimento, offrono stage estivi e tutoraggio di studenti provenienti da gruppi sottorappresentati

L'obiettivo del ramo è dimostrare che i risultati della ricerca e le opportunità derivanti dalle tecnologie genetiche e genomiche possono essere tradotte in diagnosi, trattamenti e prevenzione migliori delle malattie umane. Utilizzando le eccellenti risorse dei laboratori intramurali NHGRI, del Centro clinico NIH e delle collaborazioni intramurali tra gli NIH, la filiale è impegnata nella ricerca di base, traslazionale e clinica, portando le ultime tecnologie genomiche e genetiche allo studio delle malattie umane.

I nostri ricercatori sviluppano e valutano rapidamente nuovi approcci traslazionali e tecnologie avanzate. Inoltre, le collaborazioni con il NIH Clinical Center, il NIH Intramural Sequencing Center e il NIH Chemical Genomics Center supportano progetti che espandono l'ampiezza dei laboratori di un singolo ricercatore. Le strutture principali di NHGRI sono componenti ugualmente importanti di tutti gli sforzi di ricerca del ramo, dando ai nostri ricercatori l'accesso a tecnologie bioinformatiche, transgenico-animale, citometria a flusso, genomiche e citogenetiche all'avanguardia. Queste risorse hanno permesso ai nostri ricercatori di sviluppare studi clinici per la terapia genica dell'immunodeficienza e lo sviluppo preclinico della terapia genica per i disturbi metabolici. Inoltre, i nostri ricercatori hanno scoperto i geni delle malattie e identificato piccole molecole per il trattamento di malattie ereditarie e neoplasie.

Il tutoraggio e la preparazione dei tirocinanti per le loro future carriere sono una priorità per la filiale. I docenti di filiale forniscono un'esperienza di apprendimento su vasta scala per i tirocinanti che viene estesa e integrata con i programmi di formazione e seminario intramurali NHGRI e NIH. I nostri investigatori partecipano ad attività di sensibilizzazione e opportunità di apprendimento, offrono stage estivi e tutoraggio di studenti provenienti da gruppi sottorappresentati


Centro per la genomica e la biologia dei sistemi di amplificazione

Il Centro di genomica e biologia dei sistemi, ospitato in un "hub della scienza" all'avanguardia di 62.000 piedi quadrati, è nel cuore del campus di Washington Square della New York University. Oltre la sua storica facciata del Greenwich Village ci sono "laboratori loft" all'avanguardia aperti e interconnessi in cui scienziati tra cui professori, ricercatori e studenti interagiscono per sfruttare lo straordinario potenziale della genomica e della biologia dei sistemi nella ricerca e nell'istruzione

I programmi di ricerca del Centro abbracciano lo studio della genomica e della biologia dei sistemi come la prossima frontiera in un'era pionieristica delle scienze biologiche. Ciò implica le abilità combinate di genomico, computazionale, e biologi evoluzionisti che lavorano e studiano nel Centro. La Facoltà collabora anche con i ricercatori del Courant Institute of Mathematical Sciences, la Facoltà di Lettere e Scienze dipartimenti di Fisica e Chimica, NYU School of Medicine, NYU Polytechnic School of Engineering, NYU College of Global Public Health, NYU Center for Data Science e NYU Center for Urban Science and Progress, nonché con ricercatori di altre importanti istituzioni di New York e in tutto il mondo. Le sinergie intellettuali generate da queste collaborazioni interne ed esterne, ci consentono di sviluppare approcci unici alla genomica e alla biologia dei sistemi.

Lavorando con organismi di tutti i principali rami dell'albero della vita, i ricercatori del Centro si occupano di come codificano i genomi reti genetiche regolatorie, rispondere ai cambiamenti nel ambiente o durante sviluppo, come i geni evolvere, e come questo genera diversità all'interno e tra le specie. Questi principi vengono applicati a questioni globali in salute umana, sostenibilità alimentare, bioenergia, e il ambiente.


Genomica

Genomica è un forum per descrivere lo sviluppo di tecnologie su scala genomica e la loro applicazione a tutte le aree di indagine biologica.

Come rivista che si è evoluta con il campo che porta il suo nome, Genomica si concentra sullo sviluppo e l'applicazione di metodi all'avanguardia, affrontando fondamentali.

Genomica è un forum per descrivere lo sviluppo di tecnologie su scala genomica e la loro applicazione a tutte le aree di indagine biologica.

Come rivista che si è evoluta con il campo che porta il suo nome, Genomica si concentra sullo sviluppo e l'applicazione di metodi all'avanguardia, affrontando questioni fondamentali con potenziale interesse per un vasto pubblico. Il nostro obiettivo è pubblicare la ricerca della più alta qualità e fornire agli autori una revisione e pubblicazione rapida, equa e accurata dei manoscritti che rientrano nel nostro ambito. Gli argomenti nell'ambito della genomica includono, ma non sono limitati a:

  • Genomica, inclusi progetti genomici, sequenziamento del genoma, tecnologie genomiche e nuove strategie. Le semplici segnalazioni di genomi di varianti di singoli mitocondri, cloroplasti e ceppi batterici non sono più adatte.
  • Genomica funzionale, compresa la profilazione trascrizionale, l'analisi dell'mRNA, l'analisi dei microRNA e l'analisi di RNA non codificanti e di altro tipo utilizzando tecnologie consolidate e di nuova generazione (come l'espressione genica digitale). I manoscritti che analizzano solo i dati di sequenza esistenti non sono più adatti, a meno che non si aggiungano nuovi dati di sequenza o si introduca un nuovo algoritmo per l'analisi. L'algoritmo deve essere reso pubblicamente disponibile tramite una pagina web o come codice.
  • Genomica evolutiva e comparativa, inclusa la filogenomica.
  • Sviluppo di tecnologie e metodologie genomiche, con un focus su nuove ed entusiasmanti applicazioni con un potenziale di impatto significativo nel campo e tecnologie emergenti.
  • Biologia computazionale, bioinformatica e biostatistica, inclusi metodi integrativi, biologia delle reti e sviluppo di nuovi strumenti e tecniche.
  • Genetica moderna su scala genomica, inclusi studi genetici complessi, genomica della popolazione, studi di associazione, variazione strutturale e interazione gene-ambiente.
  • Analisi regolatoria genomica, inclusi elementi del DNA, regioni di controllo del locus, isolanti, potenziatori, silenziatori e meccanismi di regolazione genica.
  • Approcci genomici per comprendere il meccanismo della patogenesi della malattia e la sua relazione con i fattori genetici, inclusa la metagenomica e la modalità e il tempo dell'evoluzione del gene e della sequenza genomica.
  • Genomica medica, genomica personale e altre applicazioni per la salute umana.
  • Applicazione di tecniche genomiche in organismi modello che possono essere di interesse per un vasto pubblico.
  • Gli esperimenti RNA-seq senza tre o più replicati biologici non saranno accettati per articoli basati sull'espressione differenziale.
  • Systems Genomics, inclusa la ricerca all'avanguardia sulla biologia dei sistemi computazionali, la modellazione discreta e continua e l'intelligenza artificiale che aiutano a dedurre nuove intuizioni da set di dati genomici complessi, dinamici e ad alto rendimento.

Genomica pubblica principalmente articoli di ricerca originali, ma accoglie anche proposte per recensioni complete e mini. Tutti i contributi a Genomica sono soggetti a una rigorosa revisione tra pari e il nostro obiettivo è accettare solo il 25-30% dei manoscritti presentati. Si prega di contattare l'Ufficio Editoriale con proposte di revisione o qualsiasi domanda riguardante lo scopo della rivista o l'idoneità di un manoscritto per la pubblicazione.


Biologia spaziale: una nuova dimensione per la genomica

Josh Ryu, PhD
Co-fondatore e Chief Technology Officer
Biosistemi Rebus

Julia Kennedy-Darling, PhD
Responsabile del CODEX R&D
Akoya Biosciences

Yoni Bock
Vicepresidente associato,
Reagenti R&D, Vizgen

Data di trasmissione: 16 giugno 2021
Tempo: 14:00 ET

Sia che si analizzi l'espressione genica o la produzione di proteine, il nuovo entusiasmante campo della biologia spaziale (o omica spaziale) va oltre la tradizionale genomica unicellulare. Oltre a informare quali geni e proteine ​​sono espressi, la biologia spaziale rivela dove si trovano. Queste informazioni spaziali sono di fondamentale importanza quando si scopre la biologia di ambienti complessi, come un polmone infetto da SARS-CoV-2 o si differenziano le complessità tra un tumore del cancro e il suo microambiente.

Kary Mullis, l'inventore della PCR, una volta osservò che "la scienza produce costantemente un nuovo raccolto di verità miracolose e dispositivi abbaglianti ogni anno". Sebbene vere, poche nuove tecnologie possono eguagliare l'importanza dei pilastri di laboratorio, come la PCR e il sequenziamento di nuova generazione, che hanno rivoluzionato la ricerca scientifica. La biologia spaziale, tuttavia, mostra enormi promesse di essere annoverata tra questi elementi rivoluzionari.

In questo episodio di GEN Live, siamo entusiasti di avere team leader di giovani aziende spaziali che si uniscono a noi per discutere la nuova frontiera della biologia "spaziale", fino a che punto è arrivato il campo in breve tempo e i progressi che promette per il futuro .

Gli ospiti includono:
Josh Ryu, PhD, cofondatore e Chief Technology Officer di Rebus Biosystems
Julia Kennedy-Darling, PhD, capo del CODEX R&D, Akoya Biosciences
Yoni Bock, vicepresidente associato, ricerca e sviluppo reagenti, Vizgen

Co-host:
Julianna LeMieux, PhD
Kevin Davies, PhD
Alex Philppidis
John Sterling


Benvenuto in GCB!

La missione del Graduate Group in Genomics and Computational Biology (GCB) è quella di formare la prossima generazione di scienziati quantitativi con una comprensione integrata e profonda delle basi biologiche della salute e della malattia.

  • Amministrazione di un programma di formazione completo che offre agli studenti un'ampia base nelle scienze biologiche e quantitative insieme all'esperienza pratica nella genomica computazionale e sperimentale
  • Fornire ai tirocinanti una base di conoscenza attraverso corsi, seminari, ritiri e interazioni con scienziati in visita
  • Presentazione dei tirocinanti all'atmosfera altamente dinamica e collaborativa della comunità di genomica e biologia computazionale di Penn.

Prossimi eventi GCB

Le ultime da @UPennGCB

RT @moorejh: Sto reclutando un nuovo postdoc in bioinformatica presso @penn per sviluppare e applicare metodi di apprendimento automatico alla genomica e al&hellip https://t.co/Mj4guX0AjD

RT @autobencoder: Stai pensando di fare domanda per un dottorato di ricerca in biologia computazionale? Conosci qualcuno che lo è? Se è così, ho scritto un post t&hellip https://t.co/yjtGineHpg

&copia I fiduciari dell'Università della Pennsylvania | Sito visualizzato al meglio in un browser supportato. | Segnala problemi di accessibilità e ottieni assistenza | Informativa sulla privacy | Progettazione del sito: DART Web Team.


Contenuti

Per comprendere la genomica funzionale è importante definire prima la funzione. Nel loro articolo [1] Graur et al. definire la funzione in due modi possibili. Questi sono "Effetto selezionato" e "Ruolo causale". La funzione "Effetto selezionato" si riferisce alla funzione per la quale è selezionato un tratto (DNA, RNA, proteina ecc.). La funzione "Ruolo causale" si riferisce alla funzione per la quale un tratto è sufficiente e necessario. La genomica funzionale di solito verifica la definizione di funzione "Ruolo causale".

L'obiettivo della genomica funzionale è comprendere la funzione dei geni o delle proteine, eventualmente di tutti i componenti di un genoma. Il termine genomica funzionale è spesso usato per riferirsi ai molti approcci tecnici studiare un organismo geni e proteine, comprese le "proprietà biochimiche, cellulari e/o fisiologiche di ogni singolo prodotto genico" [2] mentre alcuni autori includono lo studio di elementi non genici nella loro definizione. [3] La genomica funzionale può includere anche studi di natura variazione genetica col tempo (come lo sviluppo di un organismo) o spazio (come le sue regioni del corpo), così come le interruzioni funzionali come le mutazioni.

La promessa della genomica funzionale è di generare e sintetizzare la conoscenza genomica e proteomica in una comprensione delle proprietà dinamiche di un organismo. Ciò potrebbe potenzialmente fornire un quadro più completo di come il genoma specifica la funzione rispetto agli studi sui singoli geni. L'integrazione dei dati di genomica funzionale è spesso parte degli approcci alla biologia dei sistemi.

La genomica funzionale include aspetti legati alla funzione del genoma stesso come mutazione e polimorfismo (come l'analisi del polimorfismo a singolo nucleotide (SNP)), nonché la misurazione delle attività molecolari. Questi ultimi comprendono una serie di "-omici" come trascrittomica (espressione genica), proteomica (produzione di proteine) e metabolomica. La genomica funzionale utilizza principalmente tecniche multiplex per misurare l'abbondanza di molti o di tutti i prodotti genici come mRNA o proteine ​​all'interno di un campione biologico. Un approccio di genomica funzionale più mirato potrebbe testare la funzione di tutte le varianti di un gene e quantificare gli effetti dei mutanti utilizzando il sequenziamento come lettura dell'attività. Insieme, queste modalità di misurazione cercano di quantificare i vari processi biologici e migliorare la nostra comprensione delle funzioni e delle interazioni di geni e proteine.

A livello del DNA Modifica

Mappatura dell'interazione genetica Modifica

Systematic pairwise deletion of genes or inhibition of gene expression can be used to identify genes with related function, even if they do not interact physically. Epistasis refers to the fact that effects for two different gene knockouts may not be additive that is, the phenotype that results when two genes are inhibited may be different from the sum of the effects of single knockouts.

DNA/Protein interactions Edit

Proteins formed by the translation of the mRNA (messenger RNA, a coded information from DNA for protein synthesis) play a major role in regulating gene expression. To understand how they regulate gene expression it is necessary to identify DNA sequences that they interact with. Techniques have been developed to identify sites of DNA-protein interactions. These include ChIP-sequencing, CUT&RUN sequencing and Calling Cards. [4]

DNA accessibility assays Edit

Assays have been developed to identify regions of the genome that are accessible. These regions of open chromatin are candidate regulatory regions. These assays include ATAC-seq, DNase-Seq and FAIRE-Seq.

At the RNA level Edit

Microarrays Edit

Microarrays measure the amount of mRNA in a sample that corresponds to a given gene or probe DNA sequence. Probe sequences are immobilized on a solid surface and allowed to hybridize with fluorescently labeled “target” mRNA. The intensity of fluorescence of a spot is proportional to the amount of target sequence that has hybridized to that spot, and therefore to the abundance of that mRNA sequence in the sample. Microarrays allow for identification of candidate genes involved in a given process based on variation between transcript levels for different conditions and shared expression patterns with genes of known function.

SAGE Edit

Serial analysis of gene expression (SAGE) is an alternate method of analysis based on RNA sequencing rather than hybridization. SAGE relies on the sequencing of 10–17 base pair tags which are unique to each gene. These tags are produced from poly-A mRNA and ligated end-to-end before sequencing. SAGE gives an unbiased measurement of the number of transcripts per cell, since it does not depend on prior knowledge of what transcripts to study (as microarrays do).

RNA sequencing Edit

RNA sequencing has taken over microarray and SAGE technology in recent years, as noted in 2016, and has become the most efficient way to study transcription and gene expression. This is typically done by next-generation sequencing. [5]

A subset of sequenced RNAs are small RNAs, a class of non-coding RNA molecules that are key regulators of transcriptional and post-transcriptional gene silencing, or RNA silencing. Next generation sequencing is the gold standard tool for non-coding RNA discovery, profiling and expression analysis.

Massively Parallel Reporter Assays (MPRAs) Edit

Massively parallel reporter assays is a technology to test the cis-regulatory activity of DNA sequences. [6] [7] MPRAs use a plasmid with a synthetic cis-regulatory element upstream of a promoter driving a synthetic gene such as Green Fluorescent Protein. A library of cis-regulatory elements is usually tested using MPRAs, a library can contain from hundreds to thousands of cis-regulatory elements. The cis-regulatory activity of the elements is assayed by using the downstream reporter activity. The activity of all the library members is assayed in parallel using barcodes for each cis-regulatory element. One limitation of MPRAs is that the activity is assayed on a plasmid and may not capture all aspects of gene regulation observed in the genome.

STARR-seq Edit

STARR-seq is a technique similar to MPRAs to assay enhancer activity of randomly sheared genomic fragments. In the original publication, [8] randomly sheared fragments of the Drosophila genome were placed downstream of a minimal promoter. Candidate enhancers amongst the randomly sheared fragments will transcribe themselves using the minimal promoter. By using sequencing as a readout and controlling for input amounts of each sequence the strength of putative enhancers are assayed by this method.

Perturb-seq Edit

Perturb-seq couples CRISPR mediated gene knockdowns with single-cell gene expression. Linear models are used to calculate the effect of the knockdown of a single gene on the expression of multiple genes.

At the protein level Edit

Yeast two-hybrid system Edit

A yeast two-hybrid screening (Y2H) tests a "bait" protein against many potential interacting proteins ("prey") to identify physical protein–protein interactions. This system is based on a transcription factor, originally GAL4, [9] whose separate DNA-binding and transcription activation domains are both required in order for the protein to cause transcription of a reporter gene. In a Y2H screen, the "bait" protein is fused to the binding domain of GAL4, and a library of potential "prey" (interacting) proteins is recombinantly expressed in a vector with the activation domain. In vivo interaction of bait and prey proteins in a yeast cell brings the activation and binding domains of GAL4 close enough together to result in expression of a reporter gene. It is also possible to systematically test a library of bait proteins against a library of prey proteins to identify all possible interactions in a cell.

AP/MS Edit

Affinity purification and mass spectrometry (AP/MS) is able to identify proteins that interact with one another in complexes. Complexes of proteins are allowed to form around a particular “bait” protein. The bait protein is identified using an antibody or a recombinant tag which allows it to be extracted along with any proteins that have formed a complex with it. The proteins are then digested into short peptide fragments and mass spectrometry is used to identify the proteins based on the mass-to-charge ratios of those fragments.

Deep mutational scanning Edit

In deep mutational scanning every possible amino acid change in a given protein is first synthesized. The activity of each of these protein variants is assayed in parallel using barcodes for each variant. By comparing the activity to the wild-type protein, the effect of each mutation is identified. While it is possible to assay every possible single amino-acid change due to combinatorics two or more concurrent mutations are hard to test. Deep mutational scanning experiments have also been used to infer protein structure and protein-protein interactions.

Loss-of-function techniques Edit

Mutagenesis Edit

Gene function can be investigated by systematically “knocking out” genes one by one. This is done by either deletion or disruption of function (such as by insertional mutagenesis) and the resulting organisms are screened for phenotypes that provide clues to the function of the disrupted gene*

RNAi Edit

RNA interference (RNAi) methods can be used to transiently silence or knock down gene expression using

20 base-pair double-stranded RNA typically delivered by transfection of synthetic

20-mer short-interfering RNA molecules (siRNAs) or by virally encoded short-hairpin RNAs (shRNAs). RNAi screens, typically performed in cell culture-based assays or experimental organisms (such as C. elegans) can be used to systematically disrupt nearly every gene in a genome or subsets of genes (sub-genomes) possible functions of disrupted genes can be assigned based on observed phenotypes.

CRISPR screens Edit

CRISPR-Cas9 has been used to delete genes in a multiplexed manner in cell-lines. Quantifying the amount of guide-RNAs for each gene before and after the experiment can point towards essential genes. If a guide-RNA disrupts an essential gene it will lead to the loss of that cell and hence there will be a depletion of that particular guide-RNA after the screen. In a recent CRISPR-cas9 experiment in mammalian cell-lines, around 2000 genes were found to be essential in multiple cell-lines. [11] [12] Some of these genes were essential in only one cell-line. Most of genes are part of multi-protein complexes. This approach can be used to identify synthetic lethality by using the appropriate genetic background. CRISPRi and CRISPRa enable loss-of-function and gain-of-function screens in a similar manner. CRISPRi identified

2100 essential genes in the K562 cell-line. [13] [14] CRISPR deletion screens have also been used to identify potential regulatory elements of a gene. For example, a technique called ScanDel was published which attempted this approach. The authors deleted regions outside a gene of interest(HPRT1 involved in a Mendelian disorder) in an attempt to identify regulatory elements of this gene. [15] Gassperini et al. did not identify any distal regulatory elements for HPRT1 using this approach, however such approaches can be extended to other genes of interest.

Functional annotations for genes Edit

Genome annotation Edit

Putative genes can be identified by scanning a genome for regions likely to encode proteins, based on characteristics such as long open reading frames, transcriptional initiation sequences, and polyadenylation sites. A sequence identified as a putative gene must be confirmed by further evidence, such as similarity to cDNA or EST sequences from the same organism, similarity of the predicted protein sequence to known proteins, association with promoter sequences, or evidence that mutating the sequence produces an observable phenotype.

Rosetta stone approach Edit

The Rosetta stone approach is a computational method for de-novo protein function prediction. It is based on the hypothesis that some proteins involved in a given physiological process may exist as two separate genes in one organism and as a single gene in another. Genomes are scanned for sequences that are independent in one organism and in a single open reading frame in another. If two genes have fused, it is predicted that they have similar biological functions that make such co-regulation advantageous.

Because of the large quantity of data produced by these techniques and the desire to find biologically meaningful patterns, bioinformatics is crucial to analysis of functional genomics data. Examples of techniques in this class are data clustering or principal component analysis for unsupervised machine learning (class detection) as well as artificial neural networks or support vector machines for supervised machine learning (class prediction, classification). Functional enrichment analysis is used to determine the extent of over- or under-expression (positive- or negative- regulators in case of RNAi screens) of functional categories relative to a background sets. Gene ontology based enrichment analysis are provided by DAVID and gene set enrichment analysis (GSEA), [16] pathway based analysis by Ingenuity [17] and Pathway studio [18] and protein complex based analysis by COMPLEAT. [19]

New computational methods have been developed for understanding the results of a deep mutational scanning experiment. 'phydms' compares the result of a deep mutational scanning experiment to a phylogenetic tree. [20] This allows the user to infer if the selection process in nature applies similar constraints on a protein as the results of the deep mutational scan indicate. This may allow an experimenter to choose between different experimental conditions based on how well they reflect nature. Deep mutational scanning has also been used to infer protein-protein interactions. [21] The authors used a thermodynamic model to predict the effects of mutations in different parts of a dimer. Deep mutational structure can also be used to infer protein structure. Strong positive epistasis between two mutations in a deep mutational scan can be indicative of two parts of the protein that are close to each other in 3-D space. This information can then be used to infer protein structure. A proof of principle of this approach was shown by two groups using the protein GB1. [22] [23]

Results from MPRA experiments have required machine learning approaches to interpret the data. A gapped k-mer SVM model has been used to infer the kmers that are enriched within cis-regulatory sequences with high activity compared to sequences with lower activity. [24] These models provide high predictive power. Deep learning and random forest approaches have also been used to interpret the results of these high-dimensional experiments. [25] These models are beginning to help develop a better understanding of non-coding DNA function towards gene-regulation.

The ENCODE project Edit

The ENCODE (Encyclopedia of DNA elements) project is an in-depth analysis of the human genome whose goal is to identify all the functional elements of genomic DNA, in both coding and noncoding regions. Important results include evidence from genomic tiling arrays that most nucleotides are transcribed as coding transcripts, noncoding RNAs, or random transcripts, the discovery of additional transcriptional regulatory sites, further elucidation of chromatin-modifying mechanisms.

The Genotype-Tissue Expression (GTEx) project Edit

The GTEx project is a human genetics project aimed at understanding the role of genetic variation in shaping variation in the transcriptome across tissues. The project has collected a variety of tissue samples (> 50 different tissues) from more than 700 post-mortem donors. This has resulted in the collection of >11,000 samples. GTEx has helped understand the tissue-sharing and tissue-specificity of EQTLs. [26]


Funding Opportunities

Investigators interested in submitting applications to NHGRI are encouraged to contact NHGRI program staff before submission to discuss their specific aims and their choice of Funding Opportunity Announcement (FOA). Contact information for NHGRI program staff is at the bottom of this page.

Investigator Initiated Research in Computational Genomics and Data Science (R01, R21, and R43/R44): PAR-18-844, PAR-18-843, and PAR-19-061, invite applications for a broad range of research efforts in computational genomics, data science, statistics, and bioinformatics relevant to one or both of basic or clinical genomic science, and broadly applicable to human health and disease.

Genomic Resource Grants for Community Resource Projects (U24): PAR-20-100 is tightly focused on supporting major genomic resources, including those in informatics. Potential applicants are strongly encouraged to contact NHGRI Program Staff before developing an application.

Parent NIH Solicitations: R01 (PA-20-185 and PA-20-183), Parent R21 (PA-20-195 and PA-20-194), and Parent K25 (PA-20-199) solicitations. These investigator-initiated grants allow researchers to target their specific area of science relevant to NHGRI’s mission (per the NHGRI Funding Policy). Other funding opportunities include PAR-21-075, which focuses on research experiences for students seeking a master’s degree. Additionally, NIH funding opportunities for Small Business Innovation Research (SBIR) and Small Business Technology Transfer (STTR) grants can be found at https://sbir.nih.gov/funding.

Other Relevant NIH Funding Opportunities

NHGRI's Funding Opportunities page links to various NHGRI funding opportunities and provides instructions for signing up for NHGRI's funding opportunities email list.

The webpage of the Biomedical Information Science and Technology Initiative (BISTI) provides links to various informatics-related funding opportunities across NIH and other Federal agencies.

Investigators interested in submitting applications to NHGRI are encouraged to contact NHGRI program staff before submission to discuss their specific aims and their choice of Funding Opportunity Announcement (FOA). Contact information for NHGRI program staff is at the bottom of this page.

Investigator Initiated Research in Computational Genomics and Data Science (R01, R21, and R43/R44): PAR-18-844, PAR-18-843, and PAR-19-061, invite applications for a broad range of research efforts in computational genomics, data science, statistics, and bioinformatics relevant to one or both of basic or clinical genomic science, and broadly applicable to human health and disease.

Genomic Resource Grants for Community Resource Projects (U24): PAR-20-100 is tightly focused on supporting major genomic resources, including those in informatics. Potential applicants are strongly encouraged to contact NHGRI Program Staff before developing an application.

Parent NIH Solicitations: R01 (PA-20-185 and PA-20-183), Parent R21 (PA-20-195 and PA-20-194), and Parent K25 (PA-20-199) solicitations. These investigator-initiated grants allow researchers to target their specific area of science relevant to NHGRI’s mission (per the NHGRI Funding Policy). Other funding opportunities include PAR-21-075, which focuses on research experiences for students seeking a master’s degree. Additionally, NIH funding opportunities for Small Business Innovation Research (SBIR) and Small Business Technology Transfer (STTR) grants can be found at https://sbir.nih.gov/funding.

Other Relevant NIH Funding Opportunities

NHGRI's Funding Opportunities page links to various NHGRI funding opportunities and provides instructions for signing up for NHGRI's funding opportunities email list.

The webpage of the Biomedical Information Science and Technology Initiative (BISTI) provides links to various informatics-related funding opportunities across NIH and other Federal agencies.


Guarda il video: ENCODE: Das größte Projekt der Humangenetiker (Dicembre 2022).