Processo di previsione genetica e conteggio

Processo di pronostici e conteggio genetici!

L'annonazione è un processo che identifica i geni, le loro sequenze di regolazione e le possibili funzioni. Annonazione indica i geni codificanti non proteici, i geni codificanti per R RNA, t RNA e RNA nucleare, gli elementi genetici mobili e le famiglie di sequenze ripetitive presenti nel genoma.

Il compito di annonazione inizia solo dopo che è stata ottenuta la sequenza del genoma. La predizione genetica è un problema importante per la biologia computazionale e ci sono vari logaritmi che possono essere utilizzati per la predizione del gene utilizzando geni identificati come set di dati di addestramento.

Il conteggio dei geni diventa difficile a dispetto di conoscere la posizione dell'esistenza dei geni in un genoma. La presenza di geni sovrapposti e varianti di splicing rende il compito più difficile. Diventa difficile prevedere quali parti del DNA dovrebbero essere considerate come stesse o molti geni diversi.

Fig.6.70. Una mappa SNP

Molti geni negli eucarioti portano un modello di esoni (regioni codificanti) seguito da introni (regioni non codificanti). A causa di questo, i geni non sono organizzati come ORF continui (frame di lettura aperti). Un ORF ha una serie di codoni che specificano una sequenza di amminoacidi.

I secondi geni negli eucarioti sono di solito molto distanziati, quindi hanno più possibilità di localizzare i falsi geni. Ma le nuove tecniche del software di scansione ORF per i geni eucariotici rendono la scansione più efficiente. Ora possiamo contare i geni di un organismo (con qualche errore sperimentale).

Si dice che circa il 99, 8% di 3, 2 miliardi di coppie di basi tra due esseri umani sia lo stesso e solo lo 0, 2% diverso. Per ogni 500 nucleotidi, solo un nucleotide differisce tra due individui. Significa che la variazione in alcune posizioni nella sequenza del DNA può portare a malattie gravi e diversi caratteri negli esseri umani.

Somiglianza genomica, SNP e genomica comparativa:

Come già detto, il 99, 8% di ogni genoma umano è simile a qualsiasi altro genoma umano e allo 0, 2% diverso. Ciò significa che due individui differiscono solo in 6 milioni di posizioni su 3, 2 miliardi di posizioni.

Se queste posizioni hanno poco effetto, due esseri umani saranno identici. Gli umani sono più del 98% simili agli scimpanzé. Quindi la differenza in poche posizioni nel DNA porta a rendere l'individuo unico. Per ogni 500-1000 nucleotidi, un nucleotide differisce tra due individui.

Variazioni importanti nei singoli genomi sono polimorfismi a singolo nucleotide o SNP, che sono stati osservati in entrambe le regioni codificanti e non codificanti del genoma. Gli SNP sono fondamentalmente un'alterazione nella singola base, cioè A, C, G o T, portando a variazioni del DNA che portano all'esistenza di lettere diverse in tali posizioni. Il tipo di nucleotide o base presente in una data posizione su un cromosoma può variare a seconda delle persone.

Si dice che - il 90% delle variazioni di sequenza nell'uomo è dovuto alla presenza di SNP. Quindi gli SNP forniscono un marcatore molecolare presente in alta densità.

Nella stampa di impronte digitali del DNA in parti del genoma particolarmente non codificanti vengono sfruttate tali variazioni genetiche tra diversi esseri umani.

Tali variazioni genetiche sono anche responsabili della severità della malattia e della risposta del corpo al trattamento. Una singola differenza di base nel gene Apo E porta alla malattia di Alzheimer e una delezione all'interno del CCRS (gene del recettore delle chemochine) è responsabile della resistenza di HW e AIDS.

Gli SNP sono utilizzati per mappare i geni coinvolti nelle malattie umane. Usando gli SNP come marker, è possibile mappare tutti i geni del genoma umano. Gli SNP si trovano all'interno del gene o possono mostrare un legame stretto.

I dati di sequenza vengono archiviati in database e analizzati per conoscere gli SNP. Sono stati sviluppati chip di DNA e microarray per l'identificazione degli SNP. I medici utilizzando campioni di DNA di pazienti possono identificare il modello del profilo genotipo SNP. In questo modo sono in grado di dire la risposta dei pazienti a un tipo specifico di medicina.

La branca della medicina che studia l'effetto della variazione genetica sulla suscettibilità alla malattia e sulla risposta alla medicina è chiamata farmacogenomica.

Poiché pochi SNP differiscono in frequenza in popolazioni diverse, l'analisi SNP può essere utilizzata per lo studio della genetica della popolazione.

È interessante notare che i genomi di topo e uomo sono molto simili tra loro (circa il 97, 5%). Scimpanzé e genoma umano differiscono solo nel rapporto tra 1 e 3%. Quindi si può concludere che è dovuto alla condivisione di un antenato comune 100 milioni di anni fa e non è avvenuto molto cambiamento nel genoma.

Da queste piccole differenze genetiche emerge la varietà umana come le differenze di vista dell'occhio, colore dei capelli, taglia dei piedi ecc. Alcuni SNP sono collegati a specifiche popolazioni umane e forniscono informazioni sulle migrazioni umane avvenute diversi anni fa e su un passato evolutivo più lontano .