docgid.ru

Che tipo di depressione si verifica dopo il parto. Depressione postpartum: sintomi e segni. Fattori di rischio per l'ansia

C'è meno somiglianza tra due membri della razza umana che tra due animali diversi.

Michel de Montaigne

Ciò che è nuovo in sé sarà compreso solo per analogia con il vecchio.

Come già accennato, serve il metodo comparativo approccio tradizionale negli antichi campi classici della biologia (anatomia, embriologia, citologia). Pertanto, Darwin ha confermato il suo punto di vista sull'origine dell'uomo utilizzando il metodo evolutivo comparativo, indicando numerose somiglianze nell'anatomia e nella fisiologia dell'uomo e delle scimmie.

Recentemente, l'approccio comparativo è stato ampiamente ed efficacemente utilizzato nella biologia molecolare e nella genetica. Un potente impulso a questo scopo è stato dato dal sequenziamento su larga scala dei genomi. È apparsa anche una nuova direzione nella genomica: la genomica comparativa: confronto di singoli geni, gruppi di geni e interi loci di organismi molto distanti dal punto di vista evolutivo. Questa area di ricerca di fondamentale importanza ci consente di affrontare una serie di questioni chiave in un modo nuovo. Diamo un'occhiata ad alcuni di loro.

Attualmente l'umanità, oltre alla propria Enciclopedia, dispone di Enciclopedie simili di alcuni organismi semplici: coli, La Drosophila vola, lievito e verme Caenoharbditis elegans, così come i topi - e singoli capitoli delle Enciclopedie di altri organismi altamente organizzati (scimmie, ratti). Oggi, parallelamente al sequenziamento del genoma umano, vengono decifrati circa altri 1000 genomi di altri animali e piante. Il testo del DNA in tutte queste enciclopedie è scritto con le stesse quattro lettere, il cui numero è di milioni per i batteri, centinaia di milioni per gli uccelli e miliardi per i mammiferi e gli esseri umani. Poiché tutti i testi sono scritti allo stesso modo, possono essere confrontati tra loro. Si è scoperto che, nonostante le enormi differenze nelle dimensioni del genoma, il numero di geni (il più proposte significative nei testi) non differisce molto tra le diverse specie di organismi. A questo proposito, iniziarono persino a parlare di un certo paradosso, che ricevette il nome speciale G-paradosso (la prima lettera della parola inglese gene - gene). Ora questo paradosso è spiegato dal fatto che la cosa principale per il corpo non è ancora numero totale geni, ma come sono strutturati e come sono regolati, qual è la complessità dell'interazione tra i prodotti di geni diversi. "Condividiamo gli stessi geni con cani e gatti, ma sono regolati in modo diverso", ha affermato Craig Venter, uno dei protagonisti del sequenziamento del genoma umano. Molto probabilmente, sono la struttura e la regolazione della funzione genetica a essere uniche per l’uomo, a renderlo la “corona della natura”. In breve, se un gene è una frase breve, allora da una combinazione delle stesse parole e frasi puoi scrivere sia il trattato più intelligente che le filastrocche primitive. Inoltre, è importante il modo in cui verranno letti e suonati.

Non importa quanto possiamo sembrare unici a noi stessi, il nostro DNA ha molte somiglianze non solo con scimmie e topi, ma anche con un piccolo verme C. elegans e la mosca Drosophila. Può sorprendere, ma circa il 50% dei nostri geni sono simili a quelli dei vermi. Gli esseri umani e i topi condividono una quantità ancora maggiore degli stessi geni, sebbene l’evoluzione degli esseri umani e dei topi si sia differenziata circa 100 milioni di anni fa. Ad oggi, nel genoma umano sono stati scoperti solo circa 300 geni che non si trovano nei topi e il loro numero totale è approssimativamente lo stesso. Pertanto, circa il 99% dei geni umani corrispondono ai geni del topo e circa l'80% di essi sono quasi esattamente identici. Inoltre, fino al 90% dei geni responsabili della comparsa di varie malattie sono simili nell’uomo e nei topi. Ci sono, ovviamente, piccole differenze. Quindi, i topi hanno molti più geni responsabili dell'olfatto.

Per quanto riguarda i nostri parenti più stretti, le differenze sono ancora minori. Secondo i dati più recenti, in generale, il genoma umano differisce da quello dello scimpanzé solo al massimo del 5%! Sorprendentemente, alcuni gruppi di geni negli esseri umani (ad esempio, i geni responsabili della formazione del corpo di un organismo) sono simili a gruppi simili nelle specie biologiche sorte da cinquecento a seicento milioni di anni fa, durante il cosiddetto Cambriano biologico. esplosione. Ora aspettiamo con impazienza il momento in cui il genoma degli scimpanzé sarà completamente sequenziato. Successivamente dovrebbe iniziare una nuova fase molto importante nella genomica comparativa. Come risultato di tale confronto, si potrebbero scoprire mutazioni funzionalmente importanti specifiche per l’uomo come specie, che a loro volta apriranno nuove strade alla medicina. Naturalmente, questi dati contribuiranno anche a una comprensione più completa del processo di evoluzione umana.

Il confronto delle sequenze di DNA umano con il DNA di altri organismi si è già dimostrato un metodo molto fruttuoso per la ricerca di nuove sequenze funzionalmente importanti nel genoma umano. Questo approccio è stato utilizzato e continua ad essere utilizzato per identificare nuovi geni codificanti proteine ​​e non codificanti proteine ​​negli esseri umani, nonché per identificare potenziali elementi regolatori e chiarire i meccanismi di funzionamento di diversi set di geni. A questo scopo sono stati ora creati appositi programmi informatici che permettono di “catturare” genomi diversi aree evolutivamente conservate. Tutto ciò è di fondamentale importanza poiché, come già sottolineato in precedenza, non possiamo condurre esperimenti genetici sull'uomo, ma, grazie al metodo comparativo, abbiamo la possibilità di interpolare per l'uomo i risultati che si ottengono dagli studi di genetica molecolare condotti sugli animali.

Pertanto, a causa della somiglianza dei genomi, anche la mosca della Drosophila può essere utilizzata per una comprensione più completa delle funzioni di alcuni geni umani, in particolare, responsabile di alcune malattie umane. Un esempio di ciò è lo studio del gene dFMR-1 fly, che presenta omologia con il corrispondente gene umano che determina la sindrome dell’X fragile, una grave malattia neurodegenerativa ereditaria. Questo studio ci ha permesso di concludere che la causa della sindrome è molto probabilmente associata a una violazione del meccanismo di interferenza dell'RNA, di cui abbiamo già discusso in precedenza. E questo è un serio “suggerimento” per gli scienziati, risolvendo il problema Sindrome dell'X fragile nell'uomo.

È importante notare che quando studiamo il genoma umano, in realtà impariamo a conoscere l’intero mondo vivente. Il genoma umano è estremamente complesso. I genomi di animali e piante sono spesso molto più semplici. Pertanto, quando impareremo la struttura di un genoma complesso, sarà molto facile per noi passare da esso allo studio di uno semplice. E questo promette una rivoluzione in settori come la medicina veterinaria e l’allevamento di piante e animali.

La genomica comparativa ha offerto agli scienziati un nuovo approccio alla comprensione del processo di evoluzione e dei suoi meccanismi, apparentemente nascosti per sempre nell’oscurità dei secoli. Ad esempio, il confronto dei genomi di diverse specie di animali e di esseri umani ha mostrato la presenza di alcune tendenze nell'evoluzione. Uno di questi è aumentare il numero di introni nel processo di sviluppo evolutivo nell'uomo, cioè l'evoluzione è, per così dire, associata alla "divisione" del genoma in frammenti separati funzionalmente significativi: per unità di lunghezza del DNA c'è contiene sempre meno informazioni sulla struttura delle proteine ​​e dell'RNA (esoni) e sempre più regioni che non hanno ancora un chiaro significato funzionale (introni). Le ricerche condotte suggeriscono che la natura ha migliorato i mammiferi non tanto aumentando la diversità dei loro geni, ma copiando, modificando e combinando gradualmente già geni esistenti, nonché modificando la regolazione dell'espressione genica. La specificità e la diversità della struttura e del funzionamento dell'apparato genetico sono grandi anche tra gli eucarioti. Allo stesso tempo, esistono molti principi e meccanismi generali e i risultati del loro studio su alcuni oggetti possono spesso essere trasferiti con successo ad altri, compresi gli esseri umani.

Risultati molto interessanti sono stati ottenuti, in particolare, confrontando la distribuzione cromosomica di sequenze di DNA simili nell'uomo e in altri animali. Facciamo solo un esempio. Come già indicato, esistono grandi somiglianze tra il genoma umano e quello del topo. Nella fig. 37, l'inserto colorato mostra la posizione di segmenti simili di singoli cromosomi umani in diversi cromosomi di topo. Osservando questa figura, possiamo vedere che sezioni degli stessi cromosomi umani sono distribuiti su molti cromosomi di topo. Ciò è vero anche viceversa. Cosa significa? Questo ci racconta i percorsi lungo i quali è avvenuta l'evoluzione dei mammiferi (dopotutto, topi e esseri umani sono mammiferi). Dopo aver analizzato attentamente l'immagine mostrata in Fig. 37, gli scienziati hanno scoperto che ai confini delle diverse sezioni del DNA del topo, che si trovano nel DNA umano, si trovano vari elementi genetici mobili, ripetizioni in tandem e altri “punti caldi”, lungo i quali probabilmente è avvenuta la ristrutturazione (ricombinazione) durante un processo secolare di evoluzione degli organismi animali.

Riso. 37. Somiglianza genetica (omologia) dei cromosomi umani e di topo. Le sequenze nucleotidiche dei cromosomi umani contenenti segmenti simili sono contrassegnate con colori e numeri diversi sui cromosomi del topo.

La genomica comparativa ha dimostrato che i geni identici per origine e funzione evolutiva (omologhi) sono spesso collegati agli stessi geni omologhi in specie diverse. Su questa base si prevede la probabile regione di localizzazione dei geni in alcune specie, se si sa a quali geni sono collegati in altre, cioè si effettua una “mappatura comparativa”. Tutto ciò è importante perché le regole dei numeri e la posizione relativa dei geni sul cromosoma non sempre predeterminano le leggi del loro funzionamento. COSÌ, composizione proteica Molte cellule specializzate nei topi, nei ratti e negli esseri umani sembrano simili, sebbene i geni stessi siano sparsi in modo diverso sui cromosomi.

Quindi, la genomica comparativa ci consente di giudicare i meccanismi e i percorsi dell'evoluzione del genoma e persino di ricreare la classificazione dell'intero mondo animale a un nuovo livello. Tutto questo è oggetto di un'altra nuova direzione: la genomica evolutiva. La sua corona dovrebbe essere la creazione di un certo sistema chiaro di organismi viventi, in un certo senso simile alla tavola periodica.

Grazie all'utilizzo di metodi e approcci di genomica comparativa ed evolutiva si sono già ottenuti risultati sensazionali riguardo ad un tema così complesso ed interessante come l'origine dell'uomo e l'evoluzione del suo genoma. Di questo si parlerà più approfonditamente nella parte successiva del libro.

| |
Alcuni fatti rasentano la finzioneParte III. Origine ed evoluzione del genoma umano

Genomica La genomica è una scienza complessa che studia i genomi. Sezioni della genomica: genomica strutturale – contenuto e organizzazione dell'informazione genomica; genomica funzionale: l'implementazione delle informazioni registrate nel genoma dal gene al tratto; genomica comparativa: studi comparativi del contenuto e dell'organizzazione dei genomi di diversi organismi; Tutti questi rami della genomica contribuiscono alla biologia di base (sviluppo individuale, evoluzione), all’assistenza sanitaria, all’agricoltura e alla biotecnologia. Il risultato della genomica strutturale è ottenere una sequenza nucleotidica (sequenza dalla sequenza inglese), che rappresenterebbe completamente ciascuno dei cromosomi dal primo nucleotide all'ultimo. 2

Per ottenere una tale sequenza, oggi è necessario determinare la sequenza nucleotidica in segmenti di DNA abbastanza corti, lunghi circa 1000 posizioni. Ci sono 3 miliardi di posizioni nel genoma umano, il che significa che deve essere spezzato in pezzi che verranno “letti”. Quindi è necessario ripristinare una singola sequenza nucleotidica da un confronto di singoli segmenti di testo letto. Il recupero si basa sul confronto di determinate sequenze e sull'identificazione di sezioni di testo sovrapposte (identiche) in esse. La lunghezza della regione di sovrapposizione deve superare la lunghezza della sequenza che può verificarsi in un dato genoma per ragioni casuali. Ad esempio, nel genoma umano ci sono 3 x 109 bp. una sequenza lunga 15 nucleotidi può verificarsi per caso: poiché ciascuna posizione può contenere uno di quattro nucleotidi, la probabilità che i nucleotidi indicati appaiano in 15 posizioni di seguito è 415 = 230, che è approssimativamente uguale a 109. Cioè, in un segmento con una lunghezza di 109 posizioni, per un dato nucleotide di 15 la sequenza può verificarsi 1 volta per motivi casuali. 3

Ma il fatto è che i nucleotidi nel DNA non sono posizionati in modo casuale e questo è un problema per ricostruire la sequenza da segmenti sovrapposti. Se due sequenze di 1000 nucleotidi si sovrappongono di 20 o cento nucleotidi, ciò non significa nulla, poiché l'intero frammento di 1000 nucleotidi può essere ripetuto più volte nel genoma. Pertanto è stato necessario prima disporre i frammenti lungo il genoma, e solo successivamente individuarne la sovrapposizione in base alla sequenza. Questo è stato il percorso seguito dalla comunità mondiale nel sequenziamento del genoma umano. (il sequenziamento nella letteratura in lingua russa è il processo di determinazione della sequenza dei nucleotidi. Questo termine è anche una carta da lucido dal nome inglese). Come è possibile farlo? Era necessario mettere delle “boe” nel genoma umano, indicando quale regione si trova dietro a quale. La sequenza di tali regioni costituisce la mappa del genoma. La prima di queste mappe era una mappa genetica. È mostrato nella foto a sinistra. 4

Nelle vicinanze c'è un cromosoma colorato con strisce trasversali visibili. La colorazione trasversale è individuale per ciascun cromosoma; ogni striscia ha il proprio numero, che rappresenta l'"indirizzo" di una determinata sezione del cromosoma. Ciascuna di queste regioni contiene milioni di coppie di nucleotidi, la cui sequenza deve essere determinata. Sono stati ottenuti marcatori polimorfici, cioè sono state trovate regioni del cromosoma persone diverse(o su cromosomi diversi della stessa persona) contengono sequenze nucleotidiche non identiche. Si noti che per una mappa genetica con un intervallo di ricombinazione del 10%, sono necessari 300 marcatori equidistanti per distinguere un cromosoma da un altro in un dato locus. 5

La rilevazione dei marcatori del DNA si basa sul metodo di amplificazione (riproduzione) di frammenti di DNA in vitro con precisione nucleotidica utilizzando il metodo della polimerasi reazione a catena(PCR). Utilizzando il metodo PCR è possibile sintetizzare un frammento di DNA in vitro (in una provetta) e ottenerlo come sostanza chimicamente pura. Per la sintesi vengono utilizzati brevi segmenti di DNA sintetico chiamati primer (seme per la sintesi). Dall'estremità 3' del primer, la sintesi di un frammento di DNA inizia lungo il filamento dello stampo, al quale si ricottura (aderisce attraverso l'interazione complementare tra i nucleotidi del primer e dello stampo). In un ciclo di completamento del DNA, sono stati ottenuti 4 filamenti di DNA da 2. Nel ciclo successivo, sono stati ottenuti 8 filamenti da 4, ecc. Ogni ciclo dura diversi minuti. Nel corso di 30 cicli PCR, il frammento bersaglio si moltiplicherà 1 miliardo di volte, consentendo di osservare il frammento (dopo la colorazione). In futuro il tempo richiesto per ciascuna fase della PCR sarà ridotto di 2-3 ordini di grandezza, in modo che ogni ciclo verrà completato in pochi secondi. 6

Per distinguere tra i cromosomi del padre e quelli della madre, sono stati utilizzati i cosiddetti marcatori STR (Short Tandem Repeat), costituiti da collegamenti identici, molto spesso il collegamento consisteva in una coppia di nucleotidi CA. Cioè, hanno trovato punti nel genoma in cui questi collegamenti intervallati si ripetevano. Diciamo che nel cromosoma del padre, in un frammento di 100 coppie di nucleotidi, sono stati inseriti 20 collegamenti, e nello stesso punto sul cromosoma della madre sono stati inseriti 22 collegamenti. Questo frammento di DNA è stato propagato in vitro, con precisione nucleotidica, utilizzando la reazione a catena della polimerasi (PCR). La lunghezza di questi frammenti sarà 100+20 x2=140 per papà e 100+22 x2=144 per mamma. Frazionando i frammenti formati in un gel sotto l'influenza di una corrente costante (elettroforesi), possiamo separare i frammenti in base alla dimensione. Più pesante è il frammento, minore sarà la sua mobilità elettroforetica e più vicino sarà all'inizio. Se i genitori del bambino avevano lunghezze di frammento (come indicato nell'esempio sopra) 140 e 144 bp. , allora anche il bambino avrà queste strisce. 7

L'approccio descritto viene utilizzato non solo nella ricerca fondamentale, ma anche nella pratica dell'identificazione personale durante l'esame medico forense. Diciamo che un dato locus su un cromosoma può trovarsi in uno dei 10 stati alternativi. (Questi stati, alleli, si distinguono per la loro mobilità elettroforetica). Queste condizioni si distinguono per 10 cromosomi o persone con tali cromosomi. Se prendiamo in analisi un altro locus (su un cromosoma diverso) con le stesse caratteristiche, allora da questo locus distingueremo anche 10 cromosomi o persone. E in base alla combinazione degli stati in questi due loci, si distinguono 10 x 10 = 102 cromosomi. Cinque di questi loci distingueranno 105 cromosomi. E poiché ognuno di noi ha una coppia di cromosomi, le combinazioni degli alleli di questi cinque loci danno 105 x 105 = 1010 opzioni. Questo numero di opzioni è maggiore del numero di persone sulla terra. In pratica, l'identificazione utilizza un insieme di alleli di 13 loci, anche se cinque, come vediamo, possono bastare per un'onda. La mappa genetica è stata la prima mappa del genoma umano, sulla quale è stato costruito il successivo lavoro di mappatura. Questa mappa è stata correlata con una mappa fisica che mostra la sequenza dei frammenti di DNA clonati lungo il genoma (vedere Figura 1, a destra). 8

Le mappe fisiche del genoma sono spesso rappresentate da insiemi di frammenti di DNA clonati in molecole vettori ( DNA ricombinante), disposti ordinatamente l'uno rispetto all'altro. Questo insieme di frammenti di DNA continuamente sovrapposti è chiamato contig. Per identificare la sovrapposizione dei frammenti di DNA clonati, era necessaria una mappa dei marcatori genetici precedentemente stabilita. La sovrapposizione è stata stabilita tra “grandi” molecole di DNA contenenti circa 106 paia di basi che sono state clonate nei cromosomi artificiali del lievito (cloni YAC, abbreviazione di Yeast Artificial Chromosome). Artificiali perché hanno rimosso la maggior parte del DNA del lievito e hanno inserito frammenti di DNA umano. Tali costrutti sono in grado di replicarsi nelle cellule di lievito. La dimensione dei cromosomi del lievito è di circa 1-2 milioni di paia di nucleotidi. Come è stata stabilita la sovrapposizione dei frammenti di DNA clonati? Abbiamo il clone YAC n. 1 con un frammento esteso di DNA clonato e, supponiamo, in esso si trovino sia il marcatore A che il marcatore B, per il quale è noto dai dati genetici che sono adiacenti sulla mappa. Nel clone YAC n. 2 non c'è più il marcatore A, ma ci sono i marcatori B e C, ed è anche noto dalla mappa genetica che B e C sono vicini. Il clone n. 3 contiene i marcatori C e D. Il confronto dei dati sulla presenza dei marcatori genetici A, B, C e D nei cloni YAC mostra che si sovrappongono nella sequenza di YAC n. 1, n. 2, n. 3. 9

Gli inserti di DNA di 3000 cloni YAC hanno approssimativamente la stessa lunghezza del genoma umano. Nell'analisi di sovrapposizione della colonna YAC, sono stati prelevati 30.000 cloni in modo che ogni punto del genoma fosse sovrapposto da diversi cloni. Inizialmente non si sapeva come fossero localizzati, ma in media ogni punto del genoma si sovrapponeva 10 volte. Sono stati utilizzati circa 3000 marcatori STR e hanno osservato come questi marcatori e cloni si sovrapponevano tra loro. La PCR è stata utilizzata come metodo per rilevare la presenza di un marcatore genetico nei cloni YAC. Nella fase finale della compilazione di una mappa fisica del genoma umano, è stata rivelata la presenza di circa 30.000 marcatori in questi 30.000 cloni YAC. Questo è un marcatore ogni 100.000 paia di basi. Anche la distanza tra le estremità dei cloni YAC era di 100.000 bp. (con una lunghezza del clone di 1 milione di bp). La mappatura è stata effettuata su macchine robotiche che eseguivano circa 300.000 reazioni PCR al giorno. Consentito di organizzare tutti i cloni YAC in un contiguo. Si presumeva che sarebbero stati sequenziati direttamente. Tuttavia, in seguito è stato utilizzato un diverso schema di sequenziamento dei cloni. I cloni YAC mappati venivano spesso utilizzati per cercare i geni situati nell'inserto YAC, ma questo passaggio non portava al sequenziamento. 10

11

La sovrapposizione può essere vista anche dalla posizione di specifici siti di restrizione. Consideriamo questo metodo in modo più dettagliato. La struttura di un frammento di DNA è determinata dalla posizione dei siti di scissione con enzimi specifici - endonucleasi di restrizione (enzimi di restrizione). Ciascun enzima di restrizione riconosce una sequenza nucleotidica di una certa lunghezza e composizione. Ad esempio, l'enzima di restrizione Eco. RI riconosce GAATTC e nessun altro (scinderà il DNA in media una volta ogni 46=4096 nucleotidi), Bam. HI riconosce GGATTC. Supponiamo di avere un frammento di DNA clonato lungo 13.000 nucleotidi e di digerirlo con l'enzima di restrizione Bam. HI, ottenendo due frammenti di 9 e 4 mila nucleotidi. Quindi se dividiamo Eco. RI, otteniamo frammenti di 8, 3 e 2 kb. Quando guardiamo la doppia suddivisione, otteniamo frammenti con dimensioni di 7, 3, 2, 1 kb. Le dimensioni sono note perché nelle vicinanze c'è una pista in cui le molecole vengono frazionate taglia standard, che consente di creare una curva di calibrazione. Se eseguiamo una seconda suddivisione, vedremo che il frammento da 9 kb si è diviso in frammenti da 7 e 2 kb. Questa sequenza specifica di siti e la distanza specifica tra loro è un ritratto della molecola (vedi figura sotto). Da questi ritratti possiamo abbinare le molecole tra loro, indipendentemente da ciò che codificano o da ciò che è contenuto in esse. Questa è una procedura molto tipica. La scissione di un frammento di DNA con ciascun enzima di restrizione separatamente e con una miscela di essi consente di creare una mappa di restrizione del frammento. 12

13

14

Quindi, abbiamo organizzato le molecole utilizzando la mappatura genetica e fisica. Torniamo al metodo di sequenziamento. È stata utilizzata una miscela di dideossinucleotidi - dd. NTP (nella foto a destra; non hanno un gruppo OH nell'atomo di carbonio 3'), che è stato aggiunto ai normali deossinucleotidi (nella foto a sinistra). E durante la sintesi del DNA in vitro, ciò ha portato alla cessazione della sintesi del filamento nella posizione in cui era inserito dd. NTP. La posizione 3' è dove il nucleotide viene aggiunto alla molecola di DNA in costruzione. Ma se all'estremità 3` non c'è nessun gruppo ossidrile, ma idrogeno, la sintesi non andrà oltre: sarà terminata. Questo viene utilizzato come segue. Abbiamo una matrice (filamento di DNA) che deve essere sequenziata. Se la sintesi è in corso e A è nella prima posizione della matrice (vedere la figura sotto), è possibile incorporare la solita T e la sintesi andrà oltre, oppure è possibile incorporare dd. TTP e sintesi non andranno oltre. La catena si romperà e il nucleo sintetizzato risultante occuperà una certa posizione durante il frazionamento in base alle sue dimensioni. La rottura successiva corrisponderà alla seconda lettera del filamento sequenziato e prenderà la sua posizione anche in base alla lunghezza durante il frazionamento sull'elettroforesi, ecc. E così via per ciascun nucleotide. In questo modo ripristineremo la sequenza nucleotidica nel filamento di DNA da sequenziare. Questo metodo è stato proposto da Fred Sanger, per il quale ha ricevuto il suo secondo premio Nobel. 15

16

17

Consideriamo la determinazione della sequenza nucleotidica in un frammento di DNA clonato. Il frammento clonato è contenuto in una cosiddetta molecola di DNA vettore, una molecola che ne consente l'introduzione in una cellula (di solito una cellula batterica, ma a volte vengono utilizzate anche cellule di lievito). Tutto il lavoro sul sequenziamento del genoma umano è stato effettuato con la partecipazione di molecole vettori batteriche. La regione del vettore adiacente all'inserto contiene una sequenza nucleotidica complementare al primer di sequenziamento universale. Questo primer avvia la sintesi del DNA in vitro, che procederà dal primo nucleotide lungo il modello del frammento di DNA umano clonato. Vengono utilizzati due primer universali, uno per la sequenza vettoriale adiacente ad un'estremità dell'inserto, l'altro primer per la sequenza vettoriale adiacente all'altra estremità dell'inserto. Con uno dei primer si sequenzia il frammento clonato da un lato e con l'altro primer dall'altro. 18

Abbiamo lo stesso vettore e ci sono milioni di inserti, ma sono stati tutti sequenziati dalla stessa coppia di primer. Il grosso del genoma è stato sequenziato clonando frammenti di 2mila paia di basi, perché mille letture da un lato e mille dall'altro. Ogni punto del genoma umano è stato sequenziato diverse decine di volte come parte di diverse molecole di DNA clonate. Cioè, la distanza nel genoma tra le estremità dei frammenti di DNA clonati e sequenziati era inferiore a 200 paia di basi. Sono stati letti circa 1000 nucleotidi da ciascun punto iniziale. Da tutto questo insieme di “testi” è stata riprodotta la struttura del genoma umano. Ma è stato possibile assemblare queste sequenze di 1.000 lettere in sequenze contigue lunghe milioni di lettere solo sulla base del fatto che la maggior parte dei frammenti erano stati precedentemente mappati su cromosomi umani. Senza mappatura, la sequenza potrebbe finire in una regione ripetitiva del genoma, e la continuazione della sequenza da tale regione ha tante varianti di continuazione quante sono le volte in cui la ripetizione è presente nel genoma umano (alcune ripetizioni sono un milioni di volte). Pertanto è stata innanzitutto stabilita la sequenza di localizzazione dei frammenti clonati nel genoma. Ciò è stato fatto per frammenti di circa 200mila paia di basi e solo successivamente sono stati sequenziati. Il processo di sequenziamento di Sanger può essere automatizzato. Il meccanismo è presentato nella diapositiva successiva. 19

20

La diapositiva mostra un primer da cui procede la sintesi a sinistra. Abbiamo dideossinucleotidi fosfati T, A, C e G. Ciascuno di essi occupa la propria posizione nel frammento sintetizzato lungo il filamento modello studiato. Nella diapositiva precedente, ciascuna lettera corrispondeva a una traccia gel separata, ce ne sono quattro in totale. Se ciascuna delle lettere che terminano la sintesi è contrassegnata con il proprio colore, tutti i terminatori possono essere combinati in una provetta e i prodotti possono essere frazionati in una corsia. La conclusione della sintesi nella posizione di una determinata lettera darà un frammento con la sua posizione nel gel dopo il frazionamento. Ciascuna posizione dell'interruzione sarà caratterizzata dal colore della lettera terminatrice in corrispondenza della quale si è verificata l'interruzione. Durante il frazionamento dei frammenti terminati, il laser registrerà i picchi successivi sul rilevatore: quale banda ha attraversato il conteggio e di che colore è. Questa sequenza di picchi viene quindi decifrata in una sequenza di nucleotidi in una molecola di DNA. L'accuratezza della sequenza (stabilire quale lettera ha terminato la sintesi in una data posizione) è determinata dal rapporto tra le altezze dei picchi corrispondenti a diverse lettere nella stessa posizione del frammento sequenziato. Tra due picchi colori differenti in una posizione c'era un valore discriminatorio specificato. La tecnica è stata elaborata in modo tale che una lettera fosse considerata stabilita in modo affidabile per una data posizione se il picco principale in questa posizione era più alto degli altri per un dato numero di volte. 21

22

Il batterio H. influenzae è stato il primo organismo a vita libera ad avere il genoma completamente sequenziato. Poiché il genoma batterico è piccolo, circa un migliaio di nucleotidi, e ci sono poche ripetizioni (e sono brevi), non è stata necessaria una mappatura preliminare dei frammenti di DNA clonati: questi frammenti sono stati immediatamente sequenziati. Questo lavoro è stato svolto presso l'Istituto TIGR di ricerca genetica sotto la guida di Craig Venter. Venter fondò quindi l'azienda di Seler per sequenziare il genoma umano, utilizzando lo stesso schema di sequenziamento utilizzato per i batteri. Inoltre, ha preso soldi da società private, poiché lo Stato non credeva che avrebbe avuto successo. La comunità globale utilizzava in precedenza una mappa genetica e fisica, sulla quale è stata costruita una sequenza di frammenti sovrapposti di DNA clonato (contig) destinati al sequenziamento. Cioè, la sequenza del genoma umano è stata assemblata da frammenti, solitamente attraverso l'uso di un insieme ordinato di cloni e la creazione della sequenza nucleotidica di cloni mappati. 23

24

25

Venter, a differenza della comunità internazionale, ha utilizzato un insieme casuale di cloni e ha cercato di ripristinare la sequenza nucleotidica completa direttamente confrontando le sequenze dell'intero mucchio di frammenti. È riuscito a farlo sui batteri, ma sugli esseri umani ha funzionato solo perché ha utilizzato i dati disponibili al pubblico della comunità globale su quali molecole si trovavano in quale parte del genoma umano. Venter ha pubblicato il suo lavoro un mese prima rispetto alla comunità mondiale, perché non ha mappato nulla, ma ha utilizzato il sequenziamento di molecole ricombinanti molto corte. La lunghezza totale dei frammenti di DNA sequenziati di Venter era cinque volte maggiore di quella dell'intera comunità mondiale. Utilizzando i dati della comunità mondiale sui frammenti mappati, Venter è stato in grado di ricostruire tutto ciò che ha sequenziato in un'unica sequenza nucleotidica. Se non ci fossero dati dalla comunità mondiale, tutto il suo lavoro sarebbe presentato in brevi segmenti che si ramificarebbero a causa del fatto che ci sono ripetizioni nel genoma. Come risultato del lavoro svolto, sono stati pubblicati due articoli: un articolo di Venter sulla rivista Science e un articolo di Lander, leader della comunità mondiale, sulla rivista Nature. 26

Il Progetto Genoma Umano è iniziato nel 1990. La prima versione (bozza) della sequenza nucleotidica è stata completata nel 2000. La versione finale, che non verrà più migliorata (denominata Build 35), è stata completata nel 2004.27

Ultima versione la sequenza contiene 2,85 miliardi di coppie di nucleotidi con 341 lacune, cioè per qualche motivo il DNA genomico non può essere sequenziato in questi punti. La sequenza copre circa il 99% di quella parte del genoma umano che si presenta in forma non compattata: l'eucromatina. La precisione della sequenza nella versione finale è di 1 errore ogni 100mila posizioni consecutive. Nessuno sequenziarà l’intero genoma in modo ancora più accurato. Lascia che ti ricordi che il genoma di tuo padre differisce dal genoma di tua madre di circa 1 posizione su mille. Il numero previsto di geni negli esseri umani è ora di 2.025.000, leggermente inferiore a quanto previsto in precedenza. 28

Oltre ai dati sulla sequenza nucleotidica del DNA genomico umano (sequenza di riferimento), sono stati creati anche database: 1) sulla sequenza nucleotidica delle sezioni di DNA trascritto (database EST, EST = Expressed Sequence Tags), che caratterizza il DNA non genomico, ma ciò che è stato trascritto dal DNA. 2) sulla posizione e sul contenuto delle differenze (polimorfismi, cioè sostituzioni nucleotidiche) di altre sequenze conosciute di DNA umano dalla sequenza di riferimento (database SNP, SNP = Single Nucleotide Polymorphism) 29

La genomica è un'area scientifica emersa di recente, il cui oggetto di studio sono i genomi di tutti gli organismi, non solo gli esseri umani. Uno degli ambiti della genomica è la ricostruzione di una mappa riassuntiva delle vie metaboliche degli esseri viventi, costituita da mappe metaboliche private caratteristiche di ciascun organismo. L'identificazione di alcuni insiemi di geni per funzioni metaboliche in diversi genomi suggerisce una connessione funzionale tra i geni di questo insieme in un'unica sezione della catena metabolica. In particolare uno degli approcci è questo. Si stanno studiando diverse specie (immagine sotto), ad esempio i batteri. Le prime tre specie hanno geni per le proteine ​​1, 3 e 6. Alcune hanno le restanti proteine, altre no. Questo insieme di geni (1, 3 e 6) è assente nella quarta specie. Questo tipo di presenza-assenza di un intero insieme di geni ci consente di supporre che le proteine ​​da essi codificate siano in qualche modo collegate nel ciclo metabolico. I geni di un tale insieme non si trovano necessariamente nelle vicinanze del genoma. trenta

31

Un altro criterio per la connessione funzionale tra geni, che funziona particolarmente bene nei batteri, si basa sulla conservazione della vicinanza degli stessi geni (per sequenza) in diverse specie di batteri. Nei batteri, non è raro che un gruppo di geni situati insieme siano responsabili di un gruppo di fasi metaboliche sequenziali. Un tale gruppo di geni è regolato a livello di trascrizione in modo unificato e viene chiamato operone (unità operativa). Spesso la sequenza dei geni in un operone coincide con la sequenza delle fasi metaboliche. Per gli eucarioti, la posizione adiacente di geni funzionalmente correlati non è tipica, sebbene tali geni siano sparsi in tutto il loro genoma, negli eucarioti è presente anche una regolazione coordinata della trascrizione.

Ad oggi sono stati sequenziati diverse centinaia di genomi batterici e i genomi di diversi eucarioti. Ora sappiamo che nei batteri la dimensione del genoma non è mai inferiore a 0,5 milioni di paia di basi e la dimensione massima del genoma è di circa 10 milioni di bp. , - nel lievito (un organismo eucariotico) - circa 12 milioni, - in un verme nematode - 97 milioni, - e nell'uomo - 3 miliardi di coppie di nucleotidi. - E il numero di geni nei pro ed eucarioti differisce un numero minore di volte. Il numero minimo di geni in un batterio micoplasma è 470, nel lievito – 6000, nel nematode – 19.000 e nell'uomo circa 20.000, cioè non siamo molto diversi dal nematode e dalla mosca nel numero di geni. La quantità di DNA cromosomico per gene è di 1000 bp nei batteri. cioè, i geni sono molto fitti; - nel lievito – 2000 bp. , e in alcuni punti i geni sono separati da uno spazio; - in un nematode – 5000 bp. sul gene e all'interno dei geni compaiono spazi: introni; negli esseri umani – 30.000 bp. - Abbiamo ampi spazi intergenici nel nostro genoma e ampi spazi all'interno dei geni che non diventano RNA maturo. 33

Si noti che tutti questi organismi non differiscono molto nella dimensione delle trascrizioni mature. Nell'RNA maturo, la regione codificante la proteina occupa solitamente la parte principale della sequenza. Alcuni geni codificano per l'RNA, con il quale la proteina non viene affatto sintetizzata. Prima della sequenza codificante la proteina nell'mRNA maturo ci sono regioni di regolazione della traduzione, e dopo la sequenza codificante la proteina ci sono regioni che determinano la stabilità (durata dell'RNA). Nei procarioti, le sequenze prima e dopo la parte codificante le proteine ​​sono molto più brevi che negli eucarioti. Quindi, in termini di dimensione dell'RNA, tutti gli organismi sono più vicini che in termini di dimensione dei geni, e in termini di dimensione delle proteine, sono ancora più vicini. 34

Hanno “spento” sperimentalmente ciascun gene in molti batteri e hanno osservato se sarebbero sopravvissuti in queste condizioni oppure no. Si è scoperto che nei batteri è possibile "spegnere" (uno per uno) circa il 50% dei geni e vivranno ancora. Nel lievito, puoi disattivare l'80% dei geni e loro vivranno ancora. Come è stato dimostrato sperimentalmente? Un frammento di DNA reporter viene inserito nel genoma della cellula, il che rende possibile misurare la velocità di trascrizione e traduzione nel punto di inserimento del frammento. È quindi noto che sia la trascrizione che la traduzione del gene reporter attraverso un dato punto in queste condizioni avvengono dagli elementi regolatori del gene interrotti dall'inserzione del reporter, sebbene il gene interrotto stesso non sia funzionale. Così, l’80% dei geni del lievito furono “uccisi” uno per uno e si videro che la cellula del lievito era ancora viva. 35

Nel nematode, per 20.000 geni, sono state ottenute diverse decine di migliaia di mutazioni, che a quanto pare colpiscono circa 2.000 geni (i cosiddetti gruppi di complementazione). Questo è circa il 10% di tutti i geni dei nematodi. Cioè, se “spegni” circa il 90% dei geni, la cellula continuerà a vivere. Negli esseri umani, su 20.000 geni, solo 1.700 (meno del 10%) presentano mutazioni note associate a malattie ereditate secondo Mendel come tratto monogenico. 36

37

A questo proposito è chiaro che il numero di geni le cui mutazioni porteranno a malattie umane (almeno letali) molto probabilmente non aumenterà in modo significativo rispetto a quanto già noto ad oggi. È ora disponibile su Internet il database OMIM (Online Mendelian Inheritance in Man) per i geni le cui mutazioni portano a malattie e si manifestano come tratti mendeliani. Non tutte le parti del genoma vengono trascritte. A questo proposito, è sorta la questione di determinare sperimentalmente dove e quanti geni si trovano nel genoma. Un singolo gene è una sezione di DNA che corrisponde a una singola trascrizione formata da questa sezione. Quando viene trascritta una sezione di DNA si ottiene la cosiddetta pre-m. RNA, che contiene sia esoni (sezioni che poi si trasformano in m. RNA maturo) che introni (sequenze di inserzione che vengono rimosse dal m. RNA). Gli introni vengono rimossi dal pre-m. RNA attraverso un processo chiamato splicing. Le risultanti aree di pre-m. Gli RNA, chiamati esoni, sono uniti insieme per formare un unico filamento. Si chiama mRNA maturo. (Alcuni RNA non codificano per proteine. Chiamare tali RNA RNA modello, cioè RNA, è terminologicamente errato, sebbene corrispondano a geni e abbiano le proprie funzioni.) 38

L'mRNA maturo viene utilizzato come materiale per ricerca sperimentale la presenza di un gene nel genoma, la sua posizione e la struttura introne-esone. Lo strumento per tale ricerca sono i microchip biologici. Il primo brevetto per microchip appartiene a un team guidato da Andrei Darievich Mirzabekov, che era direttore dell'Istituto di biologia molecolare dell'Accademia russa delle scienze e capo di uno dei dipartimenti del FMBF MIPT. Ha proposto di immobilizzare frammenti di DNA sintetico su matrici solide e di ibridare questa matrice con il campione di acido nucleico oggetto di studio: DNA o RNA. Come indagare se un gene esiste realmente, cioè se una determinata sezione del DNA viene trascritta? Per fare ciò, il gene è rappresentato sul chip come parte della sua sequenza: un oligonucleotide, che è immobilizzato in una micropiastra con determinate coordinate su questa matrice. Questo oligonucleotide corrisponde a una parte di un esone predetto da un computer sulla base della sequenza del DNA genomico. Per scoprire se il genoma in una determinata regione è effettivamente trascritto, viene prelevata una cellula e da essa viene isolato l'RNA totale. Da tutte queste molecole di RNA si ottengono copie di DNA che vengono marcate in modo fluorescente e ibridate con oligonucleotidi immobilizzati sul microchip. Se, in queste condizioni, alcuni siti con oligonucleotidi sono “silenti” (sono mostrati in nero), ciò significa che una sezione della sequenza genomica complementare a questo oligonucleotide non viene trascritta. Se l’area della matrice “si illumina”, significa che gli oligonucleotidi in quest’area si sono ibridati con un prodotto marcato in modo fluorescente, cioè la parte corrispondente del genoma è stata trascritta e fa effettivamente parte di qualche gene.

40

In un esperimento reale, tutte le aree della matrice “brillano” in un modo o nell’altro. Pertanto, senza confronto con alcuni standard, è impossibile dire cosa causi la comparsa di un segnale in una determinata area del chip. Per determinare se il risultato ottenuto è un errore sperimentale o meno, viene effettuato un confronto tra due oggetti. Per fare ciò, vengono prelevate alcune cellule A, da esse si ottiene l'RNA e queste vengono marcate in modo fluorescente (in rosso sul vetrino). Lo stesso viene fatto con le cellule B, ma l'RNA viene etichettato con un colore diverso (verde). Quindi il chip viene ibridato con una miscela di queste due preparazioni di RNA. Se il segnale in una determinata area del chip risulta essere rosso, nelle cellule A la trascrizione di questo gene è più forte che nelle cellule B. Se il segnale è verde, la trascrizione è più forte nelle cellule B. Se c'è una quantità uguale di rosso e verde, quindi il risultato sarà giallo. Pertanto, diventa possibile confrontare il livello di trascrizione di un dato gene in diverse cellule - B, C, D, ecc., Normalizzandolo al livello di trascrizione di questo gene nelle cellule A. Allo stesso tempo, la trascrizione genica è confrontati in tessuti diversi, in cui i geni sono espressi in modo diverso. È possibile confrontare un tumore e uno normale, quindi vengono identificati quei geni che sono specificamente trascritti più fortemente in un tumore o in uno stato normale. Puoi vedere diverse fasi sviluppo, come funzionano i geni nello sviluppo embrionale e nell’età adulta. Pertanto, l'ibridazione sui microarray consente di scoprire quali geni del genoma sono trascritti in determinate condizioni, ed è proprio così che manifesta la sua vita. 41

42

L'ibridazione su microarray consente di verificare una previsione computerizzata secondo cui un dato frammento di genoma è un esone (una regione rimanente nell'mRNA maturo) e viene effettivamente trascritto. Non è necessario che ciascun gene sia espresso in tutti i tessuti e in tutte le condizioni. Pertanto, è necessario esaminare molte condizioni e tessuti per identificare tutte le regioni del genoma corrispondenti agli esoni. Sulla diapositiva, ogni ibridazione su un dato chip corrisponde a un tipo di tessuto o alle condizioni del suo funzionamento. In rosso è indicato il numero di esoni in ciascun cromosoma la cui esistenza è stata confermata sperimentalmente. Ciascun chip contiene 1.090.408 sonde oligonucleotidiche corrispondenti a ciascuno dei 442.785 esoni umani previsti dal computer. Gli oligonucleotidi nei cuscinetti corrispondono sia al filamento di DNA trascritto che al filamento complementare. Nel genoma umano, la trascrizione di filamenti di DNA complementari è caratteristica di una piccola parte dei geni. Tali geni si sovrappongono e sono possibilmente regolati reciprocamente a livello trascrizionale. Nei batteri la sovrapposizione genetica è molto più comune che negli eucarioti. 43

44

I microarray possono essere utilizzati per studiare i cambiamenti nel livello di trascrizione genetica associata all'insorgenza o alla progressione di una malattia (ad esempio, tumorale o infettiva). Si presume che ogni malattia sia caratterizzata dal proprio codice a barre: un cambiamento nel livello di trascrizione di un insieme di geni caratteristici di questa particolare malattia. Questa analisi è molto importante per migliorare la diagnostica funzionale in medicina. 45

Abbiamo effettuato un esperimento del genere. Campioni di RNA sono stati prelevati da tumori in due gruppi di pazienti. C'erano metastasi in un gruppo e non nell'altro. Le metastasi sono la comparsa di nuovi focolai tumorali nel corpo, separati spazialmente dai focolai originali. Su questo chip c'è un confine piuttosto netto tra i gruppi di aree verdi e rosse. Cioè, i geni sono visibili, i cui cambiamenti nel livello di espressione sono caratteristici dello stadio delle metastasi del tumore, che possono essere utilizzati per diagnosticare questo stadio. Finora questo metodo diagnostico non è stato sviluppato. Si presume che in futuro, mediante i cambiamenti del codice a barre nell'espressione di un determinato insieme di geni, sarà possibile diagnosticare malattie specifiche e fasi del loro sviluppo, e quindi sapere come trattarle. 46

47

Facciamo una piccola digressione. Sono state costruite mappe genetiche per molte specie. Nelle specie con mappe genetiche dettagliate, una ricerca sperimentale per le mutazioni associate registrate cambiamenti morfologici. La diapositiva mostra un diagramma di tale lavoro sui pesci. Innanzitutto, viene eseguita la mutagenesi. Successivamente si ottengono gli ibridi di prima generazione. Sono utilizzati per il reincrocio con genitori mutagenizzati. Se si scopre che viene rilevato un determinato tratto, esaminano con quali marcatori genetici è coereditato. In questo modo si esamina quali geni sono danneggiati dalle mutazioni rilevate fenotipicamente. 48

Riassumendo quanto sopra, i geni (mutazioni) che determinano la morfologia o segni biochimici, possono essere identificati dopo la mutagenesi dell'intero genoma (ad esempio EMS) e screening genetico. Per fare ciò, viene effettuata un'analisi della coereditarietà dell'allele studiato con marcatori di DNA polimorfico, coprendo l'intero genoma in una sequenza nota, e la distanza tra i quali è sufficientemente piccola da classificare l'allele studiato come uno degli intervalli della mappa genetica. 49

Questa diapositiva mostra che esistono batteri che possono avere più geni rispetto, ad esempio, al lievito. Siamo abituati a pensare che i batteri siano più semplici, ma non è sempre così. Esistono batteri che hanno circa 10mila geni. 50

51

Questa diapositiva evidenzia che, sebbene il numero di geni vari tra le specie, il numero dei cosiddetti domini proteici ( unità strutturali in una proteina, responsabile di un'unica funzione) differiscono all'interno dei diversi regni della vita (procarioti ed eucarioti) fino a una volta e mezza, non di più. Naturalmente, le combinazioni di questi domini sono diverse, ma i domini stessi sono simili, cioè sono codificati da regioni del genoma che sono simili nella sequenza nucleotidica, e queste regioni simili hanno un'origine comune nell'evoluzione. L’affermazione inversa sarebbe errata. Solo perché le funzioni delle proteine ​​sono simili non significa che la loro struttura sarà la stessa. La stessa funzione, ad esempio lo stesso processo catalitico, può essere svolta da proteine ​​diverse che non sono correlate in origine. Lo stesso processo può essere catalizzato anche dalla proteina 52 e dall'RNA (ribozima), che nell'origine non hanno nulla in comune.

Questa diapositiva mostra i valori medi delle caratteristiche di vari elementi dei geni umani. La dimensione media esone - 145 nucleotidi, introne - 3365, ecc. In totale, risulta che la parte codificante della proteina del gene è piccola rispetto alla parte non codificante della proteina, quindi, quando si verificano mutazioni, c'è un'alta probabilità che la parte proteica non codificante muterà. Tali mutazioni non influenzeranno affatto la struttura della proteina, o porteranno a cambiamenti nella sua quantità, ma non nella struttura (cambiamenti nei siti regolatori dell'inizio della trascrizione o nella stabilità dell'RNA), o porteranno a cambiamenti drammatici nella struttura dell'RNA (mutazioni negli obiettivi di splicing). 53

Distribuzione dei geni umani per dimensione Dimensione, migliaia di paia di basi 500% del numero totale 23, 3 35, 6 20, 2 13, 0 6, 7 1, 2 54

La struttura generale del genoma è la seguente (la dimensione del genoma umano è di 3200 Mb), i geni occupano solo 1200 Mb. La maggior parte di questo spazio è costituita da pseudogeni (geni non funzionali inattivati ​​da mutazioni), vari frammenti di geni e introni. Gli esoni dei geni funzionali (lunghezza totale degli RNA maturi) rappresentano 48 Mb. C'è una certa astuzia qui, poiché per un pre-m. In media ci sono 1,4 RNA maturi. E da un mRNA maturo, in alcuni casi, si possono ottenere fino a mille proteine. Il DNA intergenico occupa 2000 Mb; è rappresentato principalmente da brevi sequenze ripetute sparse in tutto il genoma, che occupano 1400 Mb. Una di queste ripetizioni è la ripetizione Alu, lunga circa 300 bp. , ripetuto nel genoma un milione di volte. Un altro tipo notevole di ripetizioni sparse sono le ripetizioni terminali lunghe (LTR). Questi elementi sono la prova molecolare di un frammento di DNA che salta all'interno del genoma. La lunghezza totale di tali sezioni su una molecola di DNA è di 250 Mb. 55

Il numero di geni nell'uomo è stimato in 20-25mila (stima del 2001 - 35-40mila). 56

La parte principale del genoma umano non è occupata dai geni: il 63-74% della lunghezza è costituito da spazi intergenici, la metà sono ripetizioni. Il gene umano è internamente “vuoto”: il 95% del DNA intragenico è tagliato (introni). La lunghezza totale delle regioni codificanti le proteine ​​è circa l'1% del DNA genomico umano. Questa è solo 3 volte la lunghezza del genoma batterico. 57

Nota: i computer hanno previsto tra 26.383 e 39.114 geni umani (nel 2001), ma solo meno di 7.000 sono stati confermati negli esseri umani. E per oltre l'80% dei geni la struttura è stata almeno leggermente modificata nel periodo dal 2001 al 2003 e continua ad essere perfezionata sui microchip. Ora il numero previsto di geni nell'uomo è di 20-25 mila e l'esistenza di circa 19.000 di essi è stata confermata sperimentalmente: da essi si formano le trascrizioni. La definizione di gene attualmente disponibile (un gene è un frammento di DNA genomico con sottoframmenti cotrascritti) non è completa. Ad esempio, è possibile la trascrizione da due catene. I geni corti e i geni non codificanti per le proteine ​​sono scarsamente identificati. Ce ne sono almeno un migliaio, ma non si conosce il numero esatto. Tali geni sono anche geni, sebbene non codifichino proteine. Sono geni perché producono RNA. Inoltre, l'RNA di alcuni geni non codificanti proteine ​​è costituito da diversi esoni. Cioè, la cellula ha bisogno di questi RNA per qualche motivo, ma non capiamo ancora il perché. 58

59

Supponiamo che sia stata formata una trascrizione matura dell'mRNA e che possa contenere gli esoni 1, 2, 3. Ciò non significa che li conterrà necessariamente tutti. Potremmo avere RNA che contiene gli esoni 1 e 2 o gli esoni 1 e 3 e, di conseguenza, da essi si formeranno proteine ​​diverse. Questo metodo di elaborazione delle informazioni genetiche è chiamato alternativo: una persona ha il gene slo. “Funziona” nell'orecchio interno, in particolare questa proteina è presente nei villi, che hanno il compito di riconoscere l'altezza del suono. È composto da 35 esoni (rettangoli nella figura), 8 dei quali (blu) possono essere presenti o assenti nell'mRNA maturo. 8 possibili! = 40.320 varianti di giunzione, ma ne sono state rilevate solo circa 500. Potrebbero non essercene altri, cioè la natura non dovrebbe, in generale, realizzare tutto possibili opzioni. 61

62

Il ruolo biologico dello splicing multiplo è il seguente. Tipi diversi Le cellule ciliate dell'orecchio interno rispondono a suoni di frequenze diverse da 20 a 20.000 hertz. Le differenze cellulari nella percezione della frequenza sono determinate in parte dalle proprietà delle forme di giunzione alternativa della proteina Slo. Non è noto come venga determinata la scelta tra le varianti di giunzione. Ci sono casi in cui migliaia di proteine ​​diverse si formano da un locus. Tra queste rientrano in particolare le proteine ​​che si formano sulla superficie cellule nervose. Sembrano quindi essere in qualche modo coinvolti nel riconoscimento degli amici e nella formazione delle reti neurali. In questo caso, non solo vengono espulsi gli esoni o gli introni, ma può anche essere realizzato un sito alternativo di inizio della trascrizione. Tali casi sono noti, in particolare per gli esseri umani, quando geni diversi hanno diversi promotori diversi, ciascuno dei quali produce il proprio RNA, nel quale, a seconda di dove ha avuto inizio, ci sarà un esone aggiuntivo associato a una diversa lunghezza della trascrizione a 5'-fine. 63

64

Meccanismo di splicing Il processo di connessione di un esone a un altro avviene in sezioni una certa sequenza nucleotidi. Il sito donatore di giunzione termina sempre con uno dei due dinucleotidi, solitamente AG. Innanzitutto, si verifica un attacco nucleofilo dell'esone donatore, quindi si verifica un taglio, un pezzo di GU viene avvolto e attaccato ad A. Quindi la seconda parte viene tagliata, il primo esone è collegato al secondo e si forma un introne. 65

66

Se si osserva la proporzione di un gene composto da esoni, la più grande trascrizione conosciuta (del gene della miodistrofina) è lunga circa 2,5 milioni di nucleotidi. In esso, 14mila nucleotidi (0,6%) passano nella parte matura dell'RNA e il restante 99,4% della trascrizione primaria viene espulso (introni). Quando la dimensione di un gene su un cromosoma aumenta, la sua parte codificante la proteina aumenta leggermente e il numero di introni nel gene aumenta. All’aumentare del numero di introni aumenta il numero dei siti di giunzione e la probabilità del loro danno. Pertanto, per i geni con un gran numero di introni, la perdita di funzione durante la mutazione può essere associata non alla parte del DNA che codifica per le proteine, ma ad elementi regolatori dello splicing. Il sequenziamento del genoma umano ha dimostrato che alcuni esoni si ripetono più volte nel genoma. Può trattarsi di ripetizioni di esoni all'interno di un gene o della presenza dello stesso esone all'interno di diversi geni diversi. Si scopre che gli esoni, gli elementi principali della struttura dell'RNA, cioè gli elementi che codificano le proteine, durante il processo di evoluzione possono in qualche modo moltiplicarsi nel genoma e “mescolarsi” tra diversi geni. Questo fenomeno è chiamato mescolamento degli esoni - mescolamento degli esoni. Di seguito sono riportate diverse proteine ​​che contengono gli stessi esoni. Pertanto, si scopre che l'evoluzione spesso consiste proprio nel bloccare i cambiamenti nel genoma e non nei cambiamenti puntuali. 67

68

69

Nel 2001, più del 40% dei geni umani non avevano una funzione nota. Per il resto il layout era abbastanza convenzionale. L'appartenenza ad una classe funzionale di una proteina non esclude la sua appartenenza ad un'altra classe. Ad esempio, il fatto che una proteina si leghi al DNA non significa che non possa essere anche un enzima, ecc. Questa è una caratteristica che è stata data a un gene per quella parte di esso associata alla funzione caratterizzata, ma, in generale, tale proteina A può avere più di una funzione. La maggior parte dei geni sono responsabili dell'espressione, della replicazione e del mantenimento delle funzioni del genoma; circa il 20% serve per trasmettere segnali tra cellule, circa il 17% per garantire che la cellula stessa sia sana e per altri le funzioni non sono classificate. Si scopre che gli esseri umani, rispetto ai lieviti, ai batteri, ecc., hanno più geni regolatori della trascrizione nel loro genoma. Cioè, i regolatori trascrizionali si sono moltiplicati notevolmente nella linea evolutiva dei mammiferi, in particolare dell'uomo. Si presume che la diversità dei regolatori della trascrizione fornisca una maggiore sottigliezza nella risposta del genoma ai segnali. ambiente esterno. Cioè, i mammiferi hanno un numero maggiore di insiemi di geni trascritti in modo coordinato rispetto ad altri gruppi. 71

72

73

Di seguito è riportato l'aspetto di un pezzo del genoma umano (≈50.000 bp). Circa la metà della lunghezza di questo frammento di DNA è occupata da elementi di cui si conoscono la struttura e la funzione. Tra questi elementi ci sono i geni (esoni e introni) e gli pseudogeni: ci sono i geni funzionali e ci sono le loro copie non funzionali. Di solito non contengono introni (si ritiene che dopo la trascrizione e la trasformazione dell'RNA maturo, sia possibile il processo di reinserimento nel genoma sotto forma di una copia del DNA; quindi sarà un gene contenente una "coda" extra e non contenente introni). Oltre alle ripetizioni disperse brevi (SINE) e lunghe (LINE), ripetizioni terminali lunghe (LTR) - tracce lasciate dopo la trasposizione, trasposoni, microsatelliti. 74

75

Nel 2001, nel genoma umano sono stati identificati 1.112 “geni della malattia” (cioè quelli in cui le mutazioni portano alla malattia), e ci sono anche 94 geni “composti” formati durante i riarrangiamenti del genoma del tumore. Finora il meccanismo è stato scoperto soprattutto per quelle malattie che colpiscono la parte del gene che codifica per le proteine. È possibile che non vengano trovate meno mutazioni che causano malattie nelle aree che regolano la trascrizione, lo splicing e la stabilità dell'RNA. 76

77

Secondo le stime del marzo 2005, gli esseri umani hanno 24.000 geni codificanti proteine, di cui 1.700 geni sono associati a malattie. In questi 1.700 geni sono state trovate 44.500 mutazioni correlate alla malattia (in media 26 per gene). Ma per le restanti 10.000 mutazioni conosciute tale connessione non è stata identificata. Il 20% dei decessi negli Stati Uniti è dovuto al fatto che il medicinale è stato assunto nel modo sbagliato o in modo sbagliato. Ma ciò non è dovuto all’incompetenza dei medici, ma al fatto che siamo tutti geneticamente diversi. Le malattie hanno molti bersagli e se colpisci il bersaglio sbagliato, la medicina sicuramente non sarà utile e quindi potrebbe essere dannosa. Una persona potrebbe avere reazione specifica SU questa medicina(tasso metabolico troppo basso o troppo alto). E nel nostro Paese la principale causa di morte tra gli adulti è l'ubriachezza. Questa causa profonda è semplicemente nascosta dietro la definizione di “infortunio” (industriale, domestico, stradale, ecc.), che viene indicato come causa di morte. È stata rilevata una correlazione tra il consumo di alcol nel nostro Paese e l'aspettativa di vita: quando il consumo di alcol diminuisce, l'aspettativa di vita aumenta e viceversa. 78

Se due proteine ​​sono caratterizzate da una sequenza amminoacidica simile (al di sopra di una lunghezza critica fino alla quale le corrispondenze possono essere residui puramente casuali), allora hanno una sequenza ancestrale comune e un gene ancestrale corrispondente. Il numero di tali strutture ancestrali nelle proteine ​​è molto limitato. Ad esempio, nel genoma c'era un gene e poi ce n'erano due (duplicazione). Nel corso del tempo, le mutazioni hanno cambiato questi geni, ciascuno a modo suo. E poi questa specie ha dato origine a due nuove specie (vedi figura sotto). Tutti questi geni sono “parenti” (omologhi), ma hanno nomi diversi. I geni omologhi che consideriamo all'interno di specie diverse sono chiamati ortologhi, mentre i geni omologhi nello stesso genoma sono chiamati paraloghi. 79

80

I confronti di tali geni correlati sono spesso utilizzati negli studi evoluzionistici. La genomica evolutiva (genomica comparativa) è utilizzata molto intensamente in medicina. Un esempio applicazione pratica. La gente ha ragioni varie c'è l'obesità. In particolare, ci sono forme familiari che sono mendeliane. Negli esseri umani, le mutazioni che causano questa malattia non sono state mappate. Un fenotipo di obesità simile è stato osservato nei topi. Nei topi, questo è stato mappato geneticamente (in realtà, non è il gene ad essere mappato, ma l'effettiva mutazione nel gene). Abbiamo sequenziato l'area intorno a questa mutazione, poi abbiamo trovato la stessa sequenza nucleotidica nel genoma umano. È diventato chiaro dove dovremmo cercare le mutazioni nel genoma umano, causando obesità negli umani. Testare questa regione del genoma umano in persone malate e confrontarla con la stessa sequenza nucleotidica in persone sane ha confermato che le mutazioni di questo gene negli esseri umani, come nei topi, portano all'obesità.

Dati sul numero di geni coinvolti nello sviluppo e nel funzionamento di alcuni organi e tessuti umani 82

83

86

Il genoma dell'anemone di mare si è rivelato complesso quasi quanto quello di un essere umano e la sua lettura ha dimostrato che le innovazioni genetiche più importanti nell'evoluzione degli animali multicellulari sono avvenute nelle sue fasi più precoci. L'ultimo antenato comune degli anemoni di mare, dell'uomo e delle mosche sarebbe vissuto circa 700 milioni di anni fa e possedeva già un genoma molto complesso. Il “programma” genetico di base che ha guidato lo sviluppo dei primi animali si è rivelato così efficace e flessibile che la successiva evoluzione progressiva degli animali è stata assicurata principalmente da cambiamenti nelle sue “ambientazioni” e non nella “architettura”. Il genoma umano si è rivelato generalmente molto più simile al genoma dell'anemone di mare (nella foto - l'anemone di mare Nematostella) rispetto al genoma di mosche e vermi. Foto dal sito web del genoma. jgipsf. org 87

88

89

Il genoma è la composizione completa del DNA di una cellula. La genomica è una branca della genetica giovane e in rapido sviluppo che studia i principi della costruzione dei genomi e la loro organizzazione strutturale e funzionale. La genomica strutturale studia le sequenze nucleotidiche del DNA, inclusa la struttura e la localizzazione dei geni. Uno dei compiti della genomica strutturale è la costruzione di mappe genetiche degli organismi. La genomica funzionale risolve il problema dell'identificazione delle funzioni singole aree genoma e meccanismi delle loro interazioni nell'insieme cellulare. Le idee moderne sul genoma umano si basano su diverse scoperte della biologia molecolare negli anni '70 del XX secolo, le principali delle quali sono la scoperta della reazione a catena della polimerasi (PCR), che consente di ottenere una quantità sufficiente di DNA per l'analisi e lo sviluppo di metodi di sequenziamento che consentono di decifrare l'esatta sequenza di nucleotidi nei filamenti di DNA. 90

Alla fine degli anni '80 del XX secolo, l'attuazione dell'art progetto internazionale"Genoma Umano", il cui obiettivo principale era sequenziare il genoma umano. Il sequenziamento completo del genoma umano è stato completato nel 2000. Il sequenziamento del genoma umano ha portato alla scoperta di un numero enorme di polimorfismi a singolo nucleotide (SNP): varianti genetiche di sequenze nucleotidiche della stessa regione del DNA in persone diverse. Gli SNP distribuiti in tutto il genoma vengono utilizzati come marcatori genetici. Secondo i calcoli dei genetisti, le persone sono identiche al 99,9% nelle sequenze nucleotidiche. Pertanto, la variazione genetica tra le persone deriva da differenze solo nello 0,1% del genoma. I dati di sequenziamento hanno dimostrato che nel genoma umano sono presenti poco più di 30.000* geni. La maggior parte dei geni ha una dimensione massima di 50.000 paia di basi. Il numero di prodotti proteici sintetizzati supera il numero di geni di 1,5-2 volte. Questo è il risultato dello splicing alternativo. 91

Alla fine degli anni '80 iniziò il progetto internazionale sul genoma umano, il cui compito principale era sequenziare il genoma umano. Il sequenziamento completo del genoma umano è stato completato nel 2000. 92

L'obiettivo di questo progetto era determinare la sequenza delle basi in tutte le molecole di DNA nelle cellule umane. Allo stesso tempo, deve essere stabilita la localizzazione di tutti i geni, il che aiuterebbe a chiarire la causa di molti malattie ereditarie e quindi aprire la strada al loro trattamento. Per affrontare in modo coerente la soluzione al problema della mappatura dei geni umani, sono stati formulati cinque obiettivi principali: 1) Completare la compilazione di una mappa genetica dettagliata in cui i geni che sono separati l'uno dall'altro a una distanza non superiore a una media di 2 milioni verrebbero contrassegnate le basi (1 milione) (le basi sono solitamente chiamate megabasi); 2) creare mappe fisiche di ciascun cromosoma (risoluzione 0,1 MB); 3) ottenere una mappa dell'intero genoma sotto forma di cloni caratterizzati (5mila basi per clone o 5 Kb); 4) completare il sequenziamento completo del DNA (risoluzione a base singola) entro il 2004; 5) mettere tutti i geni umani su una mappa di sequenza completamente completata (entro il 2005). 94

Ci si aspettava che quando tutto obiettivi dichiarati sarà compreso, i ricercatori determineranno tutte le funzioni dei geni e svilupperanno metodi per l'applicazione biologica e medica dei dati ottenuti. Considerando il ritmo di accelerazione del lavoro nel quadro del Progetto Genoma Umano, i leader di questo progetto hanno annunciato il 23 ottobre 1998 che il programma sarebbe stato completamente completato molto prima del previsto e hanno formulato “Nuovi obiettivi del Genoma Umano Progetto: 1) completamento completo nel dicembre 1998 dei lavori di sequenziamento del genoma del “nematode” C. elegans (fatto nei tempi previsti); 2) analisi preliminare completa della sequenza del DNA umano entro il 2001, e della sequenza completa entro il 2003; 3) mappare il genoma del moscerino della frutta entro il 2002; 4) iniziare a sequenziare il genoma del topo utilizzando tecniche di DNA cromosomico artificiale di lievito (completare questo progetto entro il 2005). Oltre a questi obiettivi, ufficialmente inclusi nel progetto sostenuto dal governo americano e da diversi altri governi, diversi centri di ricerca hanno annunciato compiti che saranno svolti principalmente attraverso fondazioni e donatori privati. Così, gli scienziati dell'Università della California (Berkeley), dell'Università dell'Oregon e del Centro di ricerca sul cancro Freud Hutchinson hanno avviato il programma Dog Genome. L'International Sequencing Society ha deciso nel febbraio 1996 che qualsiasi sequenza nucleotidica di dimensioni pari a 1-2 kb deve essere resa pubblica (via Internet) entro 24 ore dalla sua determinazione. 95

COSA VERRÀ FATTO DOPO AVER COMPLETATO L’ANALISI DEL GENOMA UMANO? Il principale compito strategico del futuro è formulato come segue: studiare le variazioni di singolo nucleotide del DNA in diversi organi e cellule di singoli individui e identificare le differenze tra individui. L'analisi di tali variazioni consentirà non solo di avvicinarsi alla creazione di ritratti genetici individuali delle persone, che, in particolare, consentiranno di curare le malattie, ma anche di determinare le differenze tra le popolazioni. E anche per identificare le aree geografiche a maggior rischio, che aiuteranno a dare raccomandazioni chiare sulla necessità di ripulire l'area dalla contaminazione e identificare gli impianti di produzione dove c'è un alto rischio di danni al genoma del personale. Questo enorme compito suscita non solo rosee aspettative per il bene comune, ma anche un’ansia del tutto consapevole tra gli avvocati e i combattenti per i diritti umani individuali. Così, in particolare, si oppone alla diffusione di dati personali senza la decisione dei soggetti interessati. Un esempio aiuta a comprendere queste preoccupazioni: le compagnie di assicurazione stanno già puntando a ottenere tali informazioni con le buone o con le cattive e intendono utilizzare i dati contro i loro assicurati. Ad esempio, se un richiedente di un'assicurazione è portatore di un gene potenzialmente patogeno, le aziende non vogliono affatto assicurare queste persone o cercano di addebitare importi esorbitanti per la loro assicurazione. Basato su questo, . Il Congresso degli Stati Uniti ha già approvato una serie di leggi volte a vietare severamente la diffusione di informazioni genetiche riguardanti singole persone; gli avvocati di tutto il mondo 96 stanno lavorando intensamente in questa direzione.

Aree di applicazione pratica Ingegneria genetica Creazione di piante transgeniche Solo 10 anni fa lo sviluppo della biotecnologia vegetale era notevolmente indietro, ma negli ultimi 3 anni si è assistito a una rapida immissione sul mercato di piante transgeniche con nuove caratteristiche utili. Le piante transgeniche negli Stati Uniti coprivano 3 milioni di acri nel 1996, aumentate a 15 milioni di acri nel 1997, a 60 milioni di acri nel 1998 e a 80 milioni di acri lo scorso anno. Poiché le principali forme transgeniche di mais, soia e cotone resistenti agli erbicidi e agli insetti si sono dimostrate efficaci, ci sono tutte le ragioni per aspettarsi che l'area coltivata a piante geneticamente modificate nel 2001 aumenterà di 4-5 volte. Nell'aprile 1998, la percentuale di forme transgeniche di piante in agricoltura era: mais - 6, soia - 12, cotone - 15, pomodori -

Un altro problema è sorto con le cure mediche. Nonostante l'enorme risultato medicina moderna prodotto oggi farmaci così costoso che oggi ¾ della popolazione mondiale fa affidamento interamente sui tradizionali trattamenti prescientifici, principalmente farmaci non raffinati origine vegetale. Nei paesi sviluppati medicinali Il 25% è costituito da sostanze naturali, isolato dalle piante. Le scoperte degli ultimi anni (farmaci antitumorali: tassolo, podofillotossina) indicano che le piante rimarranno per lungo tempo una fonte di sostanze biologicamente attive (BTA) utili e che la capacità di una cellula vegetale di sintetizzare il complesso BTA supera ancora significativamente le capacità di sintesi di un ingegnere chimico. Ecco perché gli scienziati hanno affrontato il problema della creazione di piante transgeniche. La storia dell'ingegneria genetica vegetale risale al 1982, quando furono ottenute per la prima volta piante geneticamente trasformate. Il metodo di trasformazione si basa sulla capacità naturale del batterio Agrobacterium tumefaciens di modificare geneticamente le piante. I ceppi di Agrobactrium ricostruiti contenenti varianti non oncogene dei plasmidi Ti e con maggiore virulenza sono diventati la base di uno dei metodi di trasformazione più popolari. 98

Inizialmente, la trasformazione veniva utilizzata per piante dicotiledoni geneticamente modificate, ma lavori recenti mostrano che questo metodo è efficace anche per mais, riso e grano. Un altro metodo di trasformazione molto diffuso è una tecnologia basata sul bombardamento dei tessuti con microparticelle d'oro (o altri metalli pesanti) rivestite con una soluzione di DNA. Tutte le varietà commerciali attualmente coltivate sono ottenute utilizzando i due metodi sopra indicati. Il moderno arsenale di metodi di trasformazione, tuttavia, è piuttosto ampio e comprende approcci come l'introduzione del DNA in cellule nude (protoplasti), l'elettroporazione delle cellule, la microiniezione del DNA nelle cellule, la perforazione delle cellule mediante scuotimento in sospensioni di microaghi, infezioni mediate da virus, e così via. Le piante geneticamente modificate resistenti a varie classi di erbicidi rappresentano attualmente il prodotto biotecnologico di maggior successo. Il fatto è che la biotecnologia ha reso possibile questo salto, poiché è diventato possibile modificare geneticamente la resistenza delle piante a determinati erbicidi, sia introducendo geni che codificano per proteine ​​insensibili a una determinata classe di erbicidi, sia introducendo geni che codificano per proteine ​​insensibili a una determinata classe di erbicidi. introducendo geni che assicurano il metabolismo accelerato degli erbicidi vegetali. 99

Finora sono stati clonati geni che codificano per enzimi bersaglio insensibili all'azione degli erbicidi, il che ha permesso di ottenere piante transgeniche resistenti agli erbicidi come il glifostato e gli erbicidi clorsulfuron e imidazolinone. Sono stati isolati anche i geni che codificano per gli enzimi atti alla degradazione di alcuni erbicidi, il che ha permesso di ottenere piante transgeniche resistenti alla fosfinotricina e al dalapon. Nel 1997, i semi di soia resistenti al Roundup distribuiti da As Grow sono stati nominati Prodotto agricolo statunitense dell'anno. Gli scienziati sono andati oltre. Poiché molte piante sono suscettibili all'attacco e al consumo da parte degli insetti, gli scienziati di ingegneria genetica hanno condotto un esperimento con il noto batterio Bacillus-Thiringiensis, che produce una proteina che si è rivelata molto tossica per molti tipi di insetti, ma allo stesso tempo sicuro per i mammiferi. , la proteina (delta-endotassina, proteina CRY) è prodotta da vari ceppi di Bacillus-Thiringiensis. Questa è una prototassina che viene scomposta nell'intestino degli insetti, formando una tossina attivata. La proteina attivata si lega specificamente ai recettori dell'intestino medio degli insetti, il che porta alla formazione di pori e alla lisi delle cellule epiteliali intestinali. 100

L'interazione delle tossine con i recettori è strettamente specifica, il che complica la selezione di una combinazione tossina-insetto. Trovato in natura un gran numero di ceppi di Bacillus-Thiringiensis, le cui tossine colpiscono solo alcuni tipi di insetti. I preparati di Bacillus-Thiringiensis sono stati utilizzati per decenni per controllare gli insetti nei campi. Inserendo il gene di questa proteina nel genoma vegetale è possibile ottenere piante transgeniche che non vengono mangiate dagli insetti. Ma questo metodo richiedeva ottimo lavoro dal lato dell'ingegneria genetica, in termini di selezione dei ceppi necessari e creazione di strutture geneticamente modificate che danno effetto maggiore per classi specifiche di insetti. Oltre all’effetto specie-specifico sugli insetti, l’integrazione dei geni procariotici della tossina delta nel genoma vegetale, anche sotto il controllo di forti promotori eucariotici, non ha portato a alto livello espressione. Presumibilmente, questo fenomeno è dovuto al fatto che questi geni batterici contengono significativamente più basi nucleotidiche di adenina e timina rispetto al DNA vegetale. Questo problema è stato risolto creando geni modificati, in cui uno dei geni naturali è stato eliminato e sono stati aggiunti alcuni frammenti, preservando i domini che codificano le parti attive delle tossine delta. Ad esempio, utilizzando tali approcci, sono state ottenute patate resistenti allo scarabeo della patata del Colorado. Attualmente, le cosiddette piante di cotone e mais Bt occupano la maggior parte del volume totale delle piante geneticamente modificate di queste colture coltivate nei campi statunitensi. 101

Prospettive Si prevede che la conoscenza dettagliata del genoma umano aprirà nuove strade ai progressi della medicina e della biotecnologia. Diverse aziende, come Myriad Genetics, hanno iniziato a offrire metodi semplici per eseguire test genetici in grado di rivelare la predisposizione a una varietà di malattie, tra cui il cancro al seno, i disturbi emorragici, la fibrosi cistica, le malattie del fegato e altro ancora. Si prevede inoltre che le informazioni sul genoma umano contribuiranno alla ricerca delle cause del cancro, del morbo di Alzheimer e di altre aree di rilevanza clinica e potrebbero probabilmente portare a progressi significativi nel loro trattamento in futuro. Inoltre, ad esempio, un ricercatore che studia una particolare forma di cancro potrebbe restringere la sua ricerca a un singolo gene. Visitando il database del genoma umano online, questo ricercatore può verificare ciò che altri scienziati hanno scritto su questo gene, inclusa la (potenzialmente) struttura a tre membri della sua proteina derivata, la sua funzione, la sua relazione evolutiva con altri geni umani o con geni nei topi o lievito o Drosophila, possibili mutazioni dannose, relazioni con altri geni, tessuti corporei in cui il gene è attivato, malattie associate a questo gene o altri dati. Inoltre, una profonda comprensione del processo patologico a livello di biologia molecolare può offrire nuovi trattamenti terapeutici. Considerato l’enorme ruolo accertato del DNA nella biologia molecolare e il suo ruolo centrale nel determinare i principi fondamentali di funzionamento processi cellulariÈ probabile che una maggiore conoscenza in questo settore contribuirà ai progressi della medicina varie aree significato clinico che senza di essi non sarebbe stato possibile. 102

L'analisi delle somiglianze nelle sequenze del DNA di diversi organismi apre anche nuove strade nello studio della teoria dell'evoluzione. In molti casi, le questioni relative all’evoluzione possono ora essere poste in termini di biologia molecolare. Infatti, molte delle tappe più importanti nella storia dell’evoluzione (la comparsa del ribosoma e degli organelli, lo sviluppo dell’embrione, sistema immunitario vertebrati) possono essere rintracciati a livello molecolare. Si prevede che questo progetto farà luce su molte domande sulle somiglianze e sulle differenze tra gli esseri umani e i nostri parenti più stretti (i primati e di fatto tutti i mammiferi). Si diceva che il progetto Human Genome Diversity Project (HGDP), uno studio separato volto a mappare le regioni del DNA che differiscono tra i gruppi etnici, fosse stato sospeso ma in realtà è in corso e sta attualmente accumulando nuovi risultati. In futuro, l’HGDP sarà probabilmente in grado di generare nuovi dati nei campi del controllo delle malattie, dello sviluppo umano e dell’antropologia. L’HGDP può rivelare i segreti dietro la vulnerabilità dei gruppi etnici a malattie specifiche e suggerire nuove strategie per superarle. Può anche mostrare come le popolazioni umane si sono adattate a queste malattie. 103

Gli scienziati sono riusciti a “leggere” la sequenza nucleotidica. Ma ci vorranno ancora molti anni per decifrare l'apparato ereditario umano: circa la metà dei geni dell'Homo Sapiens rimane ancora da scoprire. Il sequenziamento genico è il primo passo nella comprensione del genoma umano. Dopotutto, le idee sulle funzioni dei geni stabiliti dimostrano semplicemente l'ordine in cui si susseguono i nucleotidi nella catena del DNA. Così, il primo studio approfondito del genoma umano ha chiarito molto meno misteri del previsto. Tuttavia, ciò ha successivamente permesso agli scienziati di fare diverse scoperte di alto profilo: una percentuale significativa dei nostri geni è stata formata dalla civiltà umana. Scienziati americani hanno scoperto che circa 1.800 geni (circa il 7% del genoma umano) sono cambiati di conseguenza selezione naturale negli ultimi 50mila anni, ad es. nel processo di sviluppo della civiltà umana. I genomi del mais sono cambiati all’incirca nella stessa proporzione dopo che le persone lo hanno addomesticato. Principalmente i cambiamenti si sono verificati nei geni responsabili del metabolismo delle proteine ​​e della resistenza a varie malattie. Secondo gli scienziati, questi cambiamenti possono essere spiegati con lo sviluppo dell’agricoltura, la crescita urbana e l’aumento della densità di popolazione. Gli scienziati associano le mutazioni nei geni responsabili dell'attività cerebrale allo sviluppo della cultura. 105

Persone che vivono anche in angoli diversi i terreni differiscono tra loro solo dello 0,1%. Tuttavia, questa piccola discrepanza nel DNA fornisce indizi sufficienti per determinare gli antenati geografici di un individuo. Ma i geni degli scimpanzé e degli esseri umani, la cui relazione era precedentemente considerata la più stretta, coincidono solo al 95%. L'uomo è diventato umano 3 milioni di anni fa. Fu allora che gli antenati dell'Homo Sapiens iniziarono a camminare eretti dopo che uno dei geni si spense. Questo gene - Neu 5 Gc - controlla la produzione di acido sialico (uno degli zuccheri) nel corpo. I ricercatori suggeriscono che la mutazione sia avvenuta a metà tra la comparsa dell'antenato comune di esseri umani e scimpanzé e l'emergere degli immediati predecessori dell'Homo Sapiens. Negli organismi animali, tutte le cellule sono ricoperte da un guscio di zuccheri. La persona non ha questo. Gli esperti suggeriscono che questo sia in qualche modo collegato allo sviluppo del cervello: durante il periodo dell'evoluzione, quando gli antenati uomo moderno separati dagli antenati degli scimpanzé, le loro dimensioni del cervello erano approssimativamente le stesse. 106

Avendo imparato a distinguere i colori, gli antenati umani hanno smesso di scegliere i partner in base all'olfatto. Sviluppo visione dei colori portò al fatto che i primati che vivevano nell'emisfero orientale, e le persone che poi apparvero come risultato del loro sviluppo, persero la capacità di riconoscere i feromoni. Ciò accadde circa 23 milioni di anni fa, poco prima della superfamiglia grandi scimmie, da cui alla fine discendono le persone, divise in diversi gruppi separati. Quando le scimmie maschi che vivevano nell'emisfero orientale acquisirono un secondo gene per la visione dei colori circa 23 milioni di anni fa, il nuovo modo selezione sessuale. Ora, per segnalare la maturità e la capacità delle femmine di riprodursi, iniziarono a usare non i feromoni, ma caratteristiche sessuali secondarie, come aree dai colori vivaci sulla pelle, ecc. Le caratteristiche della figura sono determinate geneticamente. Il programma genetico del corpo determina la figura ed è responsabile del peso. Gli scienziati si sono imbattuti in questo schema quando hanno iniziato a esaminare il tessuto adiposo dei topi per individuare la tendenza al sovrappeso. Sono stati identificati almeno 12 geni che influenzano diversi siti di accumulo del grasso. Altri tre geni sembrano giocare un ruolo decisivo in presenza di una tendenza al sovrappeso. Il contributo dei geni alla distribuzione della massa grassa è stimato pari al 50-60%. 107

Esiste un gene responsabile della dipendenza dalla nicotina. Due gruppi di scienziati hanno condotto ricerche su diverse forme del gene CYP 2 A 6, un enzima che si trova principalmente nel fegato e regola il metabolismo della nicotina nel corpo umano. Studi precedenti hanno dimostrato che le persone prive di questo gene hanno meno probabilità di diventare dipendenti dalla nicotina. Gli esperti ritengono che in queste persone la nicotina venga eliminata dal corpo in un periodo di tempo più lungo, quindi il desiderio di fumare la sigaretta successiva appare dopo un periodo di tempo più lungo. Dipendenza da alcol determinata anche dai geni. Scienziati americani hanno scoperto un gene che collega l'alcolismo al senso di paura. Gli esperimenti hanno dimostrato che l'assenza di una copia di un determinato gene provoca nei topi una sensazione di paura e un desiderio incontrollabile di alcol. Gli scienziati suggeriscono che i topi hanno cercato di sopprimere la loro paura con l'alcol, poiché il consumo frequente di alcol li rendeva più audaci. Tale motivazione può portare a alcolismo cronico e tra la gente. 108

109

Genoma umano [Enciclopedia scritta in quattro lettere] Tarantula Vyacheslav Zalmanovich

TUTTO SI SAPE PER CONFRONTO (genomica comparativa)

C'è meno somiglianza tra due membri della razza umana che tra due animali diversi.

Michel de Montaigne

Ciò che è nuovo in sé sarà compreso solo per analogia con il vecchio.

F. Bacon

Come già accennato, il metodo comparativo rappresenta l'approccio tradizionale nei vecchi campi classici della biologia (anatomia, embriologia, citologia). Pertanto, Darwin ha confermato il suo punto di vista sull'origine dell'uomo utilizzando il metodo evolutivo comparativo, indicando numerose somiglianze nell'anatomia e nella fisiologia dell'uomo e delle scimmie.

Recentemente, l'approccio comparativo è stato ampiamente ed efficacemente utilizzato nella biologia molecolare e nella genetica. Un potente impulso a questo scopo è stato dato dal sequenziamento su larga scala dei genomi. È apparsa anche una nuova direzione nella genomica: la genomica comparativa: confronto di singoli geni, gruppi di geni e interi loci di organismi molto distanti dal punto di vista evolutivo. Questa area di ricerca di fondamentale importanza ci consente di affrontare una serie di questioni chiave in un modo nuovo. Diamo un'occhiata ad alcuni di loro.

Attualmente l'umanità, oltre alla propria Enciclopedia, dispone di Enciclopedie simili di alcuni organismi semplici: E. coli, mosche della Drosophila, lieviti e vermi Caenoharbditis elegans, così come i topi - e singoli capitoli delle Enciclopedie di altri organismi altamente organizzati (scimmie, ratti). Oggi, parallelamente al sequenziamento del genoma umano, vengono decifrati circa altri 1000 genomi di altri animali e piante. Il testo del DNA in tutte queste enciclopedie è scritto con le stesse quattro lettere, il cui numero è di milioni per i batteri, centinaia di milioni per gli uccelli e miliardi per i mammiferi e gli esseri umani. Poiché tutti i testi sono scritti allo stesso modo, possono essere confrontati tra loro. Si è scoperto che, nonostante le enormi differenze nelle dimensioni del genoma, il numero di geni (le frasi più significative nei testi) non differisce molto tra le diverse specie di organismi. A questo proposito, iniziarono persino a parlare di un certo paradosso, che ricevette il nome speciale G-paradosso (la prima lettera della parola inglese gene - gene). Ora questo paradosso è spiegato dal fatto che la cosa principale per un organismo non è il numero totale di geni, ma come sono strutturati e come sono regolati, qual è la complessità dell'interazione tra i prodotti di geni diversi. "Condividiamo gli stessi geni con cani e gatti, ma sono regolati in modo diverso", ha affermato Craig Venter, uno dei protagonisti del sequenziamento del genoma umano. Molto probabilmente, sono la struttura e la regolazione della funzione genetica a essere uniche per l’uomo, a renderlo la “corona della natura”. In breve, se un gene è una frase breve, allora da una combinazione delle stesse parole e frasi puoi scrivere sia il trattato più intelligente che le filastrocche primitive. Inoltre, è importante il modo in cui verranno letti e suonati.

Non importa quanto possiamo sembrare unici a noi stessi, il nostro DNA ha molte somiglianze non solo con scimmie e topi, ma anche con un piccolo verme C. elegans e la mosca Drosophila. Può sorprendere, ma circa il 50% dei nostri geni sono simili a quelli dei vermi. Gli esseri umani e i topi condividono una quantità ancora maggiore degli stessi geni, sebbene l’evoluzione degli esseri umani e dei topi si sia differenziata circa 100 milioni di anni fa. Ad oggi, nel genoma umano sono stati scoperti solo circa 300 geni che non si trovano nei topi e il loro numero totale è approssimativamente lo stesso. Pertanto, circa il 99% dei geni umani corrispondono ai geni del topo e circa l'80% di essi sono quasi esattamente identici. Inoltre, fino al 90% dei geni responsabili della comparsa di varie malattie sono simili nell’uomo e nei topi. Ci sono, ovviamente, piccole differenze. Quindi, i topi hanno molti più geni responsabili dell'olfatto.

Per quanto riguarda i nostri parenti più stretti, le differenze sono ancora minori. Secondo i dati più recenti, in generale, il genoma umano differisce da quello dello scimpanzé solo al massimo del 5%! Sorprendentemente, alcuni gruppi di geni negli esseri umani (ad esempio, i geni responsabili della formazione del corpo di un organismo) sono simili a gruppi simili nelle specie biologiche sorte da cinquecento a seicento milioni di anni fa, durante il cosiddetto Cambriano biologico. esplosione. Ora aspettiamo con impazienza il momento in cui il genoma degli scimpanzé sarà completamente sequenziato. Successivamente dovrebbe iniziare una nuova fase molto importante nella genomica comparativa. Come risultato di tale confronto, si potrebbero scoprire mutazioni funzionalmente importanti specifiche per l’uomo come specie, che a loro volta apriranno nuove strade alla medicina. Naturalmente, questi dati contribuiranno anche a una comprensione più completa del processo di evoluzione umana.

Il confronto delle sequenze di DNA umano con il DNA di altri organismi si è già dimostrato un metodo molto fruttuoso per la ricerca di nuove sequenze funzionalmente importanti nel genoma umano. Questo approccio è stato utilizzato e continua ad essere utilizzato per identificare nuovi geni codificanti proteine ​​e non codificanti proteine ​​negli esseri umani, nonché per identificare potenziali elementi regolatori e chiarire i meccanismi di funzionamento di diversi set di geni. A questo scopo sono stati creati speciali programmi informatici che consentono di “catturare” regioni evolutivamente conservate in diversi genomi. Tutto ciò è di fondamentale importanza poiché, come già sottolineato in precedenza, non possiamo condurre esperimenti genetici sull'uomo, ma, grazie al metodo comparativo, abbiamo la possibilità di interpolare per l'uomo i risultati che si ottengono dagli studi di genetica molecolare condotti sugli animali.

Pertanto, a causa della somiglianza dei genomi, anche la mosca della Drosophila può essere utilizzata per una comprensione più completa delle funzioni di alcuni geni umani, in particolare quelli responsabili di alcune malattie umane. Un esempio di ciò è lo studio del gene dFMR–1 mosche, che presenta omologia con il corrispondente gene umano che determina la sindrome X fragilità, una grave malattia neurodegenerativa ereditaria. Questo studio ci ha permesso di concludere che la causa della sindrome è molto probabilmente associata a una violazione del meccanismo di interferenza dell'RNA, di cui abbiamo già discusso in precedenza. E questo è un serio "suggerimento" per gli scienziati che stanno risolvendo il problema della sindrome dell'X fragile negli esseri umani.

È importante notare che quando studiamo il genoma umano, in realtà impariamo a conoscere l’intero mondo vivente. Il genoma umano è estremamente complesso. I genomi di animali e piante sono spesso molto più semplici. Pertanto, quando impareremo la struttura di un genoma complesso, sarà molto facile per noi passare da esso allo studio di uno semplice. E questo promette una rivoluzione in settori come la medicina veterinaria e l’allevamento di piante e animali.

La genomica comparativa ha offerto agli scienziati un nuovo approccio alla comprensione del processo di evoluzione e dei suoi meccanismi, apparentemente nascosti per sempre nell’oscurità dei secoli. Ad esempio, il confronto dei genomi di diverse specie di animali e di esseri umani ha mostrato la presenza di alcune tendenze nell'evoluzione. Uno di questi è aumentare il numero di introni nel processo di sviluppo evolutivo nell'uomo, cioè l'evoluzione è, per così dire, associata alla "divisione" del genoma in frammenti separati funzionalmente significativi: per unità di lunghezza del DNA c'è contiene sempre meno informazioni sulla struttura delle proteine ​​e dell'RNA (esoni) e sempre più regioni che non hanno ancora un chiaro significato funzionale (introni). Gli studi condotti suggeriscono che la natura ha migliorato i mammiferi non tanto aumentando la diversità dei loro geni, ma copiando, modificando e combinando gradualmente i geni esistenti, nonché cambiando la regolazione dell’espressione genetica. La specificità e la diversità della struttura e del funzionamento dell'apparato genetico sono grandi anche tra gli eucarioti. Allo stesso tempo, esistono molti principi e meccanismi generali e i risultati del loro studio su alcuni oggetti possono spesso essere trasferiti con successo ad altri, compresi gli esseri umani.

Risultati molto interessanti sono stati ottenuti, in particolare, confrontando la distribuzione cromosomica di sequenze di DNA simili nell'uomo e in altri animali. Facciamo solo un esempio. Come già indicato, esistono grandi somiglianze tra il genoma umano e quello del topo. Nella fig. 37, l'inserto colorato mostra la posizione di segmenti simili di singoli cromosomi umani in diversi cromosomi di topo. Osservando questa figura, possiamo vedere che sezioni degli stessi cromosomi umani sono distribuiti su molti cromosomi di topo. Ciò è vero anche viceversa. Cosa significa? Questo ci racconta i percorsi lungo i quali è avvenuta l'evoluzione dei mammiferi (dopotutto, topi e esseri umani sono mammiferi). Dopo aver analizzato attentamente l'immagine mostrata in Fig. 37, gli scienziati hanno scoperto che ai confini delle diverse sezioni del DNA del topo, che si trovano nel DNA umano, si trovano vari elementi genetici mobili, ripetizioni in tandem e altri “punti caldi”, lungo i quali probabilmente è avvenuta la ristrutturazione (ricombinazione) durante un processo secolare di evoluzione degli organismi animali.

Riso. 37. Somiglianza genetica (omologia) dei cromosomi umani e di topo. Le sequenze nucleotidiche dei cromosomi umani contenenti segmenti simili sono contrassegnate con colori e numeri diversi sui cromosomi del topo.

La genomica comparativa ha dimostrato che i geni identici per origine e funzione evolutiva (omologhi) sono spesso collegati agli stessi geni omologhi in specie diverse. Su questa base si prevede la probabile regione di localizzazione dei geni in alcune specie, se si sa a quali geni sono collegati in altre, cioè si effettua una “mappatura comparativa”. Tutto ciò è importante perché le regole dei numeri e la posizione relativa dei geni sul cromosoma non sempre predeterminano le leggi del loro funzionamento. Pertanto, la composizione proteica di molte cellule specializzate di topi, ratti e esseri umani sembra simile, sebbene i geni stessi siano sparsi in modo diverso sui cromosomi.

Quindi, la genomica comparativa ci consente di giudicare i meccanismi e i percorsi dell'evoluzione del genoma e persino di ricreare la classificazione dell'intero mondo animale a un nuovo livello. Tutto questo è oggetto di un'altra nuova direzione: la genomica evolutiva. La sua corona dovrebbe essere la creazione di un certo sistema chiaro di organismi viventi, in un certo senso simile alla tavola periodica.

Grazie all'utilizzo di metodi e approcci di genomica comparativa ed evolutiva si sono già ottenuti risultati sensazionali riguardo ad un tema così complesso ed interessante come l'origine dell'uomo e l'evoluzione del suo genoma. Di questo si parlerà più approfonditamente nella parte successiva del libro.

Dal libro La genetica dei colori dei cani di Robinson Roy

SIMBOLISMO COMPARATIVO DEI GENI I lettori interessati alla letteratura sulla genetica prima o poi incontrano il problema della confusione nelle designazioni dei geni. Il fatto è che autori diversi usano simboli diversi per designare lo stesso gene. Questo

Dal libro Trattamento omeopatico di cani e gatti di Hamilton Don

Malattia acuta rispetto a una malattia cronica Una caratteristica delle malattie acute (soprattutto infettive) - ad esempio le infezioni infantili - è la costanza comparativa dei loro sintomi in pazienti diversi. Questo fenomeno può essere spiegato dal fatto che

Dal libro Il genoma umano: un'enciclopedia scritta in quattro lettere autore

Prescrizione costituzionale e prescrizione acuta Il termine "trattamento costituzionale e prescrizione" è ampiamente utilizzato in omeopatia, ma il suo significato a volte non è del tutto chiaro. Il fatto è che autori diversi spesso interpretano questo termine in modo diverso. Tuttavia

Dal libro Il genoma umano [Enciclopedia scritta in quattro lettere] autore Tarantul Vyacheslav Zalmanovich

DALLA STRUTTURA ALLA FUNZIONE (genomica funzionale) Non basta la conoscenza, occorre anche l'applicazione; Non basta volere, devi farlo. I. Goethe è ben consapevole dell'espressione secondo cui la parola "halva" non rende la bocca più dolce. Lo stesso vale per il nostro genoma. Ha molto

Dal libro Evoluzione autore Jenkins Morton

Dal libro Biologia [Libro di consultazione completo per la preparazione all'esame di stato unificato] autore Lerner Georgy Isaakovich

DALLA STRUTTURA ALLA FUNZIONE (genomica funzionale) Non basta la conoscenza, occorre anche l'applicazione; Non basta volere, devi farlo. I. Goethe è ben consapevole dell'espressione secondo cui la parola "halva" non rende la bocca più dolce. Lo stesso vale per il nostro genoma. Lui ha

Dal libro Natura tropicale autore Wallace Alfred Russel

DAL GENE E DALLA PROTEINA - ALLA CURA (genomica medica) La medicina è davvero la più nobile di tutte le arti. Ippocrate Le malattie peggiori non sono mortali, ma incurabili. Ebner-Eschenbach Il famoso biologo russo N. Timofeev-Resovsky scrisse: “In modo sorprendente

Dal libro Fondamenti di psicofisiologia autore Aleksandrov Yuri

TUTTO SI SAPE PER CONFRONTO (genomica comparata) Ci sono meno somiglianze tra due rappresentanti della razza umana che tra due animali diversi. Michel de Montaigne Ciò che è nuovo in sé sarà compreso solo per analogia con il vecchio. F. Bacon Come già accennato,

Dal libro Logica del caso [Sulla natura e l'origine dell'evoluzione biologica] autore Kunin Evgenij Viktorovich

ANATOMIA COMPARATIVA I biologi coinvolti nell'anatomia comparata sanno da tempo che le specie che formano gruppi più grandi (phylum, classe o ordine) hanno molte caratteristiche simili nella loro struttura. Lo sviluppo della tecnologia di analisi genetica ha permesso di stabilire risultati più durevoli

Dal libro Niente in biologia ha senso se non alla luce dell'evoluzione autore Dobzhansky Feodosio Grigorievich

Dal libro La nascita della complessità [Biologia evolutiva oggi: scoperte inaspettate e nuove domande] autore Markov Aleksandr Vladimirovich

Rarità comparativa dei fiori C'è una forte convinzione tra gli abitanti della zona temperata che la rigogliosa vegetazione dei tropici debba produrre anche una magnifica flora di fiori; Questa visione è confermata dai numerosi fiori grandi e belli che crescono

Dal libro La Sindrome di Paganini [e altre storie vere di genio registrate nel ns codice genetico] di Keen Sam

Capitolo 19 PSICOFISIOLOGIA COMPARATIVA La psicofisiologia comparata è una scienza volta a stabilire modelli e identificare differenze nell'organizzazione strutturale e funzionale del cervello, del comportamento e della psiche negli animali di specie diverse, compreso l'uomo.

Dal libro dell'autore

Capitolo 3 Genomica comparata: paesaggi genomici in evoluzione Trans. A. NeizvestnyL'importanza del passaggio alla genomica Nell'era pre-genomica furono stabiliti i principi fondamentali dell'evoluzione molecolare e furono fatte molte osservazioni specifiche che hanno Grande importanza

Dal libro dell'autore

Dal libro dell'autore

Genomica comparativa ed evoluzione precoce degli animali Se non si prendono in considerazione piccole cose rare e poco studiate come Trichoplax, allora gli animali più primitivi possono essere chiamati spugne, che non hanno ancora tessuti reali, un sistema nervoso e un intestino. Le spugne sono contrarie

Dal libro dell'autore

Epilogo. Quando la genomica diventa personale Nonostante tutta la loro conoscenza, molte persone esperte di scienza e persino molti scienziati, a un certo livello inconscio, hanno ancora paura dei propri geni. Questo perché non importa quanto bene capisci qualcosa mentalmente e quanti controesempi

Caricamento...