The genome and the complexity of living beings. The genome of an organism is the total dna content of its cells, including genes and intergenic regions. In prokaryotes (Archaea and Bacteria) there is, in general, a linear relationship between genome size and the number of genes. The smallest genomes are found in symbionts and parasites, as they undergo a gene degradation process during adaptation to their new lifestye. However, in eukaryotes there is no correlation between genome size and the complexity of the organism. This is known as the C-value paradox. The largest genome is found in an amoeba, a one-cell organism, with 686.000 Mb, 200 fold larger than the human genome and 20.000 fold larger than the one found in yeast. Now we know that most excess DNA is repetitive DNA, apparently lacking a function (selfish DNA) and whose possible role in genome evolution is still unknown.
El DNA és el material dels gens, per tant és natural pensar que organismes més complexos requeriran més gens i tindran més DNA. Segons això, s’hauria d’esperar que “organismes més complexos tinguen genomes de major grandària i continguen un nombre més gran de gens”. És a dir, al llarg de l’evolució s’espera un augment gradual de les grandàries del genoma i del nombre de gens.
Per a començar l’estudi de les grandàries de genomes, i tractar de comprovar si la grandària esperada coincideix amb la que s’ha observat, seguirem la classificació de la vida sobre la terra, tal com ha estat proposada per Woese i col·laboradors (1990) arran dels estudis filogenètics realitzats amb el gen 16S rDNA, que codifica per a la subunitat petita del RNA ribosòmic. És aquest un gen molt conservat en l’escala evolutiva i sembla que reprodueix bé la relació entre els éssers vius. Segons la filogènia obtinguda, els autors proposen que la vida cel·lular sobre la terra es pot agrupar en tres dominis: bacteris i arqueus (ambdós procariotes) i eucariotes. Una relació simplificada se’n pot veure en la figura 1.
Rang de grandàries del genoma
En la figura 2 es representa el rang de grandàries de genomes trobats en els tres dominis de la vida: bacteris, arqueus i eucariotes. Sembla clar que els procariotes tenen, en general, grandàries més petites que els eucariotes, amb l’excepció d’alguns bacteris molt grans i alguns eucariotes molt petits. Vegem les dades més detalladament.
Figura 2. Rang de grandària del genoma en organismes dels tres dominis de la vida. Per a veure la imatge en gran, feu click sobre aquesta.
Procariotes: bacteris i arqueus
Segons les dades publicades fins al moment, la grandària varia des de 0,58 megabases [1 megabase (Mb) és un milió de parells de bases (pb)] en el patogen intracel·lular Mycoplasma genitalium, fins més de 10 Mb en diverses espècies de cianobacteris, amb l’excepció de Bacillus megaterium, que té un genoma de 30 Mb. El segon genoma més petit publicat és el de Buchnera sp. APS, endosimbiont del pugó de cereals Acyrtosiphon pisum, amb una grandària de 641 kb. Recentment el nostre grup d’investigació ha caracteritzat sis genomes encara més petits que el de Mycoplasma, el menor dels quals és el de Buchnera sp. CCE, endosimbiont del pugó Cinara cedri, amb una grandària de 0,45 MB. La majoria dels genomes té una grandària menor de 5 Mb, com s’observa a la taula 1.
Hi ha una relació entre grandària de genoma i nombre de gens? La grandària del gen procariòtic és uniforme, aproximadament de 900 a 1.000 pb. Per tant, es pot estimar la densitat gènica en cada genoma seqüenciat. Com s’observa a la taula 1, la densitat gènica és més o menys constant, tant en bacteris, com en arqueus. Podem concloure que, almenys en els procariotes, els genomes majors tenen més gens i són, damunt, més complexos.
És a dir, el nombre de gens reflecteix l’estil de vida. Així, bacteris més petits són especialistes, com els paràsits obligats i els endosimbionts, i bacteris més grans són generalistes, i poden fins i tot tenir cert grau de desenvolupament, com és el cas de l’esporulació en Bacillus.
Eucariotes: paradoxa del valor C
La grandària del genoma en eucariotes es defineix com el valor C o quantitat de DNA per genoma haploide, tal com el que existeix en el nucli d’un espermatozoide. Es denomina C, per constant o característic, per a indicar que la grandària és pràcticament constant dins d’una espècie.
Si s’observa novament la figura 2, veiem que, en general, els eucariotes tenen genomes molt majors que els procariotes, amb l’excepció d’algunes algues verdes endosimbionts o paràsites, que tenen genomes molt reduïts. En concret, el genoma eucariòtic més petit seqüenciat és el de Guillardia theta, una alga roja simbiont, de tan sols 0,55 Mb. També es pot observar en la figura que hi ha un rang molt ampli de grandàries, molt major que el de procariotes, fins a més de 80.000 vegades, des d’organismes com els llevats (1,2 Mb) fins a l’ameba (686.000 Mb). Però existeix, com en els bacteris, una relació entre l’extensió del genoma i la complexitat de l’organisme?
En la figura 2 hem representat el rang de valor C en diversos grups representatius d’organismes d’eucariotes. Com s’hi pot observar, els protistes unicel·lulars, com les amebes, mostren la major variació en valors C (23,5 Mb a 686.000 Mb, amb una raó entre el major i el menor de 29.191), mentre que mamífers, ocells i rèptils mostren la menor variació en l’extensió dels seus genomes (una raó de només 4, 1 i 4, respectivament). És més, la gran variació en les extensions del genoma entre espècies eucariotes no sembla tenir relació ni amb la complexitat de l’organisme ni amb el nombre de gens que contenen. Per exemple, les amebes, que presenten els majors genomes, posseeixen 200 vegades més DNA que els humans (3.400 Mb), i és evident que una ameba no pot ser més complexa que un ésser humà. És més, el resultat previsible seria que els mamífers, organismes molt més complexos, presentaren els genomes més grans. No obstant això, molts organismes més, com ara peixos, amfibis o plantes, tenen genomes molt més grans que ells. Fins i tot quan comparem les extensions entre organismes que pareixen semblants quant a la complexitat, trobem també àmplies diferències en els seus valors C. Per posar alguns exemples, mosques i llagostes, cebes i lliris, etc., presenten variacions considerables en les grandàries dels seus genomes. Els amfibis, com a grup, tenen variacions de fins a 91 vegades i és difícil creure que això puga reflectir variacions de gairebé 100 vegades en el nombre de gens necessaris per a donar lloc als amfibis corresponents o que la ceba necessite 200 vegades més DNA que l’arròs. La figura 3 representa alguns éssers vius, amb grandària proporcional a la del seu genoma i no necessita major explicació.
Figura 3. Grandària del genoma en alguns éssers vius. L’altura dels dibuixos és proporcional a la grandària del seu genoma. Caenorhabditis és un cuc nematode.
De la falta de correspondència entre els valors C i la quantitat presumible d’informació genètica continguda dins dels genomes se’n va dir paradoxa del valor C. Com que no podem assumir que una espècie posseesca menys DNA que la quantitat requerida per a especificar les seues funcions vitals, hem d’explicar per què moltes espècies contenen una quantitat tan alta d’excés de DNA.
DNA gènic o DNA no gènic
La primera qüestió que s’ha d’aclarir és si hi ha correlació entre la grandària del genoma i el nombre de gens. És a dir, les diferències en les grandàries del genoma són degudes a DNA gènic o no gènic?
És sabut, des de finals dels anys 60, que el genoma d’eucariotes es compon d’una gran quantitat de DNA repetitiu. A més, des de finals dels anys 70 se sap que els gens es troben interromputs per seqüències no codificants, els introns, que han de ser eliminats abans que el ribosoma sintetitze la proteïna. Es tracta, en ambdós casos, de DNA aparentment superflu, que contribueix a la gran variació en els valors C i, per tant, explica l’aparent paradoxa.
La grandària i el nombre d’introns varien àmpliament al llarg de l’escala evolutiva i som els mamífers els qui tenim el nombre més gran i de major grandària. També el DNA repetitiu varia entre organismes. Tradicionalment es classifica aquest DNA com: altament repetitiu, amb seqüències com els microsatèl·lits i els minisatèl·lits i moderadament repetitiu, on s’enquadren els elements transponibles, les seqüències que constitueixen l’exemple més clar de DNA egoista.
Nombre de gens i complexitat de l’organisme
A mesura que es van completant les seqüències de genomes sencers, es va coneixent amb major o menor exactitud el nombre de gens que es deriven d’aquestes seqüències, ja que fins ara tan sols hi havia estimacions indirectes. Això no obstant, algunes dades estan deparant sorpreses perquè, en alguns casos, no sembla que hi haja una correlació clara entre nombre de gens i complexitat de l’organisme. El cuc nematode C. elegans, té 18.000 gens (vegeu taula 1), uns 5.000 més que Drosophila, un organisme més complex. L’home només té el doble de gens que C. elegans (les estimacions indicaven uns 100.000). També aquestes dades es comencen a fer bones d’entendre. Hi ha mecanismes en eucariotes superiors que són capaços d’“expandir el proteoma”. És a dir, a partir d’una mateixa seqüència de DNA poden obtenir més d’una proteïna. Els grans introns trobats en mamífers poden, en molts casos, “amagar” informació que no es pot deduir només amb la seqüència del DNA. Encara ha de passar temps fins que es puga conèixer el nombre de proteïnes que un organisme és capaç de sintetitzar. Però açò seria motiu d’un altre treball. En qualsevol cas, sí que es pot afirmar que “organismes més complexos tenen més funcions gèniques”.
Organisme | ||||
Nom comú o classe | Nom científic | Grandària del genoma (Mb) |
Nombre de gens |
Densitat genètice (gens/Mb) |
Eucariotes | Saccharomyces cerevisiae | 12 | 6.241 | 480 |
Llevat del pa | ||||
Nematode | Caenorhabditis elegans | 97 | 18.424 | 190 |
Crucífera | Arabidopsis thaliana | 125 | 25.498 | 204 |
Mosca del vinagre | Drosophila melanogaster | 180 | 13.601 | 75 |
Peix globus | Fugu rubripes | 400 | 35.000 | 100 |
Arròs | Oryza sativa | 450 | ||
Eriçó de mar | Strongylocentrotus purpuratus | 900 | 27.350 | 30 |
Dacsa | Zea mays | 2.400 | ||
Èsser humà | Homo sapiens | 3.400 | 35.000 | 10 |
Ceba | Allium cep | 18.000 | ||
Ameba | Amoeba dubia | 686.000 | ||
Arqueus | Aeropyrum pernix | 1,55 | 1.522 | 981 |
Crenarchaeota | ||||
Euryarchaeota | Methanococcus jannaschii | 1,66 | 1.715 | 1033 |
Euryarchaeota | Archaeoglobus | 2,18 | 2.420 | 1110 |
Bacteris | Buchnera sp. CCE | 0,45 | ||
Proteobacteri | ||||
Gram positiva | Mycoplama genitalium | 0,58 | 479 | 831 |
Proteobacteri | Buchnera sp. APS | 0,64 | 564 | 881 |
Gram negativa | Haemophilus influenzae | 1,8 | 1.727 | 959 |
Cianobacteri | Synechocystis sp. | 3,6 | 3.168 | 880 |
Gram positiva | Bacillus subtilis | 4,2 | 4.100 | 976 |
Proteobacteri | Escherichia coli | 4,6 | 4.288 | 932 |
Taula 1. Grandària del genoma, nombre de gens i densitat gènica
Mecanismes molecularsque alteren la grandària del genoma
Són molts els mecanismes mutacionals que poden produir canvis en la grandària del genoma. Alguns d’ells ocorren a gran escala (duplicació de tot el genoma), mentre que altres ocorren a una escala molt petita (pèrdua o guany d’uns pocs nucleòtids). Tot i això, cal destacar que aquestes mutacions afecten, en principi, una sola cèl·lula, que en el cas de ser un gàmeta, podrà transmetre aquesta mutació a un descendent. Aquest individu haurà de conviure amb altres en una població i només en futures generacions sabrem si la mutació que porta s’estendrà a tots els individus de la població (fixació) o, al contrari, desapareixerà. La probabilitat que ocórrega una cosa o l’altra dependrà de mecanismes evolutius com la selecció natural (si aporta un avantatge o desavantatge a l’individu) o la deriva genètica (per atzar).
Els mecanismes cromosòmics solen produir variacions dràstiques amb una única mutació. Es pot destacar la duplicació de tot el genoma, duplicacions que afecten només un cromosoma, o una part. De manera equivalent, també es coneixen mutacions que produeixen la pèrdua d’algun fragment cromosòmic. Encara que igualment freqüent en plantes i animals, sembla que en les primeres aquesta mena de canvis han contribuït de forma rellevant a l’evolució del seu genoma.
«Es pot afirmar que “organismes més complexos tenen més funcions gèniques”»
Els elements genètics mòbils, o elements transponibles, són altres dels causants de grans variacions en la grandària del genoma. Aquests elements, d’uns pocs milers de nucleòtids, es dupliquen i les còpies duplicades s’insereixen en altres parts del genoma, la qual cosa provoca ràpids augments en la seua grandària, llevat que actuen els mecanismes de control de la seua proliferació. (Com a autèntics egoistes desenvolupen mecanismes per a regular el seu moviment pel genoma, de manera que no produesquen danys irreparables, ja que això implicaria la seua pròpia desaparició.) S’ha estimat que el genoma de la dacsa s’ha duplicat per causa dels elements transponibles en els últims tres milions d’anys de la seua evolució.
Es considera que les insercions o delecions espontànies (anomenades indels) d’uns pocs nucleòtids són una de les causes més importants de l’evolució de la grandària del genoma a llarg termini. En diverses espècies d’insectes, per exemple, s’ha mostrat una gran correlació entre la taxa global de pèrdua de DNA de les regions intergèniques i no codificants i la grandària del genoma. La fixació d’aquestes mutacions és molt improbable si l’indel afecta un gen, però és més probable si afecta pseudogens (gens no funcionals, inactivats recentment) o altres seqüències de DNA sense funció. La desintegració dels gens, o desaparició d’un gen del genoma, sol transcórrer en un primer pas amb la seua inactivació mitjançant una mutació puntual (formació d’un pseudogèn). Posteriorment, el DNA que forma els pseudogens va sent eliminat fins que es perd qualsevol vestigi de la seua presència en el genoma.
La variació en la longitud del DNA dels minisatèl·lits i microsatèl·lits és un altre dels mecanismes que poden alterar la grandària del genoma. Aquestes seqüències estan formades per una unitat de pocs nucleòtids, repetida de forma contigua des de menys de deu fins a uns quants milers de vegades. El nombre d’unitats repetides varia molt, fins i tot en individus de la mateixa espècie. Això és a causa de dos mecanismes que provoquen tant l’augment com la disminució del nombre de repeticions. Aquests mecanismes són la recombinació, anomenada desigual, i errors durant la replicació del DNA, a causa del fenomen conegut com el lliscament de la DNA polimerasa. De fet, aquestes són les seqüències que s’estan utilitzant per a, per exemple, identificar restes humanes, a causa de la seua gran variabilitat.
Un dels processos de major importància en l’augment de la grandària del genoma en organismes unicel·lulars, especialment procariotes, és la transferència genètica horitzontal. Aquest procés consisteix a introduir en el genoma d’una espècie un fragment de DNA d’una altra espècie, que conté un o diversos gens. El DNA s’introdueix en la cèl·lula per diferents mecanismes i després ha de recombinar amb el genoma. Si els gens introduïts confereixen algun avantatge a l’organisme, solen mantenir-se, però si açò no ocorre poden mutar i inactivar-se. Un exemple de la importància d’aquests processos es pot veure en el bacteri intestinal Escherichia coli, algunes de les soques del qual s’han tornat patògenes per la transferència de gens de virulència. La importància d’aquest fenomen en períodes recents de l’evolució d’organismes superiors és molt més limitada, encara que hi ha molts casos descrits de transferència genètica intracel·lular de DNA del genoma de les mitocòndries i cloroplastos al genoma nuclear.
Totes aquestes mutacions sorgeixen de forma periòdica en multitud d’espècies, inclosa l’espècie humana. Moltes són desavantatjoses i la pressió selectiva les va eliminant de la població, d’altres, individualment, són neutres però poden ser col·lectivament avantatjoses o perjudicials si augmenten o disminueixen la grandària del genoma. En bacteris, tenir un genoma reduït pot ser positiu per a optimar el temps i cost de la duplicació del DNA. En organismes eucariotes, s’han proposats diversos avantatges quan el genoma disposa d’una gran extensió, encara que no vaja associada a un nombre més alt de gens.