La grandària del genoma i la complexitat dels éssers vius

La grandària del genoma i la complexitat dels éssers vius

The genome and the complexity of living beings. The genome of an organism is the total dna content of its cells, including genes and intergenic regions. In prokaryotes (Archaea and Bacteria) there is, in general, a linear relationship between genome size and the number of genes. The smallest genomes are found in symbionts and parasites, as they undergo a gene degradation process during adaptation to their new lifestye. However, in eukaryotes there is no correlation between genome size and the complexity of the organism. This is known as the C-value paradox. The largest genome is found in an amoeba, a one-cell organism, with 686.000 Mb, 200 fold larger than the human genome and 20.000 fold larger than the one found in yeast. Now we know that most excess DNA is repetitive DNA, apparently lacking a function (selfish DNA) and whose possible role in genome evolution is still unknown.

El DNA és el material dels gens, per tant és natural pensar que organismes més complexos requeriran més gens i tindran més DNA. Segons això, s’hauria d’esperar que “organismes més complexos tinguen genomes de major grandària i continguen un nombre més gran de gens”. És a dir, al llarg de l’evolució s’espera un augment gradual de les grandàries del genoma i del nombre de gens.

Per a començar l’estudi de les grandàries de genomes, i tractar de comprovar si la grandària esperada coincideix amb la que s’ha observat, seguirem la classificació de la vida sobre la terra, tal com ha estat proposada per Woese i col·laboradors (1990) arran dels estudis filogenètics realitzats amb el gen 16S rDNA, que codifica per a la subunitat petita del RNA ribosòmic. És aquest un gen molt conservat en l’escala evolutiva i sembla que reprodueix bé la relació entre els éssers vius. Segons la filogènia obtinguda, els autors proposen que la vida cel·lular sobre la terra es pot agrupar en tres dominis: bacteris i arqueus (ambdós procariotes) i eucariotes. Una relació simplificada se’n pot veure en la figura 1.

Rang de grandàries del genoma

En la figura 2 es representa el rang de grandàries de genomes trobats en els tres dominis de la vida: bacteris, arqueus i eucariotes. Sembla clar que els procariotes tenen, en general, grandàries més petites que els eucariotes, amb l’excepció d’alguns bacteris molt grans i alguns eucariotes molt petits. Vegem les dades més detalladament.

Figura 2. Rang de grandària del genoma en organismes dels tres dominis de la vida. Per a veure la imatge en gran, feu click sobre aquesta.

Procariotes: bacteris i arqueus

Segons les dades publicades fins al moment, la grandària varia des de 0,58 megabases [1 megabase (Mb) és un milió de parells de bases (pb)] en el patogen intracel·lular Mycoplasma genitalium, fins més de 10 Mb en diverses espècies de cianobacteris, amb l’excepció de Bacillus megaterium, que té un genoma de 30 Mb. El segon genoma més petit publicat és el de Buchnera sp. APS, endosimbiont del pugó de cereals Acyrtosiphon pisum, amb una grandària de 641 kb. Recentment el nostre grup d’investigació ha caracteritzat sis genomes encara més petits que el de Mycoplasma, el menor dels quals és el de Buchnera sp. CCE, endosimbiont del pugó Cinara cedri, amb una grandària de 0,45 MB. La majoria dels genomes té una grandària menor de 5 Mb, com s’observa a la taula 1.

Hi ha una relació entre grandària de genoma i nombre de gens? La grandària del gen procariòtic és uniforme, aproximadament de 900 a 1.000 pb. Per tant, es pot estimar la densitat gènica en cada genoma seqüenciat. Com s’observa a la taula 1, la densitat gènica és més o menys constant, tant en bacteris, com en arqueus. Podem concloure que, almenys en els procariotes, els genomes majors tenen més gens i són, damunt, més complexos.

És a dir, el nombre de gens reflecteix l’estil de vida. Així, bacteris més petits són especialistes, com els paràsits obligats i els endosimbionts, i bacteris més grans són generalistes, i poden fins i tot tenir cert grau de desenvolupament, com és el cas de l’esporulació en Bacillus.

Eucariotes: paradoxa del valor C

La grandària del genoma en eucariotes es defineix com el valor C o quantitat de DNA per genoma haploide, tal com el que existeix en el nucli d’un espermatozoide. Es denomina C, per constant o característic, per a indicar que la grandària és pràcticament constant dins d’una espècie.

Si s’observa novament la figura 2, veiem que, en general, els eucariotes tenen genomes molt majors que els procariotes, amb l’excepció d’algunes algues verdes endosimbionts o paràsites, que tenen genomes molt reduïts. En concret, el genoma eucariòtic més petit seqüenciat és el de Guillardia theta, una alga roja simbiont, de tan sols 0,55 Mb. També es pot observar en la figura que hi ha un rang molt ampli de grandàries, molt major que el de procariotes, fins a més de 80.000 vegades, des d’organismes com els llevats (1,2 Mb) fins a l’ameba (686.000 Mb). Però existeix, com en els bacteris, una relació entre l’extensió del genoma i la complexitat de l’organisme?

En la figura 2 hem representat el rang de valor C en diversos grups representatius d’organismes d’eucariotes. Com s’hi pot observar, els protistes unicel·lulars, com les amebes, mostren la major variació en valors C (23,5 Mb a 686.000 Mb, amb una raó entre el major i el menor de 29.191), mentre que mamífers, ocells i rèptils mostren la menor variació en l’extensió dels seus genomes (una raó de només 4, 1 i 4, respectivament). És més, la gran variació en les extensions del genoma entre espècies eucariotes no sembla tenir relació ni amb la complexitat de l’organisme ni amb el nombre de gens que contenen. Per exemple, les amebes, que presenten els majors genomes, posseeixen 200 vegades més DNA que els humans (3.400 Mb), i és evident que una ameba no pot ser més complexa que un ésser humà. És més, el resultat previsible seria que els mamífers, organismes molt més complexos, presentaren els genomes més grans. No obstant això, molts organismes més, com ara peixos, amfibis o plantes, tenen genomes molt més grans que ells. Fins i tot quan comparem les extensions entre organismes que pareixen semblants quant a la complexitat, trobem també àmplies diferències en els seus valors C. Per posar alguns exemples, mosques i llagostes, cebes i lliris, etc., presenten variacions considerables en les grandàries dels seus genomes. Els amfibis, com a grup, tenen variacions de fins a 91 vegades i és difícil creure que això puga reflectir variacions de gairebé 100 vegades en el nombre de gens necessaris per a donar lloc als amfibis corresponents o que la ceba necessite 200 vegades més DNA que l’arròs. La figura 3 representa alguns éssers vius, amb grandària proporcional a la del seu genoma i no necessita major explicació.

Figura 3. Grandària del genoma en alguns éssers vius. L’altura dels dibuixos és proporcional a la grandària del seu genoma. Caenorhabditis és un cuc nematode.

De la falta de correspondència entre els valors C i la quantitat presumible d’informació genètica continguda dins dels genomes se’n va dir paradoxa del valor C. Com que no podem assumir que una espècie posseesca menys DNA que la quantitat requerida per a especificar les seues funcions vitals, hem d’explicar per què moltes espècies contenen una quantitat tan alta d’excés de DNA.

DNA gènic o DNA no gènic

La primera qüestió que s’ha d’aclarir és si hi ha correlació entre la grandària del genoma i el nombre de gens. És a dir, les diferències en les grandàries del genoma són degudes a DNA gènic o no gènic?

 És sabut, des de finals dels anys 60, que el genoma d’eucariotes es compon d’una gran quantitat de DNA repetitiu. A més, des de finals dels anys 70 se sap que els gens es troben interromputs per seqüències no codificants, els introns, que han de ser eliminats abans que el ribosoma sintetitze la proteïna. Es tracta, en ambdós casos, de DNA aparentment superflu, que contribueix a la gran variació en els valors C i, per tant, explica l’aparent paradoxa.

 La grandària i el nombre d’introns varien àmpliament al llarg de l’escala evolutiva i som els mamífers els qui tenim el nombre més gran i de major grandària. També el DNA repetitiu varia entre organismes. Tradicionalment es classifica aquest DNA com: altament repetitiu, amb seqüències com els microsatèl·lits i els minisatèl·lits i moderadament repetitiu, on s’enquadren els elements transponibles, les seqüències que constitueixen l’exemple més clar de DNA egoista.

Nombre de gens i complexitat de l’organisme

A mesura que es van completant les seqüències de genomes sencers, es va coneixent amb major o menor exactitud el nombre de gens que es deriven d’aquestes seqüències, ja que fins ara tan sols hi havia estimacions indirectes. Això no obstant, algunes dades estan deparant sorpreses perquè, en alguns casos, no sembla que hi haja una correlació clara entre nombre de gens i complexitat de l’organisme. El cuc nematode C. elegans, té 18.000 gens (vegeu taula 1), uns 5.000 més que Drosophila, un organisme més complex. L’home només té el doble de gens que C. elegans (les estimacions indicaven uns 100.000). També aquestes dades es comencen a fer bones d’entendre. Hi ha mecanismes en eucariotes superiors que són capaços d’“expandir el proteoma”. És a dir, a partir d’una mateixa seqüència de DNA poden obtenir més d’una proteïna. Els grans introns trobats en mamífers poden, en molts casos, “amagar” informació que no es pot deduir només amb la seqüència del DNA. Encara ha de passar temps fins que es puga conèixer el nombre de proteïnes que un organisme és capaç de sintetitzar. Però açò seria motiu d’un altre treball. En qualsevol cas, sí que es pot afirmar que “organismes més complexos tenen més funcions gèniques”.

Organisme
Nom comú o classe Nom científic Grandària
del
genoma
(Mb)
Nombre
de
gens
Densitat
genètice
(gens/Mb)
Eucariotes Saccharomyces cerevisiae  12  6.241  480
Llevat del pa
Nematode Caenorhabditis elegans 97 18.424 190
Crucífera Arabidopsis thaliana 125 25.498 204
Mosca del vinagre Drosophila melanogaster 180 13.601 75
Peix globus Fugu rubripes 400 35.000 100
Arròs Oryza sativa 450
Eriçó de mar Strongylocentrotus purpuratus 900 27.350 30
Dacsa Zea mays 2.400
Èsser humà Homo sapiens 3.400 35.000 10
Ceba Allium cep 18.000
Ameba Amoeba dubia 686.000
Arqueus  Aeropyrum pernix  1,55  1.522  981
Crenarchaeota
Euryarchaeota Methanococcus jannaschii 1,66 1.715 1033
Euryarchaeota Archaeoglobus 2,18 2.420 1110
Bacteris  Buchnera sp. CCE 0,45
Proteobacteri
Gram positiva Mycoplama genitalium 0,58 479 831
Proteobacteri Buchnera sp. APS 0,64 564 881
Gram negativa Haemophilus influenzae 1,8 1.727 959
Cianobacteri Synechocystis sp. 3,6 3.168 880
Gram positiva Bacillus subtilis 4,2 4.100 976
Proteobacteri Escherichia coli 4,6 4.288 932

Taula 1. Grandària del genoma, nombre de gens i densitat gènica

Mecanismes molecularsque alteren la grandària del genoma

Són molts els mecanismes mutacionals que poden produir canvis en la grandària del genoma. Alguns d’ells ocorren a gran escala (duplicació de tot el genoma), mentre que altres ocorren a una escala molt petita (pèrdua o guany d’uns pocs nucleòtids). Tot i això, cal destacar que aquestes mutacions afecten, en principi, una sola cèl·lula, que en el cas de ser un gàmeta, podrà transmetre aquesta mutació a un descendent. Aquest individu haurà de conviure amb altres en una població i només en futures generacions sabrem si la mutació que porta s’estendrà a tots els individus de la població (fixació) o, al contrari, desapareixerà. La probabilitat que ocórrega una cosa o l’altra dependrà de mecanismes evolutius com la selecció natural (si aporta un avantatge o desavantatge a l’individu) o la deriva genètica (per atzar).

Els mecanismes cromosòmics solen produir variacions dràstiques amb una única mutació. Es pot destacar la duplicació de tot el genoma, duplicacions que afecten només un cromosoma, o una part. De manera equivalent, també es coneixen mutacions que produeixen la pèrdua d’algun fragment cromosòmic. Encara que igualment freqüent en plantes i animals, sembla que en les primeres aquesta mena de canvis han contribuït de forma rellevant a l’evolució del seu genoma.

«Es pot afirmar que “organismes més complexos tenen més funcions gèniques”»

Els elements genètics mòbils, o elements transponibles, són altres dels causants de grans variacions en la grandària del genoma. Aquests elements, d’uns pocs milers de nucleòtids, es dupliquen i les còpies duplicades s’insereixen en altres parts del genoma, la qual cosa provoca ràpids augments en la seua grandària, llevat que actuen els mecanismes de control de la seua proliferació. (Com a autèntics egoistes desenvolupen mecanismes per a regular el seu moviment pel genoma, de manera que no produesquen danys irreparables, ja que això implicaria la seua pròpia desaparició.) S’ha estimat que el genoma de la dacsa s’ha duplicat per causa dels elements transponibles en els últims tres milions d’anys de la seua evolució.

Es considera que les insercions o delecions espontànies (anomenades indels) d’uns pocs nucleòtids són una de les causes més importants de l’evolució de la grandària del genoma a llarg termini. En diverses espècies d’insectes, per exemple, s’ha mostrat una gran correlació entre la taxa global de pèrdua de DNA de les regions intergèniques i no codificants i la grandària del genoma. La fixació d’aquestes mutacions és molt improbable si l’indel afecta un gen, però és més probable si afecta pseudogens (gens no funcionals, inactivats recentment) o altres seqüències de DNA sense funció. La desintegració dels gens, o desaparició d’un gen del genoma, sol transcórrer en un primer pas amb la seua inactivació mitjançant una mutació puntual (formació d’un pseudogèn). Posteriorment, el DNA que forma els pseudogens va sent eliminat fins que es perd qualsevol vestigi de la seua presència en el genoma.

La variació en la longitud del DNA dels minisatèl·lits i microsatèl·lits és un altre dels mecanismes que poden alterar la grandària del genoma. Aquestes seqüències estan formades per una unitat de pocs nucleòtids, repetida de forma contigua des de menys de deu fins a uns quants milers de vegades. El nombre d’unitats repetides varia molt, fins i tot en individus de la mateixa espècie. Això és a causa de dos mecanismes que provoquen tant l’augment com la disminució del nombre de repeticions. Aquests mecanismes són la recombinació, anomenada desigual, i errors durant la replicació del DNA, a causa del fenomen conegut com el lliscament de la DNA polimerasa. De fet, aquestes són les seqüències que s’estan utilitzant per a, per exemple, identificar restes humanes, a causa de la seua gran variabilitat.

Un dels processos de major importància en l’augment de la grandària del genoma en organismes unicel·lulars, especialment procariotes, és la transferència genètica horitzontal. Aquest procés consisteix a introduir en el genoma d’una espècie un fragment de DNA d’una altra espècie, que conté un o diversos gens. El DNA s’introdueix en la cèl·lula per diferents mecanismes i després ha de recombinar amb el genoma. Si els gens introduïts confereixen algun avantatge a l’organisme, solen mantenir-se, però si açò no ocorre poden mutar i inactivar-se. Un exemple de la importància d’aquests processos es pot veure en el bacteri intestinal Escherichia coli, algunes de les soques del qual s’han tornat patògenes per la transferència de gens de virulència. La importància d’aquest fenomen en períodes recents de l’evolució d’organismes superiors és molt més limitada, encara que hi ha molts casos descrits de transferència genètica intracel·lular de DNA del genoma de les mitocòndries i cloroplastos al genoma nuclear.

Totes aquestes mutacions sorgeixen de forma periòdica en multitud d’espècies, inclosa l’espècie humana. Moltes són desavantatjoses i la pressió selectiva les va eliminant de la població, d’altres, individualment, són neutres però poden ser col·lectivament avantatjoses o perjudicials si augmenten o disminueixen la grandària del genoma. En bacteris, tenir un genoma reduït pot ser positiu per a optimar el temps i cost de la duplicació del DNA. En organismes eucariotes, s’han proposats diversos avantatges quan el genoma disposa d’una gran extensió, encara que no vaja associada a un nombre més alt de gens.

© Mètode 2013 - 32. Què hi ha darrere del genoma? - Hivern 2001/02
Institut Cavanilles de Biodiversitat i Biologia Evolutiva de la Universitat de València.
Institut Cavanilles de Biodiversitat i Biologia Evolutiva de la Universitat de València.