genÒmica comparadabioinformatica.uab.es/base/documents/mastergp... · = k/2t on t és el temps des...

14
5/7/2012 1 GENÒMICA COMPARADA GENÒMICA COMPARADA Canvis a nivell nucleotídic Canvis a nivell cromosòmic Mutació Destí dels nous canvis introduïts al DNA Neutra Perjudicial Beneficiosa Fixació per l ii Deriva èi Eliminació per l ó f d seleccpositiva genètica selecció purificadora Tasa de substitución neutra

Upload: others

Post on 19-Aug-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

1

GENÒMICA COMPARADAGENÒMICA COMPARADA

Canvis a nivell nucleotídicCanvis a nivell cromosòmic

Mutació

Destí dels nous canvis introduïts al DNA

Neutra PerjudicialBeneficiosa

Fixació per l ió i i

Deriva è i

Eliminació per l ó f dselecció positiva genètica selecció purificadora

Tasa de substitución neutra

Page 2: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

2

Teoria neutralista de l’evolució molecular

La gran majoria de canvis a nivell molecular estan causats per acció de la deriva genètica (atzar) actuant sobre canvis neutres (que no afectenl’eficàcia biològica dels individus). 

Mutacions neutres

Teoria neutralista de l’evolució molecular

Taxa de mutació (µ) Taxa d’incorporació de canvis en una seqüèncianucleotídica durant el procés de replicació

Taxa de substitució (k) Taxa amb la que nous canvis es fixen en la població

Si les mutacions són neutres

k = (2n µ) (1/2N) = µ

Nombre de substitucions/generació = (mutacions/generació)  (probabilitat de fixació)

( µ) ( / ) µ

Esperem una taxa de substitució constant. La divergència neutra entre espècies depèn del temps de divergència i de la taxa de mutació

Page 3: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

3

Càlcul del nombre de substitucions nucleotídiques

CCAAATGCCGATGACGACCTGCTGCGCCAG

CCAAATGCGGATGACGATCTTCTGCGCCAG

Escherichia coli

Salmonella typhimurium

3 canvis/ ó

l3 4D

proporció de nucleòtids diferents

D és una estima mínima perquè poden existir posicions amb més d’una substitució. Correcció de Jukes i Cantor. 

D = 3 canvis

30 posicions= 0,1 canvis/posició

K = ‐ ∙ ln 1 ‐34

4D3

nombre de substitucions / posició

Taxa de substitució per milió d'anys: = K/2T      on T és el temps des del avantpassat comú més recent 

• El nombre de substitucions nucleotídiques (neutres) en regions no

Comparació entre el genoma humà i el del ratolí

• El nombre de substitucions nucleotídiques (neutres) en regions no funcionals (repeticions ancestrals) és 0,46‐0,47 substitucions per posició (67% identitat).

• El nombre de substitucions nucleotídiques a les terceres posicions dels codons (llocs amb degeneració quàdruple) és 0,46‐0,47 substitucions per posició (67% identitat).

• Almenys el 5% del genoma mostra evidències d'importància y g pfuncional, és a dir, una identitat superior a l'esperada donada la taxa de substitució neutra.

• Aquesta fracció inclou: exons (1.5%), UTR (1%), RNAs que no codifiquen proteïnes, regions reguladores de l'expressió i elements estructurals dels cromosomes.

Waterston et al. 2002 Nature 420:520‐62.

Page 4: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

4

• 481 regions de> 200 bp 100% idèntiques entre humà, rata i ratolí (> 5000 regions de> 100 bp 100%

Regions ultraconservades al genoma humà

rata i ratolí (  5000 regions de  100 bp 100% idèntiques)

• 111 solapen mRNAs (exòniques)

• 256 no solapen mRNAs (no exons)‐ 100 intròniques‐ 156 intergèniques156 intergèniques

• 114 evidència no concloent.

Bejerano et al. 2004 Science  304: 1321‐1325 

*

*

Regiones ultraconservadas exónicas

*

*

*

Regiones ultraconservadas no-exónicas

Page 5: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

5

mel/psemel/buzpse/buz

Negre et al. 2005 Genome Research

Anàlisi comparatiu dels genomes de 29 mamífers

E i l f ió l

Lindblad‐Toh et al. (2011) Nature

Es va estimar la fracció total del genoma sota constrenyiment  evolutiu en el 5,4%. Es van detectar 3,6 milions d'elements (mida mitjana 36 bp) que abasten el 4,2% del genoma

Page 6: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

6

Ratio Ka/Ks

Ka = substitucions per posició no‐sinònima

K b i i i ió i ò i

ATGCCACGCGCC…

Met Pro Arg Gly

A les regions codificants podem distingir dos tipus de posicions nucleotídiques:

Ks = substitucions per posició sinònima

La proporció o ratio Ka/Ks ens indica el tipusde selecció que actúa sobre el gen.

Ka/Ks = 1 Totes les substitucions són neutres. Tants canvis sinònims com no‐i ò i P d

Posicions no‐sinònimesPosicions sinònimes

sinònims. Pseudogens.

Ka/Ks < 1 Selecció purificadora. Més canvissinònims que no‐sinònims. Majoria de gens.

Ka/Ks > 1 Selecció positiva.  Més canvis no‐sinònims que sinònims.                        Excepcional.

Comparació entre el genoma humà i el del ratolíAnàlisi de las selecció en 12.845 gens ortòlegs

Amino acid identity (%) KA/KS

% amino acid identity (%) for 1:1 human/mouse ortologues

Amino acid identity (%)      KA/KS

Page 7: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

7

Comparació entre el genoma humà i el del ximpanzé

Comparació de 13.454 gens ortòlegs 1:1

KA/KS = 0.23KA/KI = 0.23

585 gens (4.4%) amb KA/KI > 1

Exemples:Glycophorin C,Granulysin,Protamines and semenogelins, Mas‐related gene family

The Chimpanzee Sequencing and AnalysisConsortium 2005 Nature

Anàlisi de las selecció al genome de 29 mamífers

• Forta selecció purificadora (dN/dS < 0,5) per el 84,2% de codons i selecció positiva (dN/dS >1.5) en el 2,4% dels codons (94,1% dels codons amb dN/dS<1 y 5,9% dels codons amb dN/dS >1).

d l• 15.383 codons seleccionats positivament en 4.431 proteïnes. Lesgens es divideixen en tres classes: 

‐ 84,8% mostren selecció purificadora alt i uniforme,

‐ 8,9% presenten selecció positiva distribuida a través de la seva longitud i

‐ 6,3% mostren selecció positiva localitzada concentrada en petits grups.

• Categories funcionals:

b l ó d b d ó d l• Gens amb selecció positiva distribuïda: resposta immune, percepció del gust, segregació dels cromosomes meiòtics i regulació de la transcripció.

• Selecció positiva localitzada: processos bioquímics centrals com ara moviment basat als microtúbuls, canvis topològics al ADN i manteniment dels telòmers.

Lindblad‐Toh et al. (2011) Nature

Page 8: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

8

Evidence for negative and positive selection

a b c d e f

a b e f a b c d e f

w x

a b

w x c d e f

z

y z y

Reordenacions cromosòmiques

a b e fDELECIÓ

a b c d e f

a b c d e fINSERCIÓ

a b c d e f a b zTRANSLOCACIÓ

a b c d e f

a b c d e f

a b c d e fc

INSERCIÓ

DUPLICACIÓ

a e d c b f

INVERSIÓ

Page 9: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

9

Unequal crossing over Retroposition

Mecanismes de duplicació gènica

Figure 1. Kaessmann (2010) Genome Research 20: 1313‐1326 

Destí d’un gen duplicat

DUPLICACIÓ GÈNICA

S b f i li ió N f i lit ió

PseudogenitzacióConversió d’una còpia en pseudogen i/o eliminació

Sub‐funcionalitzacióRepartiment de funcionsentre les dues còpies

Neo‐funcionalitzacióAdquisició d’una nova funcióper part d’una de les còpies

Page 10: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

10

Duplicacions gèniques funcionals

SUBFUNCIONALITZACIÓGen engrailed al peix zebra

Danio rerio

NEOFUNCIONALITZACIÓOpsines en humans i micos del vell món

Figure 7. Force et al. (1999) Genetics 151: 1531–1545

Red Green

Figure 7. Dulai et al. (1999) Genome Research 9: 629‐638 

Duplicació d’un gen

Gens ortòlegs i paràlegs

Present

Especiació

Espècie 1 Espècie 2

PARÀLEGS PARÀLEGS

ORTÒLEGS ORTÒLEGS

HOMÒLEGS

Gens ortòlegs Derivats d’un procés d’especiació

Gens paràlegs Derivats d’una duplicació i membres d’una família multigènica

Page 11: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

11

Guanys de gens: 43

Pèrdues de gens: 28

D. melanogaster

D. simulans

51

5151

51

5151

Evolució d’una família multigènica

Odorant binding proteins (OBP) al gènere Drosophila

Gens funcionals Pseudogens

Pèrdues de gens: 28

Pseudogens: 13 D. sechellia

D. yakuba

D. erecta

D. ananassae

D. pseudoobscura

50 (1)

54 (1)

49 (2)

49 (1)

44 (2)

45

47 51

44

51

53(1)

02(0)

41(1)

13(2)

20(0)

1

40(0)

12(2)

01(1)51

47

50 (1)

54 (1)

49 (2)

49 (1)

44 (2)

45

47 51

44

51

53(1)

02(0)

41(1)

13(2)

20(0)

1

40(0)

12(2)

01(1)51

47

D. persimilis

D. willistoni

D. mojavensis

D. virilis

D. grimshawi

44 (2)

61 (2)

42

40 (1)

45 (3)

47

42

44

162(2)

11(0)

02(1)

85(3)

1(0)

05(0)

2(2)

42

44 (2)

61 (2)

42

40 (1)

45 (3)

47

42

44

162(2)

11(0)

02(1)

85(3)

1(0)

05(0)

2(2)

42

Figura 1. Vieira et al. (2007) Genome Biology 8: R235. 

Duplicacionsdel genoma complet

Box 1. Van de Peer et al. (2009) Nature Reviews Genetics 10: 725‐732

Page 12: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

12

Generació d'una inversió cromosòmica per recombinació ectòpica entre còpies d'un transposó

Cáceres et al. 1999 Science

Generació d'una inversió cromosòmica pertrencaments escalonades i reparació (NHEJ)

Ranz et al. 2007 PLoS Biology

Page 13: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

13

Segments sintènics

Les reordenacions cromosòmiques canvien l’ordrei orientació dels segments sintènics

Figure 2. Pevzner and Tesler (2003) PNAS 100: 7672‐7677

Segments sintènics

Segment sintènic Grup de gens situats en el mateix ordre en la comparació de genomes de diferentes espècies

Figure 3. Mouse Genome Sequencing Consortium (2002) Nature 420: 520‐562.

342 segments >300 kb conservats entre els genomes d’humans i ratolí (mida mitjana = 6,9 Mb) que impliquen 295 reordenacions cromosòmiques

Page 14: GENÒMICA COMPARADAbioinformatica.uab.es/base/documents/masterGP... · = K/2T on T és el temps des del avantpassat comú més recent • Elnombrede substitucionsnucleotídiques (neutres)enregions

5/7/2012

14

La taxa de fixació de reordenacions cromosòmiques varia molt entre llinatges

Taxa de fixació de reordenacions cromosòmiquesTaxa de fixació de reordenacions

Figure 1. Coghlan et al. (2005) Trends  in Genetics 21: 673‐682 

Taxa de fixació de reordenacions cromosòmiquesOrigen dels cromosomes sexuals

Figure 3. Graves and Peichel (2010) Genome Biology