anàlisi multivariant d’unes dades morfomètriques
Post on 04-Jan-2016
34 Views
Preview:
DESCRIPTION
TRANSCRIPT
Departament d’EstadísticaDivisió de Ciències Experimentals i
Matemàtiques
Anàlisi multivariant d’unes dades morfomètriques
Llicenciatura de Biologia
Disseny d’Experiments i Anàlisi de Dades
Jordi Ocaña Rebull
Departament
d’Estadística
Hi ha relació entre la supervivència i mesures biomètriques als pardals?
49 pardals recollits per H.C. Bumpus desprès d’una tempesta, 21 sobrevisqueren. En mesurà:– X1: llargada total
– X2: amplitud alar
– X3: llargada de bec + cap
– X4: llargada de l’húmer
– X5: llargada de la quilla de l’esternó.
Raonà que hi havia selecció natural estabilitzant: Bumpus, H.C. (1898). The elimination of the unfit as illustrated by the introduced sparrow, Passer domesticus. Biologiacl Lectures, Marine Biology Laboratory, Woods Hole, 11th Lecture, pp.209-226.
Departament
d’Estadística
Anàlisi de les dades anteriors
No sembla que hi hagi diferències entre les mitjanes dels que han sobreviscut i els morts.
Correlacions entre variables:
1,000 ,735 ,662 ,645 ,605,735 1,000 ,674 ,769 ,529,662 ,674 1,000 ,763 ,526,645 ,769 ,763 1,000 ,607
,605 ,529 ,526 ,607 1,000
Totes significatives, i correlacions parcials no (signe d’estructuració). Altres proves d’estructura de la matriu de correlacions també significatives.
Departament
d’Estadística
Anàlisi de components principals
Provarem d’obtenir una nova variable, que sigui combinació lineal de les observades, t.q.
Una segona variable, incorrelacionada amb l’anterior i definida similarment, etc:
1 11 1 12 2 13 3 14 4 15 5
2 2 2 2 211 12 13 14 15
1
amb 1
t.q. var sigui màxima
P a X a X a X a X a X
a a a a a
P
2 21 1 22 2 23 3 24 4 25 5
2 2 2 2 221 22 23 24 25
2
2 1
amb 1
t.q. var sigui el més gran possible
(però lògicament var var )
P a X a X a X a X a X
a a a a a
P
P P
Departament
d’Estadística
Anàlisi de components principalsPesos dels coeficients de les components principals (segons Statgraphics 4.1)
Factor“grandària”?
Factor“forma”?
“rabassuderia”?
Component Component
1 2
------------ ------------
AmplitudAlar 0,461681 -0,299564
bec_cap 0,450542 -0,324572
humer 0,470739 -0,184684
Llargada 0,451799 0,0507214
quilla 0,397675 0,876489
Departament
d’Estadística
Variància explicada per les c.princ.
Els vectors anteriors a1, a2, ..., a3 són els “vectors propis” de la matriu de correlacions o de covariàncies de les dades, ordenats de major a menor “valor propi”
1 2 ... 5
var(Pi) = i
1 + 2 ... + 5 = var(X1) + ... + var(X5)
Departament
d’Estadística
Anàlisi de components principalspart de la sortida de Statgraphics 4.1
Component Percent of Cumulative
Number Eigenvalue Variance Percentage
1 3,61598 72,320 72,320
2 0,531504 10,630 82,950
3 0,386425 7,728 90,678
4 0,301566 6,031 96,709
5 0,164528 3,291 100,000
Departament
d’Estadística
Importància de les diverses components principals (Statgraphics 4.1)
La primera component principal “grandària corporal”(?) explica més del 72% de la variació d’aquestes dades.
Les dues primeres juntes, “grandària corporal”(?) i “forma”(???) casi el 83%.
Scree Plot
Component
Eig
enva
lue
0 1 2 3 4 50
1
2
3
4
Departament
d’Estadística
Gràfic de dispersió per 2 primeres components: selecció estabilitzant per “grandària”?
Si comparem les mitjanes dels dos grups per la variable “primera component principal” NO hi ha diferències.
SI que hi ha diferències molt significatives entre les variàncies dels dos grups: major dispersió pels morts.
Plot of PCOMP_2 vs PCOMP_1
PCOMP_1
PCO
MP_
2
Superviventnosi
270 280 290 300 310-2,9
-0,9
1,1
3,1
5,1
7,1
top related