tema 2 variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254...

37
Estadística - Grau de Nutrició Humana i Dietètica. Tema 2 1 TEMA 2 Variables estadístiques Dep. Estadística i Inv. Operativa Univ. de València

Upload: others

Post on 16-Jul-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

1

TEMA 2

Variables estadístiques

Dep. Estadística i Inv. Operativa

Univ. de València

Page 2: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

2

Una variable és una característica observable que varia entre els

diferents individus d’una població. La informació que disposem de cada

individu es resumida en variables.

Prenent com a població els individus que viuen a la Comunitat

Valenciana, són variables:

Grup sanguini: A,B,AB,O

Nombre de fills: {0,1,2,3,...}

Sexe: M, F

Nivell d’estudis: Sense, Elemental, Mitjà, Superior

Glucosa en sang basal: [70,400]

Variables

Un individu d’aquesta població pot tindre els següents valors:

Grup sanguini: A Nombre de fills: 2 Sexe: M Nivell d’estudis: Superior

Glucosa en sang basal: 110

Page 3: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

3

No totes les variables tenen el mateix tractament estadístic, distingim entre:

Tipus de Variables

Qualitatives o Categòriques

Si els seus valors (categories) no es poden associar de forma natural a un valor numèric (no es raonable fer operacions amb ells)

Nominals: Els seus valors no es poden ordenar

• Grup Sanguini, Sexe, Estat civil, Fumador, Color,…

Ordinals: Els seus valors si que es poden ordenar

• Nivell d’estudis, Estat d’una malaltia (incipient, avançada, crònica), Grau d’un esquinç (1er, 2n, 3er), Gravetat d’una cremada, …

Quantitatives o Numèriques

Si els seus valors són numèrics (té sentit fer operacions amb ells)

Discretes: Si prenen valors enters

• Nombre de fills, Nombre de viatges d’autobús utilitzats en un mes, Bolons tombats en una tirada, Morts en carretera el cap de setmana,…

Contínues: Si entre dos valors, són possibles tots els valors intermedis.

• Pes, Tensió arterial, Glucosa en sang, Temperatura, Altura,…

Page 4: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

4

Agrupar els valors d’una variable numèrica per a interpretar-la millor és

habitual. Per exemple, un nivell de glucosa de 90 mg/dl no és diferencia

(des del punt de vista mèdic) d’una glucosa de 100 mg/dl. En eixe cas, els

valors originals poden agrupar-se en classes o ser codificats.

Transformació de Variables Numèriques

La codificació dels valors de les variables mitjançant números és un bon recursper a processar-les amb facilitat.

D’aquesta forma hauríem convertit una variable quantitativa (nivell de Glucosa) enuna altra qualitativa ordinal, però simplement per conveniència. Ens convindria lavariable original per a traure una mitjana o altre càlcul i ens convindria l’altra per a ferun diagrama de barres o de sectors, per exemple.

De vegades convé codificar valors perduts “missing values” amb valors diferents.Per exemple, si s’ha perdut el nivell de glucosa d’un pacient, podríem assignar el valor-1 i caldria excloure aquest valor dels càlculs. En les enquestes és costum assignar elcodi 99 a la resposta “No sap no contesta”.

Glucosa ≤ 72 mg/dl Glucosa Baixa 0

72 < Glucosa ≤ 110 Glucosa Óptima 1

110 < Glucosa ≤ 180 Glucosa Alta 2

180 < Glucosa Glucosa Molt Alta 3

Codificació4 Classes

Page 5: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

5

Representacions gràfiques: Exemple 2.1

Variable: Grup sanguini (Categòrica no ordinal)

Valors (sense atendre al Rh): A,B,AB,O.

Diagrama de barresTaula de freqüències

Moda: El nivell observat més freqüent A en aquest cas

GrupFreq.

Absoluta

Freq.

Relativa

A 197 43,3%

B 58 12,7%

AB 18 4,0%

O 182 40,0%

Total 455 100,0%

Tornar

Page 6: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

6

Exemple 2.1 (cont.)

Diagrama de sectors: Cada sector és d’un àrea (angle) proporcional a la

freqüència relativa de la categoria.

Anomenats també

DIAGRAMES DE TARTA

Page 7: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

7

Diagrama de punts: Exemple 2.2

Variable: Nivell d’atenció d’aquest hospital. (Categòrica Ordinal)

Valors: 0,1,2,3,4,5 (Molt dolent, Dolent, Regular, Normal, Bo, Excel·lent).

Mostra: 0,1,5,4,3,3,0,3,2,1,2,5,5,4,2,1,5,2,3,3,1,3,5

0 1 2 3 4 5

Diagrama de punts

Page 8: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

8

Histogrames: Exemple 2.3

La creatina fosfokinasa (CK) és un enzim relacionat amb el funcionament del cervell i

dels músculs. Com a part d’un estudi encaminat a determinar la variació natural de la

concentració de CK, es va traure sang de 36 homes voluntaris, Les concentracions de

sèrum CK ( mesurades en U/l) dels quals són:

Variable: Concentració de sèrum CK U/l

Mostra: Homes voluntaris

Grandària mostral: 36

Quantitativa

contínua

Amb una variable quantitativa contínua el més adequat és agrupar les dades en classes i

després fer una gràfica apropiada: Histograma, Diagrama de tija i fulles,…

121 82 100 151 68 58 95 145 64

201 101 163 84 57 139 60 78 94

119 104 110 113 118 203 62 83 67

93 92 110 25 123 70 48 95 42

Page 9: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

9

Exemple 2.3 (Continuació)

Com construir un histograma

Observacions preliminars: Valor mínim: 25 Valor màxim: 203 Rang: 178

Nombre de classes n Tenim n=36, 36=6 , construïm 7 classes, per exemple,

Amplària classes Rang/Nom. classes 187/7 = 25,42 i arrodonim a 30 (sempre per excés)

Classes Comptadors Freqüència

(20,50] 3

(50,80] 9

(80,110] 13

(110,140] 6

(140,170] 3

(170,200] 0

(200,230] 2

Total 36

Page 10: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

10

Histogrames

Valors de la variable

en l’eix X

Freqüència en

Ordenades

Barres unides amb

àrea proporcional a

la freqüència

Marques de classe

La construcció d’un histograma no és única !!!

Page 11: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

11

Histogrames: Nombre de classes

12 classes semblen

moltes

3 classes són

insuficients

Page 12: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

12

Diagrames de tija i fulles: Exemple 2.4

Com a part d’un experiment farmacològic, 31 rates de laboratori

varen estar sense aigua durant 23 hores i aleshores se’ls va

permetre l’accés a l’aigua durant una hora. Les quantitats d’aigua

consumida (ml) durant eixa hora són:

10,6 14,3 11,5 18,4 11,8 14,1 13,0

9,4 17,4 15,8 13,7 12,6 16,5 11,1

13,5 15,2 12,0 13,7 15,8 15,4 14,0

14,7 17,0 12,5 10,0 16,6 13,6 12,9

18,2 11,4 16,6

Un diagrama de tija i fulles és un gràfic fet amb números, on es separa la tija

o part principal del valor de la fulla o part secundària. Es sembla a un

histograma gitat. La font utilitzada per a fer el gràfic és la Courier.

Page 13: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

13

Diagrames de tija i fulles (cont.)

9 4

10 0 6

11 1 4 5 8

12 0 5 6 9

13 0 5 6 7 7

14 0 1 3 7

15 2 4 8 8

16 5 6 6

17 0 4

18 2 4

Tija Fulles

Correspon al valor 9,4

(mínim)

Hi ha 4 valors amb tija ’15’: 15,2 15,4 15,8 i 15,8

La diferència amb un histograma és que no perdem la informació de la mostra.

De vegades, la tija pot estar afectada d’un factor, per exemple 10 (amplària =

width) en eixe cas els valors serien 152, 154, 158,...

Page 14: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

14

Representacions numèriques: Paràmetres i Estadístics

Paràmetre: És una quantitat numèrica calculada sobre una població.

La altura mitjana dels individus d’un país, la renda per càpita,…

La idea és resumir la informació més rellevant d’una població en uns pocs valors (paràmetres).

Estadístic: Igual que l’anterior canviant població per mostra.

L’altura mitjana dels que estem aquí. Som una mostra representativa de la població?

Si un estadístic s’utilitza per aproximar un paràmetre rep el nom d’estimador. El valor de

l’estadístic que s’obté d’una mostra rep el nom d’estimació.

Normalment ens interessa conèixer un paràmetre, però per la dificultat/impossibilitat que comporta

estudiar a TOTA la població, calculem el valor d’un estimador sobre una mostra i “confiem” que estiguen

pròxims. Més endavant veurem de quina grandària cal elegir les mostres per a que l’error siga

“sensiblement” xicotet.

Cal distingir diversos tipus d’estadístics segons la seua finalitat, els veurem a continuació.

Page 15: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

15

Tipus d’Estadístics

Tendència central o centralització: Proporcionen valors al voltant dels quals els de la mostra

tendeixen a agrupar-se.

Mitjana, mediana.

Localització: Divideixen la mostra ordenada en grups amb el mateix nombre de valors o

marquen punts amb qualitats especials.

Quantils, percentils, decils, quartils, modes,…

Dispersió: Ens donen valors que representen la “separació” de les dades entre sí i/o respecte

a la seua mitjana.

Rang o Amplitud, Variància, Desviació típica o estàndard, Coeficient de variació.

Forma: Produeixen valors que donen idea de l’assimetria o biaix, o del grau d’aplastament o

curtosi respecte de la normalitat.

Coeficients d’assimetria, Curtosi,…

ESTADÍSTIC: És una mesura obtinguda a partir dels valors d’una variable

quantitativa en una mostra. Hi han de diversos tipus:

Page 16: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Ja hem vist una taula de freqüències en la diapositiva 6, si la variable és quantitativa contínua cal fer

un agrupament de les dades en classes per a que la taula de freqüències siga útil.

El programa SPSS construeix fàcilment una taula de freqüències / histograma com aquests:

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

16

Taules de freqüències

imagen

Frecuencia Porcentaje Porcentaje

válido Porcentaje acumulado

Válidos engorda 374 8,0 8,0 8,0

hombres 238 5,1 5,1 13,1

SudAustraliano 268 5,7 5,7 18,9

tradicional 186 4,0 4,0 22,9

superior 196 4,2 4,2 27,1

sano 249 5,3 5,3 32,4

cafeína 217 4,7 4,7 37,1

nuevo 219 4,7 4,7 41,8

atractivo 190 4,1 4,1 45,8

duro 182 3,9 3,9 49,7

popular 279 6,0 6,0 55,7

curativo 119 2,6 2,6 58,3

bajo en grasa 242 5,2 5,2 63,5

niños 114 2,4 2,4 65,9

trabajando 209 4,5 4,5 70,4

dulce 177 3,8 3,8 74,2

impopular 112 2,4 2,4 76,6

feo 140 3,0 3,0 79,6

fresco 167 3,6 3,6 83,2

yupis 157 3,4 3,4 86,6

nutritivo 185 4,0 4,0 90,5

mujeres 254 5,4 5,4 96,0

secundario 188 4,0 4,0 100,0

Total 4662 100,0 100,0

Taula extreta de l’arxiu

coffee.sav

Histograma extret de l’arxiu

salarios.sav

Page 17: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

17

Estadístics de centralització: Mitjana i Mediana

Mostra

Mitjana: És el centre de gravetat de les dades i les utilitza totes. Per contra és molt

sensible als valors extrems. Es calcula així:

Mediana: Primer cal ordenar la mostra de menor a major i després agafar el valor que

divideix a la mostra ordenada en dos parts amb el mateix nombre de dades.

Mostra ordenada: 158, 162, 164, 167, 175, 176, 182, 188

n=8 (parell) mediana = (167+175)/2 = 171.Si la mostra no té un nombre parell de dades, la mediana coincideix amb el valor de la mostra

ordenada que ocupa el lloc

La mediana no és tan sensible als valors extrems com la mitjana però en el seu càlcul no intervenen

tots els valors de la mostra.

Com podem observar la mitjana i la mediana poden no coincidir, en aquest cas estan molt pròximes

cosa que és indicativa de simetria.

Si una mostra és simètrica respecte al seu centre de gravetat, la mediana i la mitjana coincideixen,

per exemple: 19, 28, 21, 33, 3, 37, 7, 12, 20.

1

2

n

1

1 1(175 164 188 176 167 158 162 182) 171,5

8

n

i

i

x xn

175, 164, 188, 176, 167, 158, 162, 182

x1 x2 x3 x4 x5 x6 x7 x8

n=8

Page 18: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

18

Estadístics de localitzacióDefinim quantil d’ordre 0< al valor de la variable sota el qual hi ha unafreqüència acumulada . Els percentils, quartils i decils són casosparticulars.

mitjana

1,40

mediana0

,05

q1

-0,74

p.20

-1,15

p.05

-5,36p.70

0,88

p.90

4,18

p.95

8,54

5%

50%

Page 19: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

19

Exemple: Llenguatge tècnic

El 5% dels nadons tenen un pes molt baix. (Col·loquialment)

El colesterol es distribueix simètricament en la població. Es consideren patològics

els valors extrems. El 90% dels individus són normals.

Quin pes ja es

considera “molt baix”?

Percentil 5é ó

quantil 0,05

Quin pes és superat pel

25% dels individus?Percentil 75é ó

quantil 0,75.

Entre quins valors es

troben els individus

normals?

Entre el percentil 5é i el 95é o

entre els quantils 0,05 i 0,95.

Entre quins valors es

troben la meitat dels

individus “més normals”

d’una població?

Entre el quartil 1er i 3er o

entre els quantils 0,25 i 0,75.

Page 20: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

20

Utilitzant una taula de freqüènciesEstadísticos

Número de años de escolarización

1508

0

12,90

12,00

12

9,00

11,00

12,00

12,00

12,00

12,00

13,00

14,00

15,00

16,00

16,00

Válidos

Perdidos

N

Media

Mediana

Moda

10

20

25

30

40

50

60

70

75

80

90

Percenti les

Número de años de escolarización

5 ,3 ,3

5 ,3 ,7

6 ,4 1,1

12 ,8 1,9

25 1,7 3,5

68 4,5 8,0

56 3,7 11,7

73 4,8 16,6

85 5,6 22,2

461 30,6 52,8

130 8,6 61,4

175 11,6 73,0

73 4,8 77,9

194 12,9 90,7

43 2,9 93,6

45 3,0 96,6

22 1,5 98,0

30 2,0 100,0

1508 100,0

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Total

Frecuencia Porcentaje

Porcentaje

acumulado

≥20%

≥ 90%

≥80%

Localització

de percentils

Page 21: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

21

Posicions relatives de mitjana i mediana

24.020.016.012.08.04.00.0

16

14

12

10

8

6

4

2

0

Desv. típ. = 4.43

Media = 4.3

N = 51.00

Mitjana 4,43

Mediana 3,7

La mitjana és més

sensible als

valors extrems que la

mediana.

Page 22: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

22

Els estudiants de Bioestadística obtenen diferents qualificacions (variabilitat)

en l’assignatura. Qué pot generar açò?

Variabilitat o dispersió

Explicació acadèmica: Diferències individuals en el coneixement de la matèria.

Altres fonts de variabilitat Coneixements (no controlables): Suposem que tots els alumnes tenen el mateix nivell de

coneixements. Les notes serien les mateixes en tots? Segurament No.

Personals: Dormir poc el dia anterior de l’examen, control dels nervis, manca de

concentració, velocitat de resposta, problemes personals,… (Variabilitat entre individus no

degudes al que estem mesurant).

Error en l’instrument de mesura: L’examen no és una mesura perfecta del coneixement

(Variabilitat per error de mesura).

Si l’examen és de tipus test: Si es dubta entre diverses opcions i triant a l’atzar es tria una errònia.

(Variabilitat per atzar, aleatorietat).

Page 23: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

23

Mesurant la variabilitat (1)Les mesures de localització i/o centralització no mesuren la variabilitat. Dues

mostres diferents poden tindre la mateixa mitjana i mediana, etc… i ser

completament diferents.

Mitjana=Mediana= 40

0, 20, 40x7, 60, 800x5, 40, 80x5

Mitjana=Mediana= 40

Les dues mostres tenen variabilitat diferent

Page 24: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

24

Mesurant la variabilitat (2)

• Rang o Amplitud: Diferència entre els valors màxim i mínim.

• Rang interquartílic: IRQ = Q3 – Q1

• Variància:

• Desviació típica o estàndard:

Regla 68-95-99 de la Desviació típica o estàndard

En distribucions aproximadament simètriques i unimodals:

Aproximadament el 68% de les observacions estan en

Aproximadament el 95% de les observacions estan en

Aproximadament el 99% de les observacions estan en

x s

2x s3x s

2 2 2 2

1 1

1 1( ) ( )

1 1

n n

i i

i i

s x x x nxn n

2

2( )

1

ix xs s

n

Page 25: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

25

Coeficient de Variació

És la raó entre la desviació típica i la mitjana.

S’anomena també variabilitat/dispersió relativa. Es representa en %. No té dimensions.

Els enginyiers electrònics parlen de la relació senyal (mitjana) soroll (desviació típica) és

a dir la inversa del CV.

Permet fer comparacions entre mostres i fins i tot amb diferents variables.

sCV

x

1 1

11

1

Mostra 1

12 . 3 .

30.25 (25%)

12

x cm s cm

sCV

x

2 2

22

2

Mostra 2

27 . 7 .

70.2592 ( 26%)

27

x kg s kg

sCV

x

Les dues mostres tenen

una dispersió relativa

semblant (observem que

les unitats són diferents).

Page 26: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

26

Mesures de forma

Assimetria o Biaix: És la mesura que

determina el grau d’allunyament d’una

distribució respecte d’una simètrica. En

una distribució simètrica com la Normal

(campana de Gauss) la assimetria val 0.

L’assimetria és positiva o negativa

depenent de quin és el costat de la cua

més llarga de la distribució. La mitjana

tendeix a desplaçar-se cap als valors més

extrems de la distribució, mentre que la

mediana no.

Les discrepàncies entre la mediana i la

mitjana són indicatives de l’assimetria.

Hi ha diversos estadístics per a mesurar

el biaix, anomenats coeficients

d’assimetria.

Coeficient d’Assimetria > 0

Page 27: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

27

Apuntament o Curtosi

Curtosi: Mesura el grau

d’apuntament o aplatament d’una

distribució respecte de la Normal.

La curtosi d’una Normal és 0.

Platicúrtica

8481787572696663605754514845

Fre

cu

en

cia

160

140

120

100

80

60

40

Leptocúrtica

138

108

102

97

92

87

82

77

72

67

62

57

52

47

42

37

32

27

16

3

Fre

cu

en

cia

400

300

200

100

0

Mesocúrtica

99

93

89

85

81

77

73

69

65

61

57

53

49

45

41

37

32

27

Fre

cu

en

cia

300

200

100

0

Platicúrtica: Curtosi

Negativa (més xafada

que la Normal, cues

més curtes)

Leptocúrtica: Curtosi

Positiva (concentració

major entorn al centre i

cues més llargues)

Mesocúrtica:

Curtosi aprox. 0

Page 28: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

28

Exercici: Mira i respon

Descriptivos para Número de hijos

1,90 ,045

1,81

1,99

1,75

2,00

3,114

1,765

0

8

8

3,00

1,034 ,063

1,060 ,126

Media

Límite

inferior

Límite

superior

Intervalo de

confianza para la

media al 95%

Media recortada al 5%

Mediana

Varianza

Desv. típ.

Mínimo

Máximo

Rango

Amplitud intercuartil

Asimetría

Curtos is

Estadístico Error típ.

• Ombrejat està tot el que sabem interpretar fins ara. Ho comprens tot? Quina és la variable i de quin tipus és? Quines unitats té cada estadístic? Quina és la variabilitat relativa?

• Calcula els estadístics que pugues basan-te només en el gràfic de barres? Quin biaix presenta la distribució?

Una raó entre l’estadístic i l’error

típic, en valor absolut, major que

2 indica un allunyament important

de la normalitat.

Page 29: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

29

Diagrames de caixa i bigots (box & whiskers)

Tornem a l’exemple del consum d’aigua de 31 rates.

9 4

10 0 6

11 1 4 5 8

12 0 5 6 9

13 0 5 6 7 7

14 0 1 3 7

15 2 4 8 8

16 5 6 6

17 0 4

18 2 4

Q1=12,0

Q2=13,7

Q3=15,8

Mediana

• La longitud dels bigots no pot ser més llarga que 1,5 vegades el rang interquartílic

(IRQ). En principi, s’estenen fins al valor màxim i mínim, respectivament.

• Si hi han valors que superen la longitud màxima dels bigots, s’anomenen valors

extrems o atípics (outliers), es representen separadament (per punts o asteriscs) i els

bigots es retallen fins al primer valor no extrem.

Mín

Màx

Q1

Q3

25%

25%

Page 30: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

30

Comparacions amb els diagrames de caixes

El següent gràfic compara cinc tipus de fertilitzants, la variable és la longitud d’un

mateix tipus de planta, després de ser nodrida amb un fertilitzant durant un temps,

en idèntiques condicions. Clarament el fertilitzant F2 és el millor i el F5 el pitjor, la

resta sembla que no tenen diferències molt importants.

F1 F2 F3 F4 F5

Page 31: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

31

Exemple 2.5: Utilitzant la forma d’un histograma

En 1977 uns paleontòlegs descobriren estructures fòssils microscòpiques, paregudes a

algues, en roques de 3.500 milions d’anys d’antiguitat. Una qüestió central fou si eixes

estructures eren d’origen biològic. Una línea d’argumentació es basà en la distribució de

les seues grandàries.

% d

e m

icro

estr

uctu

res

Els éssers vius segueixen

distribucions

morfològiques

(estatura, pes, longitud,…)

que solen ser normals

en forma acampanada

Page 32: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

32

Exemple 2.6: Utilitzant la forma d’un histograma

Un neurobiòleg observà les descàrregues de cèl·lules de músculs de rates que han estat

cultivades junt amb cèl·lules nervioses. Els intervals de temps entre 308 descàrregues

successives es distribuïren d’una forma exponencial.

Temps (seg.)

Nom

bre

d’in

terv

als

0

0,1xe

X

Page 33: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

33

De la mostra a la població

Distribució

mostral

Corba ajustada

Com serà la distribució de la població?

Page 34: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

34

Formes típiques de distribucions

(a) Simètrica, forma acampanada (b) Simètrica, sense forma de campana

(c) Esbiaixada a la dreta (d) Esbiaixada a l’esquerra

(e) Exponencial (f) Bimodal

Page 35: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

35

Consells per a la presentació de dades

La idea bàsica és transmetre al lector de forma clara la informació obtinguda de les dades.

Cal decidir primer quin missatge es vol transmetre i assegurar-se que eixe missatge descriu de forma clara i fidel les dades.

Fugir de la sobreabundància de taules i gràfiques.

Preguntar-se: Quina gràfica proporciona la informació més rellevant? Éixa deuria ser l’única representació inclosa en l’informe.

Només afegim altres representacions si proporcionen una informació nova i rellevant.

Page 36: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

36

Èmfasi en allò que és important

Cadascun dels tipus de representacions ressalta un

aspecte de les dades.

Al mateix temps, redueix la importància d’altres i

descarta part de la informació.

Dades

Aspectes resaltatsAspectes implícits

Aspectes descartats

Page 37: TEMA 2 Variables estadístiques · yupis 157 3,4 3,4 86,6 nutritivo 185 4,0 4,0 90,5 mujeres 254 5,4 5,4 96,0 secundario 188 4,0 4,0 100,0 Total 4662 100,0 100,0 Taula extreta de

Estadística - Grau de Nutrició

Humana i Dietètica. Tema 2

37

Expressar dades de la forma més simple

14,63610,02713,70525,062

10,25411,81919,03828,617

11,73413,11821,70336,092

14,13016,48224,61739,421

14,63610,02713,70525,062

10,25411,81919,03828,617

11,73413,11821,70336,092

14,13016,48224,61739,421

15101425

10121929

12132236

14162539

15101425

10121929

12132236

14162539