maes.se, pv nuevo

55
MAESTRIA EN PRODUCCIÓN VEGETAL AREAS DE CONCENTRACIÓN Tecnología de Semillas Protección de Cultivos Estadística Aplicada Estructura de un experimento Profesor : Marco Koriyama V.

Upload: marco-koriyama

Post on 21-May-2017

225 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Maes.se, Pv Nuevo

MAESTRIA EN PRODUCCIÓN VEGETAL

AREAS DE CONCENTRACIÓNTecnología de SemillasProtección de Cultivos

•Estadística Aplicada•Estructura de un experimento

Profesor : Marco Koriyama V.

Page 2: Maes.se, Pv Nuevo

¿QUÉ ES LA ESTADÍSTICA? Según Allen (1996), Chao (1996), Yule y Kendal ( 1986) y

Rivas González ( 1993) la estadística es una ciencia (un conjunto de métodos) que se encarga de la: - Recolección - Clasificación - Presentación - Organización - Análisis - Interpretación De un conjunto de fenómenos, (naturales, económicos,

políticos o sociales) de manera metódica y numérica, que permitan extraer conclusiones de un hecho, en un momento determinado y así poder tomar decisiones valederas.

Page 3: Maes.se, Pv Nuevo

De acuerdo a Reyes (1990), la estadística es el arte y la ciencia de de recoger datos o reunir observaciones cuantificables (medibles o numéricas) y clasificables

TODO LO CONCERNIENTE A LA RECOLECCIÓN DE DATOS

Diseños Experimentales

TODO LO CONCERNIENTE A LA ORGANIZACIÓN, TABULACIÓN E INTERPRETACIÓN DE DATOS

Métodos Estadísticos

Page 4: Maes.se, Pv Nuevo

División de la Estadística

Estadística

Descriptiva

Inferencial

Page 5: Maes.se, Pv Nuevo

Estadística Descriptiva

• Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.

• Se puede definirse como aquel método que contiene la recolección, organización, presentación y resumen de una serie de datos.

• El mencionado resumen puede ser tabular, gráfico o numérico.

Page 6: Maes.se, Pv Nuevo

Describir

0

10

20

30

40

50

60

70

80

90

1er trim. 2do trim. 3er trim.

EsteOeste

Hombres

Si

No

Page 7: Maes.se, Pv Nuevo

Estadística Inferencial Es aquella rama de la estadística que apoyándose en

el cálculo de probabilidades y a partir de datos muéstrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

Puede definirse como aquella rama de la estadística que hace posible la estimación de una característica de una población o la toma de una decisión referente a una población, fundamentándose sólo en los resultados de la muestra.

Page 8: Maes.se, Pv Nuevo

Inferencial

Muestra Población

Page 9: Maes.se, Pv Nuevo
Page 10: Maes.se, Pv Nuevo

VARIABLE•La variable es una magnitud que puede tener un valor cualquiera de los comprendidos en un conjunto de valores de un estudio o investigación.

•Son todos aquellos datos u observaciones que pueden ser expresados mediante números, es decir, son características de una población determinada, susceptible de medició, las mismas pueden adoptar distintos valores o ser expresadas en varias categorías.

Page 11: Maes.se, Pv Nuevo

VARIBLES CUALITATIVAS O CATEGÓRICASSon aquellas variables cuyos valores son del tipo categórico, es decir; que indican categorías o son etiquetadas numéricamente o con nombres. Son las que se refieren a clasificaciones, como: estado civil, profesión, color de los ojos, preferencia por una marca etc., es decir, son aquellas que no aparecen en forma numérica, sino como categorías o atributos. Esta a su vez, se clasifica en:

CategóricasNominales: . A este

tipo de variable le corresponde las

escalas de medición nominal

Categóricas Ordinales: Presentan

un orden, corresponden las

escalas de medición ordinal.

Page 12: Maes.se, Pv Nuevo

Escala Nominal

Hombres - mujeres precoces - tardíasSusceptibles - resistentes docentes - estudiantes

Entre los datos no existe una relación de orden, no se pueden aplicar operaciones aritméticas como suma, multiplicación, etc.

Se pueden establecer frecuencias y proporciones, así como calcular la moda y relaciones de equivalencia.

Las pruebas estadísticas admisibles son las no paramétricas, como la X2 , prueba basada en la Binomial y el coeficiente de contingencia.

Page 13: Maes.se, Pv Nuevo

Escala Ordinal

Regularmente – A veces – Pocas veces – Casi nunca - Nunca

La escala ordinal clasifica y ordena las observaciones. Sin embargo no puede definirse una distancia entre las observaciones, las relaciones admisiubles en esta escala son: >, <, =

Las pruebas estadísticas admisibles son las no paramétricas, en particular las estadísticas de rango, el coeficiente de Spearman y Kendall

Page 14: Maes.se, Pv Nuevo

VARIBLES CUANTITATIVAS O NUMÉRICAS Son aquellas variables que toman valores numéricos. A estas

variables le corresponde la escala de medición de intervalo y razón o proporción. Estos a su vez se clasifican en:

Continua: Es aquella que puede

tomar cualquier valor dentro de la escala de

los números reales bien sean valores

enteros o fraccionados.

Discreta: Es aquella variable que solo

puede tomar valores enteros en la escala

de los números naturales, es decir, la

variable no puede tomar valores fraccionarios

Page 15: Maes.se, Pv Nuevo

Clasificar las siguientes variables cuantitativas en :

- Variables discretas

- Variables continuas

-Rendimiento

-Número de vainas/planta

-Altura

-Número de ninfas/hoja

-Peso de 1000 semillas

- Número de granos/vaina

continua

discretacontinua

discreta

continua

discreta

Page 16: Maes.se, Pv Nuevo

Variable Aleatoria o probabilística: Es aquel valor que asume la variable que han sido

antecedidas por una selección aleatoria de los objetos medidos o son resultados de algún proceso al azar, es decir, es la variable que

toma diferentes valores como resultado de un experimento aleatorio

Page 17: Maes.se, Pv Nuevo

Variable Independiente:Es aquella que se presenta como causa y condición de la variable dependiente. Es la manipulada por el investigador; recibe el nombre de variable experimental.

Variable Dependiente: Es aquella que se presenta como consecuencia de una variable antecedente, que por lo

general es la variable independientes.

Page 18: Maes.se, Pv Nuevo

Identificar en las siguientes variables cuales son independientes y dependientes

Rendimiento vs Número de vainas/planta

Ingresos vs Egresos

Germinación vs Tiempo de almacenamiento

Vigor vs Días a cosecha

Peso vs Altura

Vigor vs Germinación

D I

I

I

ID

D

D

Page 19: Maes.se, Pv Nuevo

Los Parámetros.- Son cualquiera característica que se pueda medir y cuya medición se lleve a cabo sobre todos los elementos que integran una población determinada, los mismos suelen con letras griegas. El valor de un parámetro poblacional es un valor fijo en un momento dado. Ejemplo: La media Aritmética = (miu), La desviación Típica = , (Sigma) etcétera.

Page 20: Maes.se, Pv Nuevo

 Los Estadígrafos (Estadísticos o Estimadores).- Son aquellas características medibles, cuya medición se realiza sobre los componentes de una muestra, los mismos se representan con letras del alfabeto castellano. Los estadígrafos no tienen un valor único, sino que pueden tomar distintos valores al ser calculados a partir de muestras diferentes. Ejemplos: la media aritmética =, La desviación Típica = S.

Page 21: Maes.se, Pv Nuevo

MEDIDAS DE TENDENCIA CENTRAL

Media aritméticaMedianaModa

Page 22: Maes.se, Pv Nuevo

MEDIA ARITMÉTICALa media aritmética o simplemente la media, es el parámetro de posición de más importancia en las aplicaciones estadísticas. Se trata del valor medio de todos los valores que toma la variable estadística de una serie de datos. Por lo tanto, la medida posicional más utilizada en los estudios estadísticos viene a ser la media. La media aritmética de una serie de N valores de una

variable X1, X2, X3; X4,.........Xn, es el cociente de dividir la sumatoria de todos los valores que toma la variable Xi, entre el número total de ellos.

La formula se puede expresar así: .

.

N

XX

n

ii

1

X

Page 23: Maes.se, Pv Nuevo

 CÁLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS

Para calcular la media de datos no agrupados en clases se aplica la siguiente formula:

. En donde N es el número total de datos y son los valores de la variable.

Ejemplo:– Calcule la media aritmética de los siguientes valores:

Por lo tanto la media es 9.

N

XX

i

iX

14.,.11.,9,.8,.7,.5iX

.96

546

14119875

NX

X i

Page 24: Maes.se, Pv Nuevo

LA MEDIANALa mediana (Md) es una medida de posición que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella. Es por lo tanto, un parámetro que esta en el medio del ordenamiento o arreglo de los datos organizados, entonces, la mediana divide la distribución en una forma tal que a cada lado de la misma queda un número igual de datos.

iX50% 50%

Page 25: Maes.se, Pv Nuevo

Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los datos en una forma

creciente o decreciente y luego se ubica la posición que esta ocupa en esa serie de datos; para ello hay que determinar si la

serie de datos es par o impar

Ejemplo: Datos impares n=7

X1=43; X2=51; X3=37; X4=39; X5=19; X6=24; X7=27

Ordenados en forma creciente:

X1=19; X2=24; X3=27; X4=37; X5=39; X6=43; X7=5

La Mediana es Md=3737

Page 26: Maes.se, Pv Nuevo

Ejemplo: Datos pares n=8

X1=43; X2=51; X3=37; X4=39; X5=19; X6=24; X7=27; X8=62

Ordenados en forma creciente:

X1=19; X2=24; X3=27; X4=37; X5=39; X6=43; X7=5; X8=62

La mediana es el promedio de las dos observacionescentrales, es decir :

La Mediana es Md= 38

382

3937

Mdp

Page 27: Maes.se, Pv Nuevo

LA MODA 

La moda es la medida de posición que indica la magnitud del valor que se presenta con más frecuencia

en una serie de datos; es pues, el valor de la variable que más se repite en un conjunto de datos. De las medias de

posición la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple

observación de los datos en estudio, puesto que la moda es el dato que se observa con mayor frecuencia. La moda

se designa con las letras Mo.

Page 28: Maes.se, Pv Nuevo

;.7;.6;.5;.4,.3 54321 xxxxx

6;.5;.5;.4,.2 54321 xxxxx

5;.4;.3;.3;.2,.2 654321 xxxxxx

La moda Mo, puede no existir para un conjunto de datos o si existe puede no ser única. Por lo tanto puede ser unimodal, bimodal y multimodal.Ejemplos:

a) Mo=5

b) Es amodal

c) Mo=2 y 3; es bimodal

Page 29: Maes.se, Pv Nuevo

MEDIDAS DE DISPERSIÓN

• Rango• Varianza• Desviaación estandar• Coeficiente de variación

Page 30: Maes.se, Pv Nuevo

MEDIDAS DE DISPERSIÓN  

Las medidas de posición central son los valores que de una manera condensada representan una serie de datos, pero realmente no son suficientes para caracterizar una distribución de frecuencia. Para describir una distribución de frecuencia o serie de datos es necesario, por lo menos otra medida que indique la dispersión o variabilidad de los datos, es decir, su alejamiento de las medidas de posición central. Estas medidas de posición central no tienen ningún valor si no se conoce como se acercan o se alejan esos valores con respecto al promedio, en otras palabras es conocer como se dispersan o varían esos valores con respecto al promedio de una distribución de frecuencia.

Page 31: Maes.se, Pv Nuevo

Bosque A

Bosque B

Page 32: Maes.se, Pv Nuevo

Bosque A

Bosque B

Altura en metros

8 4 9 6 3

7 6 8 5 4

65

30X

65

30X

Page 33: Maes.se, Pv Nuevo

Clasificación de las medidas de dispersión

La variabilidad es la esencia de la estadística, puesto que las variables y atributos se caracterizan siempre por diferencias de valores entre observaciones individuales; por esto es importante determinar el grado de variación o dispersión de los datos de una serie de valores con respecto al promedio. Las medidas de dispersión se clasifican en dos grandes grupos:

Medidas de dispersión absolutas

Medidas de dispersión relativas

Page 34: Maes.se, Pv Nuevo

Las medidas de Dispersión Relativas, vienen expresadas en las mismas medidas que se identifican la serie de datos,las mismas son:

a) Recorridob)Varianzac) Desviación estandar 

Las Medidas de Dispersión absoluta Son relaciones entre medidas de dispersión absolutas y medidas de tendencia central multiplicadas por 100, por lo tanto vienen expresadas en porcentaje, su función es la de encontrar entre varias distribuciones la dispersión existente entre ellas.la de mayor importancia es el. Coeficiente de variacion

Page 35: Maes.se, Pv Nuevo

Bosque B

Rango (R) = Dato mayor (XM)Dato Menor (Xm) + Una unidad de medida (1UM):

Bosque A

9 m

8 m

3m

4m

R=9-3=6m

R=8-4=4m

Page 36: Maes.se, Pv Nuevo

VarianzaLa varianza es la media aritmética de la desviacion cuadrática respecto de la media aritmética de la distribución y se la denota por:

muestralesdatosparan

XXS i .....,.

1)(

.2

2

lespoblacionadatosparaN

X i ....,)(

.2

2

Page 37: Maes.se, Pv Nuevo

6X

8 4

9

6

3

26....

93

0...........93..

42

42..

)(

2

2

2

2

2XX i

0....

363066369

264268)( XX i

2,5526. 2 m2

22 )(.

NX

Page 38: Maes.se, Pv Nuevo

DESVIACIÓN TÍPICA O ESTÁNDAR Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de todas. Se le designa con la letra castellana S cuando se trabaja con una muestra y con la letra griega minúscula (Sigma) cuando se trabaja con una población. Es importante destacar que cuando se hace referencia a la población él número de datos se expresa con N y cuando se refiere a la muestra él número de datos se expresa con n. La desviación típica se define como: “La raíz cuadrada positiva del promedio aritmético de los cuadrados de los desvíos de las observaciones con respecto a su media aritmética L a típica es una forma refinada de

la desviación media”.

Page 39: Maes.se, Pv Nuevo

Desviación Estandar

MuestrtalDesviación Estandar

poblacional

1.)(

.2

n

XXs

NXX 2.)(

.

Page 40: Maes.se, Pv Nuevo

6X

8 4

9

6

3

26....

93

0...........93..

42

42..

)(

2

2

2

2

2XX i

0....

363066369

264268)( XX i

NXX 2.)(

. m..28,2

526.

Bosque A

Page 41: Maes.se, Pv Nuevo

6X

8 4

9

6

3

26....

93

0...........93..

42

42..

)(

2

2

2

2

2XX i

0....

363066369

264268)( XX i

28.2526. mS ..54,2

426

Bosque B

Page 42: Maes.se, Pv Nuevo

Bosque A

Bosque B

Altura en metros

8 4 9 6 3

7 6 8 5 4

65

30X

65

30X

65

30X

m..28,2526

m..41,15

10

Page 43: Maes.se, Pv Nuevo

Bosque A

Bosque B

65

30X

65

30X

m..28,2526

m..41,15

10

+ 2,28 = 8,28

- 2,28 = 3,72

+ 1,41 = 7,41

- 1,41 = 4,59

Page 44: Maes.se, Pv Nuevo

INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA

 La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación de los datos con respecto a la media aritmética, su valor se encuentra en relación

directa con la dispersión de los datos, a mayor dispersión de ellos, mayor desviación típica, y a menor dispersión, menor desviación típica.

Page 45: Maes.se, Pv Nuevo
Page 46: Maes.se, Pv Nuevo
Page 47: Maes.se, Pv Nuevo

95,45%

99,73%

34,14% 34,14%13,59%

13,59% 2,14%2,14%Media

68,27%

Page 48: Maes.se, Pv Nuevo

DISPERSIÓN RELATIVA O COEFICIENTE DE VARIACIÓN

 Las medidas de variabilidad, estudiadas hasta ahora, solo

permitían medir las dispersiones absolutas de los términos de la muestra. Las medidas, tomadas en esas condiciones, serán de utilidad, solo cuando se trata de analizar una sola muestra; pero,

cuando hay que establecer comparaciones entre distintas muestras, será necesario expresar tales medidas en valores

relativos, que pueden ser proporciones o porcentajes.

Page 49: Maes.se, Pv Nuevo

Bosque A

Bosque B

Page 50: Maes.se, Pv Nuevo

Las medidas de dispersión relativas permiten comparar grupos de series distintas en cuanto a su variación,

independientemente de las unidades en que se midan las diferentes características en consideración.

Generalmente las medidas de dispersión relativas se expresan en porcentajes, facilitando así el estudio con

medidas procedentes de otras series de valores La dispersión relativa viene a ser igual a la dispersión

absoluta dividida entre el promedio.

Page 51: Maes.se, Pv Nuevo

 Existen varias medidas de dispersión relativa, pero, la más usada es el coeficiente de variación de Pearson, este es un índice de variabilidad sin dimensiones, lo

que permite la comparación entre diferentes distribuciones de frecuencias, medidas en diferentes unidades. El coeficiente de variación de Pearson se designa con las letras CV. La formula matemática es:

.100xX

CV

Page 52: Maes.se, Pv Nuevo

XProducto S Unidades

Bosque 1 8 2,5 m

Bosque 2 8 3,5 m.

Bosque 3 10 3,5 m

Indicar cual de los bosques presenta una mayor variación, o cual es más heterogeneo.

Page 53: Maes.se, Pv Nuevo

XProducto S Unidades CV

Bosque 1 8 2,5 m 31,25%

Bosque 2 8 3,5 m 43,75 %

Bosque 3 10 3,5 m 35,00 %

Indicar cual de los bosques presenta mayor variación o es más heterogeneo.

Page 54: Maes.se, Pv Nuevo

XProducto S Unidades

Rend. 1 25 12 qq/ha

Rend. 2 40 15 qq/ha

Rend. 3 17 9 qq/ha

Se presenta datos del rendimiento en frejol de las parcelas de tres propiedades. Cuál de ellas tienen una producción más heterogenea entre sus parcelas?

Page 55: Maes.se, Pv Nuevo

XProducto S Unidades CV

Bosque 1 25 12 m 31,25%

Bosque 2 40 15 m 43,75 %

Bosque 3 17 19 m 35,00 %