guía técnica de estudio de estadística aplicada a la evaluación

23
ESTADÍSTICA APLICADA A LA EVALUACIÓN GUÍA TÉCNICA DE ESTUDIO DANIEL ACOSTA ESPARZA MAYO DE 2010

Upload: santaanaclaus

Post on 22-Jul-2015

1.342 views

Category:

Education


1 download

TRANSCRIPT

Page 1: Guía técnica de estudio de estadística aplicada a la evaluación

ESTADÍSTICA APLICADA A LA EVALUACIÓN

GUÍA TÉCNICA DE ESTUDIO

DANIEL ACOSTA ESPARZA

MAYO DE 2010

Page 2: Guía técnica de estudio de estadística aplicada a la evaluación

GUÍA TÉCNICA DE ESTUDIO DE ESTADÍSTICA APLICADA A LA EVALUACIÓN La Estadística es una rama de las matemáticas que ordena, describe, explica y proyecta datos y está asociada a la probabilidad y la inducción. PROBABILIDAD La probabilidad se emplea en procesos físicos, biológicos y sociales que no pueden predecirse con exactitud. Los eventos aleatorios ocurren con una frecuencia relativa constante. Este tipo de comportamiento se denomina aleatorio o estocástico, y su frecuencia proporciona una medida intuitiva pero significativa de su posibilidad de ocurrencia. El uso de esta frecuencia como medida de la posibilidad de ocurrencia de una condición tiene como objetivo determinar con cierta precisión el acierto en el resultado del evento. Como punto de partida, la teoría de la probabilidad considera la teoría de conjuntos: Si S es el conjunto de todos los elementos considerados, S es el conjunto universo. Para cualquiera de los

conjuntos A y B se dice que A es subconjunto de B (A B) si cada elemento de A está también en B.

El conjunto vacío ( ) es un subconjunto que carece de elementos, por lo que es un subconjunto de cualquier conjunto. Los conjuntos y sus relaciones se representan en diagramas de Venn.

Si consideramos dos conjuntos arbitrarios A y B, la unión de A con B se denota como A B y contiene los elementos de A y de B.

La intersección de A y B (A B) son los elementos que se encuentran en A y que también se encuentran en B.

Si A es un subconjunto de S, el complemento de A ( A ) son los elementos de S que no se encuentran en A.

A y B son mutuamente excluyentes si A B= , o sea que no tienen elementos comunes.

S B

A

S A B

S

A B

S

A A

A B

Page 3: Guía técnica de estudio de estadística aplicada a la evaluación

A B A B A B S=A A A B=

En una población, una muestra participa con una proporción determinada, a lo que se denomina frecuencia relativa, y hace referencia a la probabilidad de ocurrencia del evento en estabilizada en un punto por la regularidad de su aparición. Por lo tanto, la probabilidad de suceso del evento se representa como su frecuencia relativa.

P(A)=Frecuencia Relativa de A INDUCCIÓN: La lógica es la disciplina que trata la relación de implicación de las proposiciones relación Premisa------------------->Conclusión DEDUCCIÓN inclusión relación Premisa<-----------------------Conclusión INDUCCIÓN probabilística La posible verdad o falsedad de un conjunto limita la posible verdad o falsedad del otro:

Si la premisa es verdadera, entonces la conclusión es verdadera

Si la premisa es falsa, entonces la conclusión es falsa

Si la conclusión es verdadera, la premisa puede ser verdadera

Si la conclusión es falsa, la premisa es falsa (2) Cantidad-calidad La proposición es un enunciado del que es posible afirmar que es verdadero o falso. Las proposiciones pueden analizarse en cuanto a calidad como afirmativas o negativas; mientras que en cuanto a calidad en generales o particulares:

Calidad Cantidad

Afirmativo

Negativo

Universal

Todos S es P A

Ningún S es P E

Particular

Algún S es P I

Algún S no es P O

S S S S

A

B

A A B A B A A B

Page 4: Guía técnica de estudio de estadística aplicada a la evaluación

MEDICIÓN El análisis de la medición se aborda a partir de dos temáticas: los niveles y las escalas de medición que son utilizados en las diversas disciplinas científicas y su aplicación en la estadística.1 NIVELES DE MEDICIÓN. Para todas las ciencias, existen diversos niveles de medición, mismos que pueden clasificarse en cuatro, dependiendo de su precisión y exactitud. a) Nivel nominal: Diferenciación de una uniformidad empírica: CLASE

telekinesis

telepatía

hiponosis b) Nivel ordinal = Nivel Nominal + ordenamiento cualitativo de mayor a menor o viceversa:

CLASE PESO

Excelente calidad 5

Buena calidad 4

Regular Calidad 3

Mala Calidad 2

Nula calidad 1 c) Nivel proporcional = Nivel Ordinal + Intervalo:

CLASE INTERVALO FRECUENCIA

analfabeta 0 30

primaria 6 90

secundaria 9 99

preparatoria 12 70

licenciatura 16 50

maestría 18 19

doctorado 20 10 d) Nivel de razón = Nivel Proporcional + 0 absoluto: Salarios mínimos

CLASE MC FRECUENCIA 0 0 20 1 a 5 3 50 5 a 10 8 40 11 a 15 13 20 16 a 20 18 10

1 Acosta, E. D. Teoría Metodología y Técnicas de Investigación. UIA. México. 1980

Page 5: Guía técnica de estudio de estadística aplicada a la evaluación

Hasta aquí primera clase Clasificación de la estadistica TIPOS DE ESTADÍSTICA

ESTADÍSTICA DESCREPTIVA SÍNTESIS DESCRIPTIVA: COEFICIENTE DE VARIACIÓN

MEDIDAS DE TENDENCIA CENTRAL ANÁLISIS DE ESTRATIFICACIÓN MEDIDAS DE DISPERSIÓN

a) MEDIA b) MEDIANA c) MODA a) DESVIACIÓN CUARTIL b) DESVIACIÓN DECIL c) DESVIACIÓN PERCENTIL a) RANGO b) DESVIACIÓN MEDIA c) VARIANZA d) DISEPRSIÓN ESTÁNDAR a) DESVIACIÓN ESTANDAR/MEDIA

ESTADÍSTICA EXPLICATIVA

PRUEBAS PARAMÉTRICAS PRUEBAS NO PARAMÉTRICAS

a) PRUEBA ―t‖ b) ―f‖ DE FISHER b) CORRELACIÓN ―r”

2 (Ji CUADRADA)

ESTADÍSTICA PROYECTIVA

ESCENARIOS: VARIABLE ESTAD. INDEPENDIENTE: X ESCENARIOS VARIABLE ESTAD. CORRELACIONADA: Y

a) ESCENARIOS SIMPLES b) ESCENARIOS CON RANGOS a) LINEAL b) EXPONENCIAL c) LOGARÍTMICA

DISTRIBUCIÓN NORMAL Premisa: Existen regularidades en la naturaleza:

*

* *

* *

* *

3s 2s s X S 2s 3s

66%

95%

99%

Page 6: Guía técnica de estudio de estadística aplicada a la evaluación

CARACTERÍSTICAS:

En una distribución de frecuencia paramétrica, las tres mediciones de tendencia central coinciden en un mismo punto; en este sentido,

La diferencia del valor de estas tres medidas nos da una idea del carácter normalizado o no de los datos analizados.

CONSTRUCCIÓN DE FRECUENCIAS En el análisis estadístico tenemos dos conceptos básicos: el de población y el de muestra:2

Se denomina población al conjunto formado por la totalidad de los eventos de una clase o categoría a ser analizados.

Un subconjunto o parte de la población. Se le llama muestra. Esta puede ser representativa o no de aquella; para que una muestra sea representativa de una población, sus elementos deben ser seleccionados por algún método aleatorio.

En la investigación, obtenemos datos de muestras, mismo que clasifican y tabulan para construir frecuencias y realizar el análisis cuantitativo. CLASIFICACIÓN En la investigación se maneja una gran cantidad de datos, por lo que es conveniente agruparlos en clases o categorías. En este sentido, la clasificación implica ordenar o agrupar los datos; clasificación que, de antemano, está determinada por el nivel de medición de los datos analizados. El punto de referencia para construir los datos es:

Para el nivel de medición nominal, el dato mismo, como uniformidad empírica

Para el nivel de medición ordinal: el conocimiento acumulado o teoría que describe o explica las uniformidades empíricas

Para los niveles de medición de proporción o razón, el intervalo.

Con relación al intervalo, recordamos que este consiste en la diferencia cuantitativa entre las clases, por lo que dados ciertos datos, es posible obtener la longitud del intervalo, calculando la diferencia entre la máxima y la mínima observación y dividiendo la diferencia resultante entre el número deseado de intervalos, la longitud de los intervalos debe ser igual a este cociente. Ejemplo: Se tienen 50 casos, cuya cuantificación menor es de 10 y la mayor de 60 y se quiere manejar 5 intervalos, entonces la longitud del intervalo se calcularía de la siguiente forma: 60 - 10 = 50/5 = 10, por lo que las clases que tendríamos serían:

CLASE: De 1 a 10 De 11 a 20 De 21 a 30 De 31 a 40 De 41 a 50 De 51 a 60

2 Moreno, B. A. Probabilidad y Estadística. R y S I. México. 1980.

Page 7: Guía técnica de estudio de estadística aplicada a la evaluación

TABULACIÓN: La ubicación de cada dato en la clase que le corresponde es lo que se denomina tabulación. Ejemplo, tenemos los siguientes datos:

10 11 21 43 15 18 17 16 35 14

26 60 26 45 10 58 24 14 38 26

24 56 28 40 19 60 26 15 47 37

12 42 16 38 47 26 28 22 50 26

18 35 19 35 59 43 33 44 57 43

La tabulación implicara ubicar cada caso en la clase que se construyo:

CLASE FRECUENCIA De 1 a 10 2 De 11 a 20 13 De 21 a 30 12 De 31 a 40 7 De 41 a 50 9 De 51 a 60 7 TOTAL 50

FRECUENCIA: El total de casos por cada una de las categorías se le denomina Frecuencia. Al arreglo tabular de los datos por clase junto con sus correspondientes frecuencias de clase, se les denomina tabla de frecuencias. El resultado del ejemplo anterior, en donde tenemos clase y frecuencia, constituye una tabla de frecuencias.

Frecuencia simple o absoluta. Esta se compone de la clase y frecuencia, como es el caso del ejemplo anterior.

Frecuencia relativa. En este tipo de frecuencias, se les añade el peso porcentual de cada clase. Por ejemplo, si utilizamos los datos anteriores, tenemos la siguiente frecuencia relativa:

CLASE: FRECUENCIA ABSOLUTA

FRECUENCIA RELATIVA

De 1 a 10 2 4

De 11 a 20 13 26

De 21 a 30 12 24

De 31 a 40 7 14

De 41 a 50 9 18

De 51 hasta 60 7 14

TOTAL 50 100%

Frecuencia -Acumulativa. En este caso, por cada clase se suman las frecuencias anteriores, dándonos como resultado el 100% en la última clase

Page 8: Guía técnica de estudio de estadística aplicada a la evaluación

CLASE FRECUENCIA ABSOLUTA

FRECUENCIA ACUMULATIVA

FRECUENCIA RELATIVA ACUM.

De 1 a 10 2 2 4

De 11 a 20 13 15 30

De 21 a 30 12 27 54

De 31 a 40 7 34 68

De 41 a 50 9 43 86

De 51 hasta 60 7 50 100%

TOTAL 50

GRAFICACIÓN DE DATOS

Los datos podemos graficarlos en histogramas y polígonos de frecuencia:

HISTOGRAMA POLÍGONO DE FRECUENCIA

RANGOS Las clases intervalares, nivel de medición de proporción y de razón, se integran por un límite menor y un límite mayor, como es el caso del ejemplo expuesto con anterioridad:

CLASE FRECUENCIA

Limite Inferior

Limite Superior

Hasta 10 2

De 11 a 20 13

De 21 a 30 12

De 31 a 40 7

De 41 a 50 9

De 51 a Hasta 60 7

TOTAL 50

EL punto medio entre el límite mayor y el límite menor, se denomina marca de clase y constituye el valor representativo de cada clase. La marca de clase se calcula sumando el límite mayor más el límite menor entre dos. Para el ejemplo anterior tenemos:

0

5

10

15

10 20 30 40 50 600

5

10

15

10 20 30 40 50 60

Page 9: Guía técnica de estudio de estadística aplicada a la evaluación

CLASE MARCA DE CLASE

FRECUENCIA

Limite Inferior

Limite Superior

Hasta 10 10 2

De 11 a 20 15.5 13

De 21 a 30 25.5 12

De 31 a 40 35.5 7

De 41 a 50 45.5 9

De 51 a Hasta 60 55.5 7

TOTAL 50

SUMATORIA: La sumatoria, que simplemente es la suma de una serie de datos, se simboliza con

la sigma mayúscula: es utilizada en diferentes mediciones estadísticas como la Media o la Desviación Estándar. Un ejemplo sería el siguiente:

MES ACCIDENTES MES ACCIDENTES

01 34 07 45

02 26 08 48

03 18 09 34

04 42 10 21

05 30 11 19

06 21 12 39

Es importante observar que en el caso de los niveles de medición ordinal, que tienen un peso y frecuencia, así como el caso intervalar en que se da marca de clase y frecuencia, primeramente tiene que ponderarse, multiplicando, en el caso ordinal, peso x frecuencia; mientras que en el intervalar, marca de clase x frecuencia.

CLASE PESO FRECUENCIA PESO X FRECUENCIA

Excelente calidad 5 50 250

Buena calidad 4 70 280

Regular Calidad 3 90 270

Mala Calidad 2 80 160

Nula calidad 1 70 70

TOTAL n=360 = 1,030

ESTADÍSTICA DESCRIPTIVA

MEDIDAS DE TENDENCIA CENTRAL

(1) Media simple o nominal: Cada clase es independiente entre sí, o sea clase es igual a la frecuencia

n

xX i

La sumatoria será el número de los accidentes ocurridos durante los 12 meses:

= 377

Page 10: Guía técnica de estudio de estadística aplicada a la evaluación

Promedio de accidentes en 10 tramos carreteros

CLASE FRECUENCIA CLASE FRECUENCIA 01 24 06 34 02 26 07 39 03 21 08 15 04 19 09 22 05 22 10 22

xi = 244 y n = 10 Matematización: X = 244/10 = 24.1 (2) Media ordinal o ponderada: Esta se utiliza con escalas de medición ordinal: agregativa de clase, acumulativa de peso o diferencial:

X = ·pf/n p = peso de la clase f = frecuencia n = sumatoria de las frecuencias de clase Medición de calidad en diferentes muestras de un producto: p clase frecuencia ponderación 5 calidad alta 200 1,000 4 calidad media 300 1,200 3 calidad regular 350 1,050 2 calidad baja 100 200 1 calidad nula 50 50 T o t a l 1,000 3,500

pf = 3,500, n = 1,000

X = 3,500/1000 = 3.5. La opinión se encuentra entre la clase ―calidad media‖ y ―calidad regular‖. En las escalas ordinales cuya base es el peso lógico de las clases pueden ser convertidas en X%, media porcentual con la finalidad de utilizar la estadística paramétrica, tal conversión se realiza dividiendo la posición media entre el valor del peso óptimo o valor máximo (VM) multiplicado por 100:

X % = ( X /VM)x100

Para el caso anterior, tenemos: X % (3.5/5)100 = 70%. Para el análisis de posicionamiento (Benchmarking) la media porcentual de una institución se compara con la Media Porcentual del Contexto, o con el concepto ―excelencia‖, mismo que hace referencia al valor máximo de las clases, en este sentido, siempre será el 100%

Page 11: Guía técnica de estudio de estadística aplicada a la evaluación

(3) Intervalar: La media aplicada a datos intervalares se clasifican en los niveles de medición proporcional y de razón.

X = xi·f/n Promedio de escolaridad:

Clase Frecuencia M.C Ponderación 0 100 0 0 1 a 4 150 2.5 375 5 a 8 700 6.5 4550 9 a 12 300 10.5 3150 13 a 16 150 14.5 2175 17 a 20 150 18.5 2775

n = 1550 = 13025

X = 13025/1550 =8.4 años de escolaridad

ANÁLISIS DE ESTRATIFICACIÓN. Las medidas de dispersión aplicadas al análisis de estratificación son: desviación cuartil, decil y percentil, las cuales expresan la forma como entre el límite menor y el mayor, se distribuyen los datos: en cuatro partes para el cuartil, 10 para el decil y 100 para el percentil. Estas medidas son muy útiles en el análisis de estratificación social, política o administrativa y determinar los niveles de ingresos, consumo, inversión, etc.

(1) Cuartil: Qn = n( F/4) mediana

Dato mínimo: 25% 25% 25% 25%: Dato máximo q1 q2 q3 q4

Q1 = Li + (( f/4 - fa)/f·)i

Q2 =MD

Q3 = Li + (( 3 f/4 - fa)/f·)i Ej: Si calculamos el qi y q3 para los datos de escolaridad tenemos:

Clase Frecuencia M.C Ponderación 0 100 0 0 1 a 4 150 2.5 375 5 a 8 700 6.5 4550 9 a 12 300 10.5 3150 13 a 16 150 14.5 2175 17 a 20 150 18.5 2775

n = 1550 = 13025 X = 13025/1550 =8.4 años de escolaridad

Page 12: Guía técnica de estudio de estadística aplicada a la evaluación

Datos para q1: Datos para q3·:

f/4 = 387 3 f/4 = 1162 Li = 5 Li = 9 fa = 250 fa = 950 f = 700 f = 300 i = 4 i = 4 Q1 = 5 + ((387-250)/700)4 = 5.8 Q3 = 9 + ((1162 -950) 300) 4 = 11.8

(2) Decil: Dn = n( F/10) Percentil: Pn = n( F/100)

Para calcular cualquier decil o percentil, se aplica la misma formula cambiando en n( f/n), los valores respectivos, por ejemplo: Para el 7 decil o para el percentil 40: Datos para el 7o decil: Datos para el 40 percentil:

7( f/10) = 1085 40( f/100) = 620 Li = 9 Li =5 fa = 950 fa =200 f = 300 f =700 i = 4 i =4 D7 = 9 + ((1085 - 950)/300)4 = 10.8 P40 = 5 + ((620-200)/700)4 0 7.4 MEDIDAS DE DISPERSIÓN 3.1 Rango: El Rango es la diferencia entre la magnitud Mayor y la magnitud Menor de una serie de datos; por ejemplo en las clases del ejemplo anterior: 20 – 0 = 20 3.2.- Desviación Media:

Es el promedio de la sumatoria de las diferencias absolutas de xi menos x :

DM = │xi - x │/n

3.3.- Desviación estándar (s) y varianza (S ) para nivel de medición nominal en una serie

simple: Fórmulas:

22

/nxxi

nxxS i

2 /2

Page 13: Guía técnica de estudio de estadística aplicada a la evaluación

Datos:

Clase % votación x (xi - x ) (xi - x )2 01 24 24.4 - 0.4 0.16 02 26 1.6 2.56 S2 = 45.3 03 21 - 3.4 11.56 04 19 - 5.4 29.16

05 22 - 2.4 5.76 s = 73.63.452

06 34 9.6 92.16 07 39 14.6 211.96 08 15 - 9.4 88.16 09 22 - 2.4 5.76 10 22 - 2.4 5.76

= 453.00 2) Desviación estándar (s) y varianza (S2) para nivel de medición ordinal

22f/nx-p

f/nx-pS2 2

P CLASE FREC. P x F x P - x (P - x )2 F

5 Calidad alta 200 1,000 3.5 1.5 450.0

4 Calidad media 300 1,200 0.5 75.0

3 Calidad regular 350 1,050 0.5 87.5

2 Calidad baja 100 200 -1.5 225.0

1 Calidad nula 50 50 -2.5 312.5

TOTAL 1,000 3,500 1,150.0

xi·p = 1,150, n = 1,000 S2 = 1,150/1000 = 1.5

07.15.12

3) Desviación estándar intervalar Fórmulas:

2

2

n

fxx i f/nxxS i

2 2

Clase Marca de Clase. frecuencia x (xi - x ) (xi - x )2 f 0 0 100 8.4 - 8.4 7056.0 1 a 4 2.5 150 - 5.9 5221.5 5 a 8 6.5 700 - 1.9 2527.0 9 a 12 10.5 300 2.1 1323.0 13 a 16 14.5 150 6.1 5581.5 17 a 20 18.5 150 10.1 15301.5

Page 14: Guía técnica de estudio de estadística aplicada a la evaluación

n= 1550 S = 37110.5

x = 13025/1550 =8.4 S2 = 23.04

8.44.232

4) Coeficiente de Variación Esta medición muestra la relación entre la media y la desviación estándar; en este sentido, nos plantea el índice entre la tendencia de dispersión sobre la tendencia central, teniendo como punto de referencia que, en una distribución normal -paramétrica o normalizada

x = 1; mientras que s = 0:

CV = s / x . Para una distribución normal: CV. = 0/1 = 0

Para los ejemplos anteriores tenemos:

Escala nominal: % accidentes: CV. = 6.73 /24.4 = 0.28

Escala ordinal: medición de la calidad: CV. = 1.88/3.5 = 0.54

Escala intervalar: nivel de escolaridad: CV. = 4.8/8.4 = 0.57 MUESTREO:

En toda investigación se tiene un universo, una muestra y un elemento de estudio que es la fuente de la información.

La muestra viene a ser en la investigación el enunciado particular ―algún S es P‖; mientras que el universo, el enunciado general: ―Todo S es P‖.

Existen dos tipos de muestras: las paramétricas y las no paramétricas, las primeras con probabilidades altas de que la muestra represente al universo, y las segundas con poca probabilidad.

5.4.2.1.- Muestras Probabilísticas y no Probabilísticas:

(1) Muestras Probabilísticas:

Estas se caracterizan porque todos los elementos del universo tienen las mismas probabilidades de ser seleccionados en la muestra, lo que es posible sólo se cada elemento de la muestra se selecciona al azar.

Existen tres tipos de muestra paramétrica:

Muestra aleatoria simple. En ésta no es importante conocer las diferencias del universo, por lo que cada elemento se selecciona al azar por medio de métodos como la lotería, números aleatorios, etcétera.

Muestra estratificada. Para este tipo de muestra es importante conocer las diferencias existentes en el universo, por lo que cada diferencia o característica heterogénea del mismo es representado proporcionalmente en la muestra y cada elemento se selecciona al azar.

Page 15: Guía técnica de estudio de estadística aplicada a la evaluación

Muestra por conglomerados. En esta además es importante incluir, además de la representatividad de los estratos, la correspondiente a la representatividad proporcional de los elementos del universo en su distribución geográfica, seleccionándose cada elemento de la muestra al azar.

(2) Muestras no Probabilísticas:

En este tipo de muestras, no todos los elementos del universo tienen las mismas probabilidades de ser contenidos en la muestra, por lo tanto no son representativas y se utilizan para investigaciones exploratorias o diagnósticos particulares, cuyos resultados no se pretende generalizar.

Tres son las diversas muestras no paramétricas: intencionales, accidentales y por cuotas.

Muestras intencionales. Estas se conforman por elementos que han sido seleccionados propositiva o intencionalmente. Existe un tipo de muestra, denominado de ―informantes confiables‖ que se caracteriza por ser intencional, pero que es muy útil, al utilizarse expertos, o personas con disposición a proporcionar información.

Muestra accidental. Esta se compone por elementos que fueron seleccionados por medios casuales; en este sentido conforman accidentalmente la muestra en cuestión.

Muestra por cuotas. Este tipo de muestra toma en cuenta las diferencias existentes en el universo, por lo que se conforma por grupos de muestras que representan dichas diferencias, pero éstas no son proporcionales y los elementos de la muestra se seleccionan intencional o accidentalmente.

5.4.2.2.- Tamaño de la Muestra:

Para determinar el tamaño de la muestra, se aplican diversos métodos:

(a) Método Probabilístico

n = Z2 x (pq), en dónde:

E2

n = Tamaño de la muestra

Z = Nivel de confianza para generalizar los resultados a todo el universo

pq = Variabilidad del fenómeno estudiado: probabilidad de acierto, probabilidad de error

E = El error global o precisión con que se generalizarán los resultados.

(b) Método de la NOM: Z-12-87: Equivalente al ISO-9000: 20003

3 SECOFI. NOM:Z-12-87. TII. México

Page 16: Guía técnica de estudio de estadística aplicada a la evaluación

Aplicación del Método:

Page 17: Guía técnica de estudio de estadística aplicada a la evaluación

1) Ubicar el tamaño del universo en el Rango correspondiente al cuadro 1.

2) Seleccionar el Nivel de Inspección del recuadro de Niveles de Inspección Generales

3) Determinar la Letra Clave

4) Ubicar la Letra Clave en el cuadro 2 para determinar el tamaño de la muestra Seleccionar el Nivel de Calidad Aceptable que se va a aceptar y a rechazar SERIES DE TIEMPO CONCEPTO Y CARACTERÍSTICAS Una serie de tiempo es un conjunto de datos ordenado temporalmente, tomando como punto de referencia una unidad de tiempo: día semana, mes, bimestre, trimestre, semestre, año, etcétera. Si hacemos referencia al aforo vehicular en un tramo carretero un ejemplo sería el siguiente:

AÑO VEHICULOS AÑO VEHICULOS 1990 2,300 1995 3,450 1991 2,450 1996 3,900 1992 2,700 1997 4,250 1993 2,800 1998e 4,500 1994 3,100

= 29,450, el número de años, n = 9, entonces la media anual de aforo es de 3,272 CÁLCULO DE TENDENCIAS Las series estadísticas nos sirven para calcular tendencias de incremento o decremento de las variables, mismas que son la base de los escenarios. Por ejemplo, utilizando los datos anteriores: AÑO VEHICULOS TENDENCIA (MILES) (MILES) 2001 2,300 2002 2,450 150 2003 2,700 250 2004 2,800 100 2005 3,100 300 2006 3,450 350 2007 3,900 450 2008 4,250 350 2009 4,500 250

= 2,200, el número de casos, n = 8, entonces la tendencia media anual de incremento del aforo es de 275

Page 18: Guía técnica de estudio de estadística aplicada a la evaluación

TÉCNICAS DE AJUSTE A SERIES DE TIEMPO ASIMÉTRICAS Algunos datos en una serie de tiempo se comportan de una manera irregular, esto es, tienen saltos –altas y bajas—que no se explican teóricamente, por lo que existen técnicas para ajustar la serie de tiempo sin deformar los datos. La técnica más utilizada es la media movil, que implica sustituir los datos reales por la media de cada tres datos en la serie. AÑO VEHICULOS (MILES) MEDIA MOVIL (DE CADA 3) 1998 2,300 1999 2,200 2000 2,500 2,333 (1987, 88, 89) 2001 2,300 2,333 (1988, 89, 90) 2002 2,450 2417 (1989, 90, 91) 2003 2,250 2,333 (1990, 91, 92) 2004 2,800 2,500 (1991, 92, 93) 2005 3,200 2,750 (1992, 93, 94) 2006 3,050 3,017 (1993, 94, 95) 2007 3,900 3,383 (1994, 95, 96) 2008 4,250 3,733 (1995, 96, 97) 2009 4,100 4,083 (1996, 97, 98) Como puede apreciarse, en la serie corregida se perfila una tendencia más simétrica, tendiente a la alza. CORRELACIÓN, REGRESIÓN Y MÍNIMOS CUADRADOS COEFICIENTE "r" DE PEARSON. Para medir la magnitud de la correlación entre dos variables a nivel de intervalo, la prueba "r" es adecuada, ya que sus valores oscilan entre -1 a +1, si la relación entre las variables es inversamente proporcional la correlación sera de 1; mientras si ésta es directamente proporcional, la correlación sera +1. Se mide, con esta prueba, la determinación media de cada elemento de la variable independiente ―x‖ con relación a cada elemento de la variable dependiente, ―y‖ , dando como resultado un índice de correlación.4 Formula:

22]][ YYnXXn

Y)X)((-XY)n(r

222[

Supongamos que nos interesa correlacionar las fallas de mantenimiento en carreteras, captadas a través de los reportes de supervisión y el número de accidentes reportados en ocho meses, la unidad de medida es cientos.

X: Fallas de mantenimiento 8.2 9.6 6.5 7.8 9.0 6.7 8.4 7.4

Y: Accidentes 8.0 9.3 6.6 7.5 8.6 7.0 8.2 7.2

4 Moreno. Op. Cit. p 136 y 81.

Page 19: Guía técnica de estudio de estadística aplicada a la evaluación

Aplicación de la formula: X Y X·Y X2 Y2 8.2 8.0 65.6 67.2 64.0 9.6 9.3 89.3 92.2 86.5 6.5 6.6 42.9 42.3 43.6 7.8 7.5 58.5 60.8 56.3 9.0 8.6 77.4 81.0 74.0 6.7 7.0 46.9 44.9 49.0 8.4 8.2 68.9 70.6 67.2 7.4 7.2 53.3 54.8 51.8

63.6 62.4 502.8 513.8 492.4

98.0])4.62()4.492(8][)6.63()8.513(8[

)4.62)(6.63()8.502(8

2 22r

10. ESCENARIOS Conceptualización: La estadística proyectiva es una herramienta para construir escenarios de prospectiva, el método parte de un punto de referencia en el pasado(To), cuantifica las tendencias de incremento o decremento de las variables al presente (T1) y las proyecta a un futuro dado (T2): T0 T1 T2 T3 TENDENCIA ESCENARIOS A continuación se expone esta conceptualización en la siguiente gráfica. y ^ x = variable independiente * tiempo * * y = variable dependiente * proyección cuantitativa * * To = pasado * * T1 = presente * * T2 = futuro ------------------------> x T's% = tendencias To---->T1----->T2 T's% E's E's = escenarios * = dato histórico Diagnóstico * = dato proyectado Pronóstico

Page 20: Guía técnica de estudio de estadística aplicada a la evaluación

Tipos de proyección: Dependiendo de las características de las variables a proyectar, existen dos tipos de técnicas proyectivas: proyección de variables estadísticamente independientes y proyección de variables estadísticamente correlacionadas a) Proyección de variables estadísticamente independientes

Conceptualización: En la proyección de este tipo de variables se parte del hecho o la suposición fundamentada de que: su comportamiento no está determinado por ninguna otra variable o no se cuenta con información confiable sobre el comportamiento de la posible variable antecedente.

Clasificación: Las técnicas proyectivas de las variables estadísticamente independientes son dos: 1) Proyección simple:

Escenario = ud + x

ud = Ultimo dato de una serie

x = Tendencia media de incremento-decremento de la variable Esta técnica es unilineal, pues el escenario se construye añadiendo la tendencia media de la variable.

Proyección de la Variable ―X·‖ Año Comportamiento Tendencia 2002 1200 2003 1350 150 2004 1300 - 50 2005 1400 100 TENDENCIA MEDIA ANUAL 2006 1450 150

2007 1550 100 x = 71 2008 1500 - 50 2009 1600 100

500/7 = 71 Construcción de escenarios: Año Comportamiento Posible Escenario 2010 1671 2011 1742 2012 1813 2013 1884 2014 1955

Page 21: Guía técnica de estudio de estadística aplicada a la evaluación

2) Proyección con rango: Escenario = ud + ( x ± / v)

Este escenario se conforma por tres componentes:

Límite superior del escenario: ud +( x + / v) Límite Superior

Punto medio del escenario: ud + x Proyección media

Límite inferior del escenario: ud +( x - / v) Límite inferior En donde: ud = ultimo dato de la serie

x = tendencia media de incremento o decremento

= desviación estándar de la serie v = variemus La función del variemus es definir la extensión del rango de ocurrencia del escenario, en relación al valor del coeficiente de variación (CV) de la serie de la variable proyectada: Si el CV. DE 1 A 0, v = 1 Si el CV. DE 2 A 1, v = 2 Si el CV. DE 3 A 2, v = 3 En este sentido, el escenario enuncia que la variable proyectada a futuro (T2), probabilísticamente se ubicara entre un valor mínimo Lm y un valor máximo LM: El rango de probabilidad donde se ubica el escenario de la variable permite contar con un margen de maniobra en la toma de decisiones; esto es, en situaciones de certidumbre, la decisión puede tomarse en relación a su valor máximo; mientras que en caso de riesgo por incertidumbre, la decisión hace referencia al valor mínimo. Proyección de la inversión bruta de capital para los próximos tres años: año i.b.c

(millones) xi x (xi - x ) ( xi – x )2 2003 1450 2004 1600 150 92 58 3364 2005 1880 130 38 1444 2006 2000 120 28 784 2007 2150 150 58 3364 2008 2170 20 - 72 5184 2009 2150 - 20 -112 12544

n = 550 = 26684

x = 550/6 = 91.6 ≈ 92

2 6/26684 = 67

CV= 67/92 = 0.73, v = 1

Page 22: Guía técnica de estudio de estadística aplicada a la evaluación

Escenarios: Año LM PM LM

ud + ( x - /v) ud + x ud + ( x + /v) 10 2150 + 92 - 67= 2175 2150+92 =2242 2150 + 92 + 67 = 2309 11 2242 + 92 - 67= 2267 2242+92 =2334 2242 + 92 + 67 = 2401 12 2334 + 92 - 67= 2359 2334+92 =2426 2234 + 92 + 67 = 2493 Para las variables estadísticamente correlacionadas se utiliza la técnica de mínimos cuadrados, expuesta en el punto anterior. En este caso se parte del supuesto que una variable independiente X determina a una variable dependiente Y, por lo que todo cambio en X, produce un cambio en Y. El método implica: Cálculo del escenario de X, a través de las técnicas de variable estadísticamente independiente. Calculo del escenario de Y, utilizando las técnicas de variables estadísticamente correlacionadas: Si utilizamos los datos de los escenarios de ―X‖ expuestos más arriba y los datos de ―Y‖ presentados en el punto anterior, el cálculo de los escenarios de ―y‖ son: y = a + bx. Tanto ―a‖ como ―b‖ son constantes y lo que cambia es el escenario de x. Habrá de tener en cuenta que los escenarios siempre constituyen hipótesis respecto al comportamiento futuro de una variable, por lo que deberán tratarse de una manera probabilística. 1) Cálculo de "b"

b = [6(2185050) - 13007500] / 6(24550800)-146410000 =0.11

2) Cálculo de "a"

a = [1075 - (0.11)(12100)] / 6 = -42.6

3) Cálculo de "y"

Escenario 1996: y= -42.6 + (0.11)(2242) = 204

Escenario 1997: y= -42.6 + (0.11)(2334) = 214

Escenario 1998: y= -42.6 + (0.11)(2426) = 224

Page 23: Guía técnica de estudio de estadística aplicada a la evaluación

BIBLIOGRAFÍA:

Estadística

Autor Título Edición Editorial Ciudad Año

Hubert, M y Blalok J. Estadística Social 10a Ariel Barcelona 2001

Rojas, Soriano

Guía para realizar investigaciones

sociales

33 Reimp

Plaza y Valdés México 2002

UNAM

Rojas Soriano 11a Plaza y Valdés México 2006