unidad 12 - analisis e interpretacion de datos en la tesis

51
ANÁLISIS DE DATOS Elaborado por: Dr. Alfonso Ramón Chung Pinzás En convenio con:

Upload: miki-jaksic

Post on 15-Jul-2016

53 views

Category:

Documents


5 download

DESCRIPTION

Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

TRANSCRIPT

Page 1: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ANÁLISIS DE DATOS

Elaborado por:

Dr. Alfonso Ramón Chung Pinzás

En convenio con:

Page 2: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ANÁLISIS DE DATOS

• Es el estudio de los datos obtenidos a

fin de dar respuesta al problema

planteado.

• Asimismo importante para aceptar o

rechazar la hipótesis planteada.

Page 3: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ANÁLISIS DE DATOS

• Si bien el tema es muy amplio, se

darán indicaciones generales y se

señalarán los textos de consulta

Page 4: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

OBJETIVOS DEL ANÁLISIS DE DATOS

• Los autores coinciden en los siguientes

objetivos

Page 5: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

OBJETIVOS DEL ANÁLISIS DE DATOS

• Hallar que hay en los datos

• Conocer que tanto varían los datos

• Conocer como están distribuidos los datos

• Conocer que relación existe entre los

datos

• Hacer estimaciones y predicciones

• Describir las diferencias entre grupos y

variables

• Demostrar causalidad

Page 6: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ESCALAS DE MEDICIÓN

• Escala Nominal

• Escala Ordinal

• Escala de Intervalo

• Escala Proporción o

Razón

• Por el valor concreto

Page 7: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ESCALA NOMINAL

• Es la más simple de todas las escalas

• No hace mayor análisis, ni establece

relaciones etc.

• Separa a los datos en clases las cuales

son mutuamente excluyentes.

• Por ejemplo: fumadores y no fumadores,

operarios y operarias etc.

Page 8: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ESCALA ORDINAL

• Es un nivel superior a la nominal.

• Ordinal=Orden, es decir ordena los datos

según un determinado criterio.

• El criterio puede ser de mayor a menor o a

la inversa.

• Es decir según su posición.

• Ejemplo: Muy fumador, medianamente

fumador, poco fumador, no fumador

Page 9: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ESCALA DE INTERVALO

• Permiten también ordenar los datos, pero

adicionalmente se pueden comparar las

distancias entre dos de ellos.

• Estas distancias de preferencia son iguales.

• No considera el cero, es decir la ausencia de la

variable.

• No se pueden establecer proporciones ya que

su función es ordenar, nombrar y mostrar la

igualdad en la magnitud

• Ejemplo: la diferencia entre 25°C y 26°c es la

misma que 45°C y 46°C

Page 10: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ESCALA DE PROPORCIÓN

• Permite realizar las operaciones

anteriores con la escala de intervalo.

• Además permite operaciones adicionales

como la división.

• Considera el cero como ausencia de

variable.

• Ejemplo: el peso de A es 100 kg. Por lo

tanto es el doble de B que pesa 50 kg., el

ingreso del ingeniero de planta es 2000

soles/mes

Page 11: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

POR EL VALOR CONCRETO

• A diferencia de los anteriores, es recoger

los valores de cada individuo de la

muestra o población sin agruparlos.

• Es conveniente recoger los datos de esta

forma al inicio para luego poder

transformarlo a una de las escalas

anteriormente indicadas

Page 12: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

DETERMINACIÓN DE ESCALAS

• La escala se determina según el

estudio a realizar.

• Lo recomendable es tomar

mediciones con una escala superior

para luego poder transformar a una

inferior si es el caso.

• Sin embargo, no se puede

transformar de una inferior a una

superior.

Page 13: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

TRANSFORMACIONES

ESCALA

Por el valor concreto

Proporcional

De intervalo

Ordinal

Nominal

TRANSFORMACIONES

Page 14: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

TRANSFORMACIONES

ESCALA

Por el valor concreto

Proporcional

De intervalo

Ordinal

Nominal

TRANSFORMACIONES

EN ESTE SENTIDO

NO SE PUEDEN

REALIZAR

Page 15: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

PROCEDIMIENTO PARA EL ANÁLISIS DE

DATOS

• Primeramente revisar y depurar los datos

• Luego se describen las características de las

variables de la muestra o población.

• A continuación se realizan las pruebas

adecuadas para la verificación o negación de

las hipótesis respectivas.

• En la sección de resultados van solamente los

hallazgos de la investigación.

• En la sección discusión, se discuten, comentan

etc.

Page 16: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

DISTRIBUCIÓN DE FRECUENCIAS

• Es un procedimiento muy útil para el

ordenamiento de los datos.

• Consta de las siguientes partes:

• Frecuencia absoluta (Fa): número de

veces que se repiten las observaciones en

una determinada categoría

• Frecuencia relativa (Fr): Es la Fa entre el

número de individuos.

Page 17: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

DISTRIBUCIÓN DE FRECUENCIAS

• Porcentaje (P): Es el tanto porciento de

la Fa con respecto al total de las

observaciones.

• Fa acumulada: Es la cantidad acumulada

de Fa

• Fr acumulada: Es el acumulado de Fr

• Porcentaje Acumulado: Es la

acumulación de los porcentajes P

Page 18: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

TIPOS DE ANÁLISIS

• Descriptivo: son aquellos procedimientos

que caracterizan, analizan y describen las

características de los datos estudiados de

una muestra o población.

• Inferencial: son aquellos procedimientos

que a partir de los datos de la muestra,

hacen estimaciones o inducciones hacia la

población.

Page 19: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ANÁLISIS DESCRIPTIVO

• El análisis descriptivo se clasifica en:

Medidas de tendencia central, de

dispersión y otros.

Page 20: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

MEDIDAS DE TENDENCIA CENTRAL

• Estas medidas

muestran el valor

alrededor del cual se

sitúan el resto de

variables.

• Las medidas de

tendencia central más

usadas son: media

aritmética, mediana y

moda.

Page 21: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

MEDIA ARITMÉTICA

• Determina el promedio de las

observaciones y se calcula de la

siguiente forma:

• Xi: Es la observación i

• n: Es el total de observaciones

Page 22: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

LA MEDIANA

• Es aquel valor que divide a la distribución

de datos en dos parte iguales (es decir

50% a 50%).

• También se le conoce como percentil 50.

• Para su determinación, se ordenan los

datos de menor a mayor y si la cantidad

es impar se toma el valor central.

• Cuando la cantidad es par, se toman los

dos valores centrales y de divide entre 2

Page 23: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

LA MODA

• Es el valor que más se repite en una

distribución.

• Cuando hay un solo valor que se repite,

se dice que es una distribución unimodal.

• Cuando hay más de uno por ejemplo dos

o tres, se dice bimodal, trimodal etc.

Page 24: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

MEDIDAS DE DISPERSIÓN O VARIABILIDAD

• Son aquellas que indican las

variaciones o dispersiones de los

datos obtenidos.

• Por lo tanto permiten conocer la

distribución de una variable.

• Las medidas usadas son: Rango o

amplitud, varianza, desviación

estándar o típica y coeficiente de

variación.

Page 25: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

RANGO O AMPLITUD

• Es la diferencia entre el máximo y

mínimo valor de la distribución, es

decir la distancia entre los extremos.

• Esta medida ofrece problemas porque

pueden existir valores atípicos.

• Además no realiza mayor análisis.

Page 26: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

VARIANZA

• Indica la distancia de cada observación

con respecto a la media. Los valores

extremos afectan esta medida

• Se calcula con la siguiente formula:

Page 27: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

DESVIACIÓN ESTÁNDAR

• Expresa también la variabilidad de los

datos, pero en las unidades originales.

• Cuanto más pequeño sea el valor el grupo

será más homogéneo y cuanto más

grande más heterogéneo.

• Se calcula mediante la raíz cuadrada

positiva de la varianza.

• Al igual que en el caso anterior, se ve

afectada por valores extremos

Page 28: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

COEFICIENTE DE VARIACIÓN

• Expresa el porcentaje de la desviación

estándar con respecto a la media.

• Se calcula con la siguiente fórmula:

Page 29: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

OTRAS MEDIDAS DE DESCRIPCIÓN

• Otras medidas de descripción que

también son muy utilizadas son: medidas

de posición y de forma.

Page 30: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

MEDIDAS DE POSICIÓN

• Cuartiles: dividen a la distribución en

tres partes, Q1 deja debajo a una

cuarta parte y el resto encima, Q2 deja

la mitad por debajo y por encima, Q3

deja debajo las 3 cuartas partes y

encima una cuarta parte.

• Deciles y centiles, dividen en diez y

cien partes respectivamente.

Page 31: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

MEDIDAS DE POSICIÓN

• Percentiles: Es el valor que deja

encima y debajo un porcentaje de

observaciones definidas, por ejemplo

el percentil 50 deja la mitad tanto por

arriba como por debajo, el percentil 30

deja 30% por debajo y 70% por

encima

Page 32: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

MEDIDAS DE FORMA

• Son aquellas que proporcionan la forma

en que se distribuyen los datos.

• Estas medidas buscan verificar si la forma

de distribución se asemeja a la

distribución normal o curva de Gauss.

• Las medidas usadas son: Asimetria y

Kurtosis (o Curtosis)

Page 33: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

COEFICIENTE DE ASIMETRIA

• Mide la falta de simetría con respecto a la

curva normal.

• Cuando el valor es cero es simétrica a la

curva normal, un valor negativo indica

sesgo a la izquierda y un valor positivo a

la derecha.

Page 34: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

COEFICIENTE DE ASIMETRIA

• Las formulas de calculo son:

CA= (promedio-moda) / desv. std.

CA= 3 x (promedio-mediana) / desv. std

CA= (Q3 – 2Q2 + Q1) / (Q3 – Q1)

Page 35: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

CARACTERÍSTICAS DE LA CURVA

NORMAL

Page 36: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

KURTOSIS

• También conocida como Curtosis

• Verifica si la forma es estrecha y alta o

ancha y plana con respecto a la curva

normal.

• En el primer caso se dice que es

Leptocúrtica (kurtosis >3) y en el segundo

caso Platicúrtica (kurtosis <3) , cuando la

curva se asemeja a la normal de dice que

es Mesocúrtica (kurtosis=3)

Page 37: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

KURTOSIS

• La Kurtosis se calcula en función al

momento 4 (m4) y momento 2 (m2).

• Su formula es: Kurtosis= m4 / m22

• Para mayor información sobre el calculo

de los momentos consultar el libro:

“Estadística general con énfasis en

muestreo” de José Calzada Benza

Page 38: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ANÁLISIS INFERENCIAL

• Se aplica cuando se utiliza una muestra

en vez de estudiar a la población.

• Esto se debe a que muchas veces la

población es muy grande y sería costoso

estudiarla.

• El análisis inferencial permite caracterizar

a la población y también comprobar las

hipótesis de la investigación, todo esto

mediante los resultados de la muestra.

Page 39: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ERROR ESTANDAR

• Si bien una muestra proporciona

información sobre la población, esta

información esta sujeta a error.

• El error estándar dime la variabilidad entre

las medias de las diferentes muestras.

• Este cálculo se puede hacer considerando

la desviación estándar o el porcentaje

Page 40: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ERROR ESTANDAR

• Las formulas de calculo son:

Page 41: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

INTERVALO DE CONFIANZA

• Calcula el rango en el cual se ubicará la media

de la población.

• Esta calculo esta asociado a una probabilidad.

• Generalmente la probabilidad más utilizada es

95% cuyo valor Z=1,96

• Por lo tanto el intervalo de confianza indica que

con una probabilidad de 95% la media estará

entre el intervalo de confianza

Page 42: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

INTERVALO DE CONFIANZA

• Fórmulas de cálculo:

Page 43: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

HIPÓTESIS ESTADÍSTICAS

• Son suposiciones que se hacen sobre los

parámetros de las poblaciones

• Se distinguen dos tipos: Hipótesis Nula

(H0) e Hipótesis Alternativa (H1 o HA) .

• H0 indica que no hay diferencias entre los

resultados encontrados y si las hubieran,

se deben al azar.

• H1 indica que si hay diferencias y se

acepta cuando se rechaza H0

Page 44: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

HIPÓTESIS ESTADÍSTICAS

• H0 : u=u0 , u1=u2

• H0 : σ=σ0, σ1=σ2

• H1 : u≠u0 , u1≠u2 , lo que implica que

pueden ser mayor o menor.

• H1 : σ ≠ σ0, σ1 ≠ σ2 lo que implica que

pueden ser mayor o menor.

Page 45: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

ERRORES

Page 46: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

PRUEBAS DE HIPÓTESIS

• Cuando se tiene una hipótesis alternativa

la prueba es de una cola, cuando se

tienen dos hipótesis alternativas se dice

que es de dos colas

• Las pruebas pueden ser paramétricas o

no paramétricas.

• Las paramétricas son más confiables pero

suponen que la muestra sigue una

distribución normal

Page 47: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

PRUEBAS DE HIPÓTESIS

• Si se analiza la relación entre dos

variables se llama bivariable y si es de

más se dice multivariable.

• Si hay mediciones en momentos

diferentes, se dice que son medidas

apareadas, en caso contrario datos

independientes.

Page 48: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

PRUEBAS PARAMÉTRICAS

(BIVARIABLE)

• Prueba t de Student

• Análisis de varianza unidireccional

(ANOVA oneway)

• Análisis de varianza factorial (ANOVA)

• Análisis de Covarianza

• Coeficiente de correlación de Pearson

Page 49: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

PRUEBAS NO PARAMÉTRICAS

• Prueba del Chi Cuadrado

• U de Mann-Withney

• Rangos de Wilcoxon

• La prueba de McNemar

• Anova de Krustal Wallis

• Coeficiente de correlación por rangos

ordenados de Spearman y Kendall

• Q de Cochram

Page 50: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

CONSULTAS

• Icart, M., et al. (2000). Elaboración y

Presentación de un Proyecto de

Investigación y una Tesina. Barcelona:

Universidad de Barcelona.

Page 51: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis

Muchas gracias!